FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3481, 1663 aa
1>>>pF1KE3481 1663 - 1663 aa - 1663 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6588+/-0.0013; mu= 21.9735+/- 0.078
mean_var=71.6264+/-14.124, 0's: 0 Z-trim(100.6): 36 B-trim: 33 in 1/49
Lambda= 0.151544
statistics sampled from 6148 (6165) to 6148 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.539), E-opt: 0.2 (0.189), width: 16
Scan time: 5.980
The best scores are: opt bits E(32554)
CCDS32883.1 C3 gene_id:718|Hs108|chr19 (1663) 10950 2404.7 0
CCDS47405.1 C4B gene_id:721|Hs108|chr6 (1744) 1076 245.9 8.9e-64
CCDS59005.1 C4A gene_id:720|Hs108|chr6 (1698) 1057 241.8 1.5e-62
CCDS47404.1 C4A gene_id:720|Hs108|chr6 (1744) 1057 241.8 1.6e-62
CCDS73439.1 A2ML1 gene_id:144568|Hs108|chr12 ( 963) 746 173.6 2.8e-42
CCDS6826.1 C5 gene_id:727|Hs108|chr9 (1676) 674 158.0 2.5e-37
CCDS4982.1 CD109 gene_id:135228|Hs108|chr6 (1445) 673 157.8 2.5e-37
CCDS55039.1 CD109 gene_id:135228|Hs108|chr6 (1368) 614 144.9 1.8e-33
CCDS8600.1 PZP gene_id:5858|Hs108|chr12 (1482) 576 136.6 6.2e-31
CCDS44827.1 A2M gene_id:2|Hs108|chr12 (1474) 542 129.1 1.1e-28
CCDS55038.1 CD109 gene_id:135228|Hs108|chr6 (1428) 515 123.2 6.3e-27
CCDS8596.2 A2ML1 gene_id:144568|Hs108|chr12 (1454) 440 106.8 5.5e-22
>>CCDS32883.1 C3 gene_id:718|Hs108|chr19 (1663 aa)
initn: 10950 init1: 10950 opt: 10950 Z-score: 12925.7 bits: 2404.7 E(32554): 0
Smith-Waterman score: 10950; 100.0% identity (100.0% similar) in 1663 aa overlap (1-1663:1-1663)
10 20 30 40 50 60
pF1KE3 MGPTSGPSLLLLLLTHLPLALGSPMYSIITPNILRLESEETMVLEAHDAQGDVPVTVTVH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MGPTSGPSLLLLLLTHLPLALGSPMYSIITPNILRLESEETMVLEAHDAQGDVPVTVTVH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 DFPGKKLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQVVEKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DFPGKKLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQVVEKV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 VLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTVMVNIENPEGIPVKQDSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTVMVNIENPEGIPVKQDSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 SSQNQLGVLPLSWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSFEVIVEPTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SSQNQLGVLPLSWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSFEVIVEPTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 KFYYIYNEKGLEVTITARFLYGKKVEGTAFVIFGIQDGEQRISLPESLKRIPIEDGSGEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KFYYIYNEKGLEVTITARFLYGKKVEGTAFVIFGIQDGEQRISLPESLKRIPIEDGSGEV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 VLSRKVLLDGVQNPRAEDLVGKSLYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VLSRKVLLDGVQNPRAEDLVGKSLYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 PKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPSQKPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPSQKPL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 SITVRTKKQELSEAEQATRTMQALPYSTVGNSNNYLHLSVLRTELRPGETLNVNFLLRMD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SITVRTKKQELSEAEQATRTMQALPYSTVGNSNNYLHLSVLRTELRPGETLNVNFLLRMD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 RAHEAKIRYYTYLIMNKGRLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RAHEAKIRYYTYLIMNKGRLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 SGQREVVADSVWVDVKDSCVGSLVVKSGQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SGQREVVADSVWVDVKDSCVGSLVVKSGQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 GVFVLNKKNKLTQSKIWDVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GVFVLNKKNKLTQSKIWDVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAEL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 QCPQPAARRRRSVQLTEKRMDKVGKYPKELRKCCEDGMRENPMRFSCQRRTRFISLGEAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QCPQPAARRRRSVQLTEKRMDKVGKYPKELRKCCEDGMRENPMRFSCQRRTRFISLGEAC
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 KKVFLDCCNYITELRRQHARASHLGLARSNLDEDIIAEENIVSRSEFPESWLWNVEDLKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KKVFLDCCNYITELRRQHARASHLGLARSNLDEDIIAEENIVSRSEFPESWLWNVEDLKE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 PPKNGISTKLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PPKNGISTKLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 RNEQVEIRAVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RNEQVEIRAVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVI
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 VPLKTGLQEVEVKAAVYHHFISDGVRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VPLKTGLQEVEVKAAVYHHFISDGVRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 DIPPADLSDQVPDTESETRILLQGTPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DIPPADLSDQVPDTESETRILLQGTPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTP
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 TVIAVHYLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TVIAVHYLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 YVVKVFSLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 YVVKVFSLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKD
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 MALTAFVLISLQEAKDICEEQVNSLPGSITKAGDFLEANYMNLQRSYTVAIAGYALAQMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MALTAFVLISLQEAKDICEEQVNSLPGSITKAGDFLEANYMNLQRSYTVAIAGYALAQMG
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 RLKGPLLNKFLTTAKDKNRWEDPGKQLYNVEATSYALLALLQLKDFDFVPPVVRWLNEQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RLKGPLLNKFLTTAKDKNRWEDPGKQLYNVEATSYALLALLQLKDFDFVPPVVRWLNEQR
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 YYGGGYGSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSRSSKITHRIHWESASLLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 YYGGGYGSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSRSSKITHRIHWESASLLR
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 SEETKENEGFTVTAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVTIKPAPETEKRPQDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SEETKENEGFTVTAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVTIKPAPETEKRPQDA
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 KNTMILEICTRYRGDQDATMSILDISMMTGFAPDTDDLKQLANGVDRYISKYELDKAFSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KNTMILEICTRYRGDQDATMSILDISMMTGFAPDTDDLKQLANGVDRYISKYELDKAFSD
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 RNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEESCTRFYHPEKEDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEESCTRFYHPEKEDG
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 KLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVYKTRLVKVQLSNDFDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVYKTRLVKVQLSNDFDE
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE3 YIMAIEQTIKSGSDEVQVGQQRTFISPIKCREALKLEEKKHYLMWGLSSDFWGEKPNLSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 YIMAIEQTIKSGSDEVQVGQQRTFISPIKCREALKLEEKKHYLMWGLSSDFWGEKPNLSY
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660
pF1KE3 IIGKDTWVEHWPEEDECQDEENQKQCQDLGAFTESMVVFGCPN
:::::::::::::::::::::::::::::::::::::::::::
CCDS32 IIGKDTWVEHWPEEDECQDEENQKQCQDLGAFTESMVVFGCPN
1630 1640 1650 1660
>>CCDS47405.1 C4B gene_id:721|Hs108|chr6 (1744 aa)
initn: 1458 init1: 298 opt: 1076 Z-score: 1258.5 bits: 245.9 E(32554): 8.9e-64
Smith-Waterman score: 2289; 31.0% identity (61.5% similar) in 1606 aa overlap (121-1607:132-1688)
100 110 120 130 140 150
pF1KE3 PANREFKSEKGRNKFVTVQATFGTQVVEKVVLVSLQSGYLFIQTDKTIYTPGSTVLYRIF
.: : . :.::.:::. ::.::. : ::.:
CCDS47 LLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVF
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE3 TVNHKLLPVGRTVMVNIENPEGIPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYY
....:. : :. : .:: .:. :.. . . ... .. ::.. . : ::: : .
CCDS47 ALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPS--SIFQDDFVIPDISEPGTWKISARF
170 180 190 200 210
220 230 240 250 260
pF1KE3 ENSPQQVFSTEFEVKEYVLPSFEVIVEPTEKFYYIYNEKG----LEVTITARFLYGKKVE
.. .. ::.::::.::::.::: . : . :: . : ... : ::..::: :.
CCDS47 SDGLESNSSTQFEVKKYVLPNFEVKITPGKP--YILTVPGHLDEMQLDIQARYIYGKPVQ
220 230 240 250 260 270
270 280 290 300 310 320
pF1KE3 GTAFVIFGIQDGEQRISLPESLK-RIPIEDGSGEVVLSRKVLLDGVQ--NPRAEDLVGKS
:.:.: ::. : . . .. ..:. . . .:.... ::. . :... : :: :
CCDS47 GVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLR
280 290 300 310 320 330
330 340 350 360 370 380
pF1KE3 LYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSP
:::.:..: :..: .:: .. .:.::... ..:: ... :: :: :...: . .:::
CCDS47 LYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSP
340 350 360 370 380 390
390 400 410 420 430 440
pF1KE3 AYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPS-QKPLSITVRTKKQELSEAEQATRTMQ
: .:: :.. ::.: . : .. :: : : . : . .::. . .:
CCDS47 ASGIPVKVSA--TVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHP
400 410 420 430 440 450
450 460 470 480 490
pF1KE3 ALPYSTVGN--SNNYLHLSVLRTELRP---GETLNVNFLLRMDRAHEAKIRYYTYLIMNK
:. ::. :.. ::. : . :: :.:::.: :: . : . .: :.:...
CCDS47 AIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLN--LRA-VGSGATFSHYYYMILSR
460 470 480 490 500 510
500 510 520 530 540 550
pF1KE3 GRLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVK-
:... . ::: . :. . . . . ::: .::.: :.. : :.:. :::.
CCDS47 GQIVFMN---REPKRTLTSVSVFVDHHLAPSFYFVAFYY----HGDHPV-ANSLRVDVQA
520 530 540 550 560
560 570 580 590 600 610
pF1KE3 DSCVGSLVVK-SGQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDKGVFVLNKKNK--LTQ
.: :.: .. .: .. :. :... :..: : : :.: :.: .... ..:.. :..
CCDS47 GACEGKLELSVDGAKQYRN---GESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNM
570 580 590 600 610 620
620 630 640 650 660 670
pF1KE3 SKIWDVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQP-AARRRRS
.:....... :.:: ::.: . ::. :::.: :.. : : .: .:.::. ..:..:.
CCDS47 GKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAF-SDGDQWTLSRKRLSCPKEKTTRKKRN
630 640 650 660 670 680
680 690 700 710 720 730
pF1KE3 VQLTEKRMDKVGKYPKEL-RKCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYI
:.. . .:.:.: . ..::.::. . :: ::..:. .. . :.. ::.::..
CCDS47 VNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPD-CREPFLSCCQFA
690 700 710 720 730
740 750 760 770 780
pF1KE3 TELRRQHARASHLGLARSN---LDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGIST
::.. .. :: :. .::.: :..: :: :::.::: :: . .
CCDS47 ESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDR-------F
740 750 760 770 780 790
790 800 810 820 830 840
pF1KE3 KLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVVRNEQVEIR
......: ::.::::: ..:.: ::.::: : .. :...: . ::::.:: : ::.:.:
CCDS47 QILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELR
800 810 820 830 840 850
850 860 870 880 890 900
pF1KE3 AVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQ
::::: ...: : :.. ..: :: :: : .: :. : . .:: :.
CCDS47 PVLYNY-LDKNLTVSVHVSPVEGLC-LAGGGGLAQQ-VLVPAGSARPVAFSVVP--TAAT
860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EVEVKAAVYHHF---ISDGVRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPA
: .:... : ..:.: : :.. :: ... : :.: : ..: . .::
CCDS47 AVSLKVVARGSFEFPVGDAVSKVLQIEKEGA-IHREELVYELNP--LDHRG-RTLEIPGN
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 DLSDQVPDTESETRILLQGT-PVAQM-TEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVI
. ...:: . .. . . .. :. . .: :.. . :. : :::::.:: ..::.
CCDS47 SDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLA
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 AVHYLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTAYVV
: .:::.:::: . : .. :..::.::: . ::. ....::...:. ::::::.:.
CCDS47 ASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRGSSTWLTAFVL
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 KVFSLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMAL
::.::: . .. . . : . .:: : .:. :: ::. .::::. : ::: .:.: .::
CCDS47 KVLSLAQEQVGGSPEKLQETSNWL-LSQQQADGSFQDLSPVIHRSMQGGLVGNDET-VAL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190
pF1KE3 TAFVLISLQEAKDICEEQ-----VNSLPGSITKAGDFL-EANYMNLQRSYTVAIAGYALA
:::: :.:... . ... . . .::.::..:: : .: ....::..:::.
CCDS47 TAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALT
1150 1160 1170 1180 1190 1200
1200 1210 1220
pF1KE3 QM---GRLKGPLLNKFLTTAK---DKNRW--------------------EDPGKQLYN--
. :.: :.... :. :. : :: :
CCDS47 LTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALW
1210 1220 1230 1240 1250 1260
1230 1240 1250 1260 1270 1280
pF1KE3 VEATSYALLALLQLKD-FDFVPPVVRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPD
.:.:.:::: :: . ... .. ::..: . ::. ::: : ....::. : .
CCDS47 IETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHT
1270 1280 1290 1300 1310 1320
1290 1300 1310 1320 1330 1340
pF1KE3 HQELNLDVSLQLPSRSSKITHRIHWESASLLRS--EETKENEGFTVTAE--GKGQGTLSV
.: .:.:.:. .:.. .: .. .. .. :. :: . . : .... :...:::.:
CCDS47 TEERGLNVTLSSTGRNGFKSHALQLNNRQI-RGLEEELQFSLGSKINVKVGGNSKGTLKV
1330 1340 1350 1360 1370 1380
1350 1360 1370
pF1KE3 VTMYHAKAKDQLTCNKFDLKVTIK---------------------PA---PETEKRP---
. :.. . ::. ....::.: :: :.. .:
CCDS47 LRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTP
1390 1400 1410 1420 1430 1440
1380 1390 1400 1410
pF1KE3 -------------------QDAKNTMILEICTRYRGDQDAT-MSILDISMMTGFAPDTDD
.. .. . .: : . :.: :.....:: :
CCDS47 LQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD
1450 1460 1470 1480 1490 1500
1420 1430 1440 1450 1460 1470
pF1KE3 LKQLANGVDRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAV
:..:.. :::.:..: . ...:.:.: :.. :..:.. : : :.::...
CCDS47 LEKLTSLSDRYVSHFETEGPH-----VLLYFDSVPTSRE-CVGFEAVQEVPVGLVQPASA
1510 1520 1530 1540 1550
1480 1490 1500 1510 1520 1530
pF1KE3 KVYAYYNLEESCTRFYHPEKEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEE----RL
.: ::: :. :. :: ... : :: :.:.::: .: :. . :.. :.
CCDS47 TLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRM
1560 1570 1580 1590 1600 1610
1540 1550 1560 1570 1580 1590
pF1KE3 DKACE-PGVDYVYKTRLVKVQLSNDFDEYIMAIEQTIKSGSD-EVQVGQQRTFISPIKCR
:: : :.: ....... . : . : :... .: .. ..:.:.:. .::
CCDS47 KFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHFTKDVKAAANQMRNFLVRASCR
1620 1630 1640 1650 1660 1670
1600 1610 1620 1630 1640 1650
pF1KE3 EALKLEEKKHYLMWGLSSDFWGEKPNLSYIIGKDTWVEHWPEEDECQDEENQKQCQDLGA
:.:: :.::. ::
CCDS47 --LRLEPGKEYLIMGLDGATYDLEGHPQYLLDSNSWIEEMPSERLCRSTRQRAACAQLND
1680 1690 1700 1710 1720 1730
>>CCDS59005.1 C4A gene_id:720|Hs108|chr6 (1698 aa)
initn: 1443 init1: 296 opt: 1057 Z-score: 1236.2 bits: 241.8 E(32554): 1.5e-62
Smith-Waterman score: 2355; 31.1% identity (62.5% similar) in 1607 aa overlap (121-1654:132-1689)
100 110 120 130 140 150
pF1KE3 PANREFKSEKGRNKFVTVQATFGTQVVEKVVLVSLQSGYLFIQTDKTIYTPGSTVLYRIF
.: : . :.::.:::. ::.::. : ::.:
CCDS59 LLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVF
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE3 TVNHKLLPVGRTVMVNIENPEGIPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYY
....:. : :. : .:: .:. :.. . .. .. .. ::.. . : ::: : .
CCDS59 ALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSS--IFQDDFVIPDISEPGTWKISARF
170 180 190 200 210
220 230 240 250 260
pF1KE3 ENSPQQVFSTEFEVKEYVLPSFEVIVEPTEKFYYIYNEKG----LEVTITARFLYGKKVE
.. .. ::.::::.::::.::: . : . :: . : ... : ::..::: :.
CCDS59 SDGLESNSSTQFEVKKYVLPNFEVKITPGKP--YILTVPGHLDEMQLDIQARYIYGKPVQ
220 230 240 250 260 270
270 280 290 300 310 320
pF1KE3 GTAFVIFGIQDGEQRISLPESLK-RIPIEDGSGEVVLSRKVLLDGVQ--NPRAEDLVGKS
:.:.: ::. : . . .. ..:. . . .:.... ::. . :... : :: :
CCDS59 GVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLR
280 290 300 310 320 330
330 340 350 360 370 380
pF1KE3 LYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSP
:::.:..: :..: .:: .. .:.::... ..:: ... :: :: :...: . .:::
CCDS59 LYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSP
340 350 360 370 380 390
390 400 410 420 430 440
pF1KE3 AYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPS-QKPLSITVRTKKQELSEAEQATRTMQ
: .:: :.. ::.: . : .. :: : : . : . .::. . .:
CCDS59 ASGIPVKVSA--TVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHP
400 410 420 430 440 450
450 460 470 480 490
pF1KE3 ALPYSTVGN--SNNYLHLSVLRTELRP---GETLNVNFLLRMDRAHEAKIRYYTYLIMNK
:. ::. :.. ::. : . :: :.:::.: :: . : . .: :.:...
CCDS59 AIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLN--LRA-VGSGATFSHYYYMILSR
460 470 480 490 500 510
500 510 520 530 540 550
pF1KE3 GRLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVK-
:... .: :: . :. . . . . ::: .::.: :.. : :.:. :::.
CCDS59 GQIVFMNR---EPKRTLTSVSVFVDHHLAPSFYFVAFY----YHGDHPV-ANSLRVDVQA
520 530 540 550 560
560 570 580 590 600 610
pF1KE3 DSCVGSLVVK-SGQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDKGVFVLNKKNK--LTQ
.: :.: .. .: .. :. :... :..: : : :.: :.: .... ..:.. :..
CCDS59 GACEGKLELSVDGAKQYRN---GESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNM
570 580 590 600 610 620
620 630 640 650 660 670
pF1KE3 SKIWDVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQP-AARRRRS
.:....... :.:: ::.: . ::. :::.: :.. : : .: .:.::. ..:..:.
CCDS59 GKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAF-SDGDQWTLSRKRLSCPKEKTTRKKRN
630 640 650 660 670 680
680 690 700 710 720 730
pF1KE3 VQLTEKRMDKVGKYPKEL-RKCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYI
:.. . .:.:.: . ..::.::. . :: ::..:. .. . :.. ::.::..
CCDS59 VNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPD-CREPFLSCCQFA
690 700 710 720 730
740 750 760 770 780
pF1KE3 TELRRQHARASHLGLARSN---LDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGIST
::.. .. :: :. .::.: :..: :: :::.::: :: . .
CCDS59 ESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDR-------F
740 750 760 770 780 790
790 800 810 820 830 840
pF1KE3 KLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVVRNEQVEIR
......: ::.::::: ..:.: ::.::: : .. :...: . ::::.:: : ::.:.:
CCDS59 QILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELR
800 810 820 830 840 850
850 860 870 880 890 900
pF1KE3 AVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQ
::::: ...: : :.. ..: :: :: : .: :. : . .:: ..
CCDS59 PVLYNY-LDKNLTVSVHVSPVEGLC-LAGGGGLAQQ-VLVPAGSARPVAFSVVPTAAAAV
860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EVEVKAAVYHHF-ISDGVRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPADL
..: : .: ..:.: : :.. :: ... : :.: : ..: . .:: .
CCDS59 SLKVVARGSFEFPVGDAVSKVLQIEKEGA-IHREELVYELNP--LDHRG-RTLEIPGNSD
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 SDQVPDTESETRILLQGT-PVAQM-TEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAV
...:: . .. . . .. :. . .: :.. . :. : :::::.:: ..::. :
CCDS59 PNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAAS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 HYLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTAYVVKV
.:::.:::: . : .. :..::.::: . ::. ....::...: ::::::.:.::
CCDS59 RYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKV
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 FSLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTA
.::: . .. . . : . .:: : .:. :: ::. ::. . : ::: .:.: .::::
CCDS59 LSLAQEQVGGSPEKLQETSNWL-LSQQQADGSFQDPCPVLDRSMQGGLVGNDET-VALTA
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190
pF1KE3 FVLISLQEAKDICEEQ-----VNSLPGSITKAGDFL-EANYMNLQRSYTVAIAGYALAQM
:: :.:... . ... . . .::.::..:: : .: ....::..:::.
CCDS59 FVTIALHHGLAVFQDEGAEPLKQRVEASISKANSFLGEKASAGLLGAHAAAITAYALTLT
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230
pF1KE3 GR---LKGPLLNKFLTTAK---DKNRW--------------------EDPGKQLYN--VE
: : :.... :. :. : :: : .:
CCDS59 KAPVDLLGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIE
1210 1220 1230 1240 1250 1260
1240 1250 1260 1270 1280 1290
pF1KE3 ATSYALLALLQLKD-FDFVPPVVRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPDHQ
.:.:::: :: . ... . ::..: . ::. ::: : ....::. : . .
CCDS59 TTAYALLHLLLHEGKAEMADQASAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTE
1270 1280 1290 1300 1310 1320
1300 1310 1320 1330 1340
pF1KE3 ELNLDVSLQLPSRSSKITHRIHWESASLLRS--EETKENEGFTVTAE--GKGQGTLSVVT
: .:.:.:. .:.. .: .. .. .. :. :: . . : .... :...:::.:.
CCDS59 ERGLNVTLSSTGRNGFKSHALQLNNRQI-RGLEEELQFSLGSKINVKVGGNSKGTLKVLR
1330 1340 1350 1360 1370 1380
1350 1360 1370 1380 1390 1400
pF1KE3 MYHAKAKDQLTCNKFDLKVTIKPAPE-TEKRPQDAKNTMILEICTRYRGDQDATMS-ILD
:.. . ::. ....::.: : : . .: .. :. .. : :: .. .
CCDS59 TYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAK--DDPDAPLQPVTP
1390 1400 1410 1420 1430 1440
1410 1420 1430 1440 1450 1460
pF1KE3 ISMMTGFAPDTD-DLKQLANGVDRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKV
.... : . .:.. :::.:..: . ...:.:.: :.. :..:..
CCDS59 LQLFEGRRNRRRREAPKLTSLSDRYVSHFETEGPH-----VLLYFDSVPTSRE-CVGFEA
1450 1460 1470 1480 1490
1470 1480 1490 1500 1510 1520
pF1KE3 HQYFNVELIQPGAVKVYAYYNLEESCTRFYHPEKEDGKLNKLCRDELCRCAEENCFIQKS
: : :.::... .: ::: :. :. :: ... : :: :.:.::: .: :.
CCDS59 VQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR
1500 1510 1520 1530 1540 1550
1530 1540 1550 1560 1570
pF1KE3 DDKVTLEE----RLDKACE-PGVDYVYKTRLVKVQLSNDFDEYIMAIEQTIKSGSD-EVQ
. :.. :. :: : :.: ....... . : . : :... .: ..
CCDS59 ALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHFTKDVKAA
1560 1570 1580 1590 1600 1610
1580 1590 1600 1610 1620 1630
pF1KE3 VGQQRTFISPIKCREALKLEEKKHYLMWGLSSDFWGEKPNLSYIIGKDTWVEHWPEEDEC
..:.:.:. .:: :.:: :.::. ::.. . . . .:.. ...:.:. : : :
CCDS59 ANQMRNFLVRASCR--LRLEPGKEYLIMGLDGATYDLEGHPQYLLDSNSWIEEMPSERLC
1620 1630 1640 1650 1660 1670
1640 1650 1660
pF1KE3 QDEENQKQCQDLGAFTESMVVFGCPN
.. ... : .:. : .
CCDS59 RSTRQRAACAQLNDFLQEYGTQGCQV
1680 1690
>>CCDS47404.1 C4A gene_id:720|Hs108|chr6 (1744 aa)
initn: 1443 init1: 296 opt: 1057 Z-score: 1236.0 bits: 241.8 E(32554): 1.6e-62
Smith-Waterman score: 2266; 30.9% identity (61.2% similar) in 1604 aa overlap (121-1607:132-1688)
100 110 120 130 140 150
pF1KE3 PANREFKSEKGRNKFVTVQATFGTQVVEKVVLVSLQSGYLFIQTDKTIYTPGSTVLYRIF
.: : . :.::.:::. ::.::. : ::.:
CCDS47 LLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVF
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE3 TVNHKLLPVGRTVMVNIENPEGIPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYY
....:. : :. : .:: .:. :.. . . ... .. ::.. . : ::: : .
CCDS47 ALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPS--SIFQDDFVIPDISEPGTWKISARF
170 180 190 200 210
220 230 240 250 260
pF1KE3 ENSPQQVFSTEFEVKEYVLPSFEVIVEPTEKFYYIYNEKG----LEVTITARFLYGKKVE
.. .. ::.::::.::::.::: . : . :: . : ... : ::..::: :.
CCDS47 SDGLESNSSTQFEVKKYVLPNFEVKITPGKP--YILTVPGHLDEMQLDIQARYIYGKPVQ
220 230 240 250 260 270
270 280 290 300 310 320
pF1KE3 GTAFVIFGIQDGEQRISLPESLK-RIPIEDGSGEVVLSRKVLLDGVQ--NPRAEDLVGKS
:.:.: ::. : . . .. ..:. . . .:.... ::. . :... : :: :
CCDS47 GVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLR
280 290 300 310 320 330
330 340 350 360 370 380
pF1KE3 LYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSP
:::.:..: :..: .:: .. .:.::... ..:: ... :: :: :...: . .:::
CCDS47 LYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSP
340 350 360 370 380 390
390 400 410 420 430 440
pF1KE3 AYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPS-QKPLSITVRTKKQELSEAEQATRTMQ
: .:: :.. ::.: . : .. :: : : . : . .::. . .:
CCDS47 ASGIPVKVSA--TVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHP
400 410 420 430 440 450
450 460 470 480 490
pF1KE3 ALPYSTVGN--SNNYLHLSVLRTELRP---GETLNVNFLLRMDRAHEAKIRYYTYLIMNK
:. ::. :.. ::. : . :: :.:::.: :: . : . .: :.:...
CCDS47 AIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLN--LRA-VGSGATFSHYYYMILSR
460 470 480 490 500 510
500 510 520 530 540 550
pF1KE3 GRLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVK-
:... . ::: . :. . . . . ::: .::.: :.. : :.:. :::.
CCDS47 GQIVFMN---REPKRTLTSVSVFVDHHLAPSFYFVAFYY----HGDHPV-ANSLRVDVQA
520 530 540 550 560
560 570 580 590 600 610
pF1KE3 DSCVGSLVVK-SGQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDKGVFVLNKKNK--LTQ
.: :.: .. .: .. :. :... :..: : : :.: :.: .... ..:.. :..
CCDS47 GACEGKLELSVDGAKQYRN---GESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNM
570 580 590 600 610 620
620 630 640 650 660 670
pF1KE3 SKIWDVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQP-AARRRRS
.:....... :.:: ::.: . ::. :::.: :.. : : .: .:.::. ..:..:.
CCDS47 GKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAF-SDGDQWTLSRKRLSCPKEKTTRKKRN
630 640 650 660 670 680
680 690 700 710 720 730
pF1KE3 VQLTEKRMDKVGKYPKEL-RKCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYI
:.. . .:.:.: . ..::.::. . :: ::..:. .. . :.. ::.::..
CCDS47 VNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPD-CREPFLSCCQFA
690 700 710 720 730
740 750 760 770 780
pF1KE3 TELRRQHARASHLGLARSN---LDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGIST
::.. .. :: :. .::.: :..: :: :::.::: :: . .
CCDS47 ESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDR-------F
740 750 760 770 780 790
790 800 810 820 830 840
pF1KE3 KLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVVRNEQVEIR
......: ::.::::: ..:.: ::.::: : .. :...: . ::::.:: : ::.:.:
CCDS47 QILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELR
800 810 820 830 840 850
850 860 870 880 890 900
pF1KE3 AVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQ
::::: ...: : :.. ..: :: :: : .: :. : . .:: ..
CCDS47 PVLYNY-LDKNLTVSVHVSPVEGLC-LAGGGGLAQQ-VLVPAGSARPVAFSVVPTAAAAV
860 870 880 890 900
910 920 930 940 950 960
pF1KE3 EVEVKAAVYHHF-ISDGVRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPADL
..: : .: ..:.: : :.. :: ... : :.: : ..: . .:: .
CCDS47 SLKVVARGSFEFPVGDAVSKVLQIEKEGA-IHREELVYELNP--LDHRG-RTLEIPGNSD
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 SDQVPDTESETRILLQGT-PVAQM-TEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAV
...:: . .. . . .. :. . .: :.. . :. : :::::.:: ..::. :
CCDS47 PNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAAS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 HYLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTAYVVKV
.:::.:::: . : .. :..::.::: . ::. ....::...: ::::::.:.::
CCDS47 RYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKV
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 FSLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTA
.::: . .. . . : . .:: : .:. :: ::. ::. . : ::: .:.: .::::
CCDS47 LSLAQEQVGGSPEKLQETSNWL-LSQQQADGSFQDPCPVLDRSMQGGLVGNDET-VALTA
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190
pF1KE3 FVLISLQEAKDICEEQ-----VNSLPGSITKAGDFL-EANYMNLQRSYTVAIAGYALAQM
:: :.:... . ... . . .::.::..:: : .: ....::..:::.
CCDS47 FVTIALHHGLAVFQDEGAEPLKQRVEASISKANSFLGEKASAGLLGAHAAAITAYALTLT
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230
pF1KE3 GR---LKGPLLNKFLTTAK---DKNRW--------------------EDPGKQLYN--VE
: : :.... :. :. : :: : .:
CCDS47 KAPVDLLGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIE
1210 1220 1230 1240 1250 1260
1240 1250 1260 1270 1280 1290
pF1KE3 ATSYALLALLQLKD-FDFVPPVVRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPDHQ
.:.:::: :: . ... . ::..: . ::. ::: : ....::. : . .
CCDS47 TTAYALLHLLLHEGKAEMADQASAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTE
1270 1280 1290 1300 1310 1320
1300 1310 1320 1330 1340
pF1KE3 ELNLDVSLQLPSRSSKITHRIHWESASLLRS--EETKENEGFTVTAE--GKGQGTLSVVT
: .:.:.:. .:.. .: .. .. .. :. :: . . : .... :...:::.:.
CCDS47 ERGLNVTLSSTGRNGFKSHALQLNNRQI-RGLEEELQFSLGSKINVKVGGNSKGTLKVLR
1330 1340 1350 1360 1370 1380
1350 1360 1370
pF1KE3 MYHAKAKDQLTCNKFDLKVTIK---------------------PA---PETEKRP-----
:.. . ::. ....::.: :: :.. .:
CCDS47 TYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQ
1390 1400 1410 1420 1430 1440
1380 1390 1400 1410
pF1KE3 -----------------QDAKNTMILEICTRYRGDQDAT-MSILDISMMTGFAPDTDDLK
.. .. . .: : . :.: :.....:: ::.
CCDS47 LFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLE
1450 1460 1470 1480 1490 1500
1420 1430 1440 1450 1460 1470
pF1KE3 QLANGVDRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKV
.:.. :::.:..: . ...:.:.: :.. :..:.. : : :.::... .
CCDS47 KLTSLSDRYVSHFETEGPH-----VLLYFDSVPTSRE-CVGFEAVQEVPVGLVQPASATL
1510 1520 1530 1540 1550
1480 1490 1500 1510 1520 1530
pF1KE3 YAYYNLEESCTRFYHPEKEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEE----RLDK
: ::: :. :. :: ... : :: :.:.::: .: :. . :.. :.
CCDS47 YDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKF
1560 1570 1580 1590 1600 1610
1540 1550 1560 1570 1580 1590
pF1KE3 ACE-PGVDYVYKTRLVKVQLSNDFDEYIMAIEQTIKSGSD-EVQVGQQRTFISPIKCREA
:: : :.: ....... . : . : :... .: .. ..:.:.:. .::
CCDS47 ACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHFTKDVKAAANQMRNFLVRASCR--
1620 1630 1640 1650 1660 1670
1600 1610 1620 1630 1640 1650
pF1KE3 LKLEEKKHYLMWGLSSDFWGEKPNLSYIIGKDTWVEHWPEEDECQDEENQKQCQDLGAFT
:.:: :.::. ::
CCDS47 LRLEPGKEYLIMGLDGATYDLEGHPQYLLDSNSWIEEMPSERLCRSTRQRAACAQLNDFL
1680 1690 1700 1710 1720 1730
>>CCDS73439.1 A2ML1 gene_id:144568|Hs108|chr12 (963 aa)
initn: 489 init1: 110 opt: 746 Z-score: 872.5 bits: 173.6 E(32554): 2.8e-42
Smith-Waterman score: 840; 25.7% identity (54.7% similar) in 1044 aa overlap (493-1490:1-955)
470 480 490 500 510
pF1KE3 TELRPGETLNVNFLLRMDRAHEAKIRYYTYLIMNKGRLLKAGRQ---VREPG-QDLVVLP
....:: :. :.. .. : . :
CCDS73 MLIGKGSLVMEGQKHLNSKKKGLKASFSLS
10 20 30
520 530 540 550 560 570
pF1KE3 LSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVKDSCVGSLVVKSGQSEDRQPVPG
:..:. . :. :: : : :: ::::.. .: . : . : . : : ..: .::
CCDS73 LTFTSRLAPDPSLVIY--AIFPSGG--VVADKIQFSV-EMCFDNQV-SLGFSPSQQ-LPG
40 50 60 70 80
580 590 600 610 620 630
pF1KE3 QQMTLKIEGDHGARVVLVAVDKGVFVLNKKNKLTQSKIWDVVEKADIGCTPGSGKDYAGV
.. :.... :. .: :::..:..: .:.. ... :.
CCDS73 AEVELQLQAAPGSLCALRAVDESVLLLRPDRELSNRSVY-------------------GM
90 100 110 120
640 650 660 670 680 690
pF1KE3 FSDAGLTFTSSSGQQTAQRAEL-QCPQPAARRRRSVQLTEKRMDKVGKYPKELRKCC-ED
: : :. : :: ::: . .. . .: . . . :. .
CCDS73 FP-----FWY--GHYPYQVAEYDQCPVSGPW-----DFPQPLIDPMPQGHSSQRSIIWRP
130 140 150 160 170
700 710 720 730 740 750
pF1KE3 GMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYITELRRQHARASHLGLARSNLDEDII
.. :. :: : . . :..: : .:: . : . .. : .
CCDS73 SFSEGTDLFSFFRDVGLKILSNAKIKKPVDCSHRSPEYSTAMGAGGGHPEAFESSTPLHQ
180 190 200 210 220 230
760 770 780 790 800 810
pF1KE3 AEENIVSRSEFPESWLWNVEDLKEPPKNGISTKLMNIFLKDSITTWEILAVSMSDKKGIC
::.. : :. :::.:::.. . . :... .. . :.:: :. .. :...:.
CCDS73 AEDSQV-RQYFPETWLWDLFPIGNSGKEAV-----HVTVPDAITEWKAMSFCTSQSRGFG
240 250 260 270 280
820 830 840 850 860 870
pF1KE3 VADPFEVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNYRQNQELKVRVELLHNPAF----
.. .:... ::.:: :::::::.:. .. :...:: .. ..:...: .. .
CCDS73 LSPTVGLTAFKPFFVDLTLPYSVVRGESFRLTATIFNYLKDC-IRVQTDLAKSHEYQLES
290 300 310 320 330 340
880 890 900 910 920
pF1KE3 --------CSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQEVEVKAAVYHHFISDG
: : . :. ..: . .. : .. :. : .. ::
CCDS73 WADSQTSSCLCADDAKTHHWNITAVKLGHINFTISTKILDSNEPCGGQKGFVPQKGRSDT
350 360 370 380 390 400
930 940 950 960 970 980
pF1KE3 VRKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPADLSDQVPDTESETRILLQG
. : . : :::. ..:: . ... :.:. : :.:. :::. ... . . :
CCDS73 LIKPVLVKPEGVLVEKTHSSLLCPKGKVASESVSLEL--PVDI---VPDS-TKAYVTVLG
410 420 430 440 450
990 1000 1010 1020 1030 1040
pF1KE3 TPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAVHYLDETEQWEKFGL---EK
.. .. : :. :::::::::. ..: . ...:: :: :: :
CCDS73 DIMGTALQN------LDGLVQMPSGCGEQNMVLFAPIIYVLQYL------EKAGLLTEEI
460 470 480 490 500
1050 1060 1070 1080 1090
pF1KE3 RQGALELIKKGYTQQLAFRQPSSAFAAFVKR--APSTWLTAYVVKVFSLAVNLIAIDSQV
:. :. ... :: ..: ... .....:: .: .:::::.:.: :. : ..: :: .
CCDS73 RSRAVGFLEIGYQKELMYKHSNGSYSAFGERDGNGNTWLTAFVTKCFGQAQKFIFIDPKN
510 520 530 540 550 560
1100 1110 1120 1130 1140 1150
pF1KE3 LCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAFVLISLQE-AKDIC
. :.::. .: :.: . . . ..: : ::. . ...:::.: .: : .::.
CCDS73 IQDALKWMA-GNQLPSGCYANVGNLLHTAMKGGV----DDEVSLTAYVTAALLEMGKDVD
570 580 590 600 610 620
1160 1170 1180 1190 1200
pF1KE3 EEQVNSLPGSITKAGDFLEANYMNLQRSYTVAIAGYA---------LAQMGRLKGPLL--
. .:.. . ... : . .: ..:: : :.. ..: .
CCDS73 DPMVSQGLRCLKNSATSTTNLYTQALLAYIFSLAGEMDIRNILLKQLDQQAIISGESIYW
630 640 650 660 670 680
1210 1220 1230 1240 1250 1260
pF1KE3 NKFLTTAKDKNRWEDPGKQLYNVEATSYALLALLQ-----LKDFDFVPPVVRWLNEQRYY
.. : ... . : .:. .:: :.::::: : :.. . .: :: .:.
CCDS73 SQKPTPSSNASPWSEPAA--VDVELTAYALLAQLTKPSLTQKEIAKATSIVAWLAKQHNA
690 700 710 720 730 740
1270 1280 1290 1300 1310
pF1KE3 GGGYGSTQATFMVFQALAQYQKDA--PDHQELNLDVSLQLPSRSSKITHR-IHWESAS-L
::..::: : ...::::.: : :. .:.:: : .:.. .: .. .:.. :
CCDS73 YGGFSSTQDTVVALQALAKYATTAYMPS-EEINLVV------KSTENFQRTFNIQSVNRL
750 760 770 780 790
1320 1330 1340 1350 1360 1370
pF1KE3 LRSEETKENEGFTVTAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVTIKPAPETEKRPQ
. ...: : : :..::: . : :. . . . . :.:.: : : ..:
CCDS73 VFQQDTLPNVPGMYTLEASGQGCVYVQTVLRYNILPPTNMKTFSLSVEIGKA--RCEQPT
800 810 820 830 840 850
1380 1390 1400 1410 1420 1430
pF1KE3 DAKNTMILEICTRYRGDQDAT-MSILDISMMTGFAPDTDDLKQLANGVDRYISKYELDKA
. . .. : : : : :..... :.:....:..::.: .:... . . : :
CCDS73 SPR-SLTLTIHTSYVGSRSSSNMAIVEVKMLSGFSP--------MEGTNQLLLQQPLVKK
860 870 880 890 900
1440 1450 1460 1470 1480 1490
pF1KE3 FS-DRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEESCTRFYHPE
.:: ::::.. .. . .: . : : ..:...::: :: .:. :
CCDS73 VEFGTDTLNIYLDELIKNTQT-YTFTISQSVLVTNLKPATIKVYDYYLPDEQATIQYSDP
910 920 930 940 950 960
1500 1510 1520 1530 1540 1550
pF1KE3 KEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVYKTRLVKVQLSN
CCDS73 CE
>>CCDS6826.1 C5 gene_id:727|Hs108|chr9 (1676 aa)
initn: 1269 init1: 189 opt: 674 Z-score: 783.8 bits: 158.0 E(32554): 2.5e-37
Smith-Waterman score: 2440; 28.2% identity (62.5% similar) in 1719 aa overlap (10-1661:6-1676)
10 20 30 40 50
pF1KE3 MGPTSGPSLLLLLLTHLPLALGSPM-YSIITPNILRLESEETMVLEAHDAQGDVPVTVTV
.: .: : . :. . : : .:.:.:. . :..:.... .:...
CCDS68 MGLLGILCFLIFLGKTWGQEQTYVISAPKIFRVGASENIVIQVYGYTEAFDATISI
10 20 30 40 50
60 70 80 90 100 110
pF1KE3 HDFPGKKLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQVVEK
...: ::. :: .. :. .. .... .:: ... . .. ..: .... :
CCDS68 KSYPDKKFSYSSGHVHLSSENKFQNSAILTIQP-KQLPGGQNPVSYVYLEVVSKHFSKSK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE3 VVLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTVMVNIENPEGIPVKQDS
. .. ..:.:::.::: .::: ..: :....: : :. : ..... .::: : :
CCDS68 RMPITYDNGFLFIHTDKPVYTPDQSVKVRVYSLNDDLKPAKRETVLTFIDPEGSEV--DM
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 LSSQNQLGVLPL-SWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSFEVIVEP
. ...:.. . .. :: .:.: :.: :... . . .. ::::::::: : : .::
CCDS68 VEEIDHIGIISFPDFKIPSNPRYGMWTIKAKYKEDFSTTGTAYFEVKEYVLPHFSVSIEP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 TEKFYYIYNEKGLEVTITARFLYGKKV-EGTAFVIFGIQDG---EQRISLPESLKRIPIE
.: : :..:.:: ::..:.: : :. ... :::.. .:. . ... .
CCDS68 EYNFIGYKNFKNFEITIKARYFYNKVVTEADVYITFGIREDLKDDQKEMMQTAMQNTMLI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 DGSGEVVLSRKVLLDGVQNPRAEDLVGKSLYVSATVILHSGSDMVQAERSGIPIVTSPYQ
.: ..:... .. . .. ::: .: ::...::: .:. .:: :: : :::.
CCDS68 NGIAQVTFDSETAVKELSYYSLEDLNNKYLYIAVTVIESTGGFSEEAEIPGIKYVLSPYK
300 310 320 330 340 350
360 370 380 390 400
pF1KE3 IHFTKTPKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQGE-----------DTVQSLTQ-
.... :: ..:::.:. . : : . . . :::..... : .:.:.
CCDS68 LNLVATPLFLKPGIPYPIKVQVKDSLDQLVGGVPVTLNAQTIDVNQETSDLDPSKSVTRV
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE3 GDGVAKLSINTHPSQKPLSITVRTKKQELSEAEQATRTMQALPYSTVGNSNNYLHLSVLR
::::.. .: . : ..:.: .: : .:: . ..:. ::....: :. . .
CCDS68 DDGVASFVLNLPSGVTVLEFNVKTDAPDLPEENQAREGYRAIAYSSLSQSYLYIDWTDNH
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE3 TELRPGETLNVNFLLRMDRAHEAKIRYYTYLIMNKGRLLKAGRQVREPGQDLVVLPLSIT
: :: ::. .. . :: .:.:::..::.... : . . . . . .:
CCDS68 KALLVGEHLNI--IVTPKSPYIDKITHYNYLILSKGKIIHFGTREKFSDASYQSINIPVT
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE3 TDFIPSFRLVAYYTLIGASGQREVVADSVWVDVKDSCVGSLVVKSGQSEDRQPVPGQQMT
...:: ::..:: . : . :.:.::::......: ..: :. . . : ::: ..
CCDS68 QNMVPSSRLLVYYIVTGEQTA-ELVSDSVWLNIEEKCGNQLQVHLSPDADAYS-PGQTVS
540 550 560 570 580
590 600 610 620 630 640
pF1KE3 LKIEGDHGARVVLVAVDKGVFVLNKKNKLTQSKIWDVVEKADIGCTPGSGKDYAGVFSDA
:.. . :.:.:::..:. ... : .... .::.:.:: :.: . :.:: :
CCDS68 LNMATGMDSWVALAAVDSAVYGVQRGAKKPLERVFQFLEKSDLGCGAGGGLNNANVFHLA
590 600 610 620 630 640
650 660 670 680 690 700
pF1KE3 GLTFTSSSGQQTAQRAELQCPQPAARRRRSVQLTEKRMDKVG-KYPKEL-RKCCEDGMRE
:::: .... . .:. . : . : ::..: :...... :: . . .::: ::
CCDS68 GLTFLTNANADDSQENDEPCKE-ILRPRRTLQ---KKIEEIAAKYKHSVVKKCCYDGACV
650 660 670 680 690 700
710 720 730 740 750
pF1KE3 NPMRFSCQRRTRFISLGEACKKVFLDCCNYITELRRQHARASH--LGLARSNLDEDI-IA
: . .:..:. :::: : :.: .:: ..:: : :: . :.: .. . ..
CCDS68 NNDE-TCEQRAARISLGPRCIKAFTECCVVASQLR---ANISHKDMQLGRLHMKTLLPVS
710 720 730 740 750 760
760 770 780 790 800 810
pF1KE3 EENIVSRSEFPESWLWNVEDLKEPPKNGISTKLMNIFLKDSITTWEILAVSMSDKKGICV
. .: :: :::::::.:. . :. : ... : ::.::::: .:..:. ::::
CCDS68 KPEI--RSYFPESWLWEVHLV---PRR----KQLQFALPDSLTTWEIQGVGISNT-GICV
770 780 790 800 810
820 830 840 850 860 870
pF1KE3 ADPFEVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNYRQNQELKVRVELLHNPAFCSLAT
:: .. :..: :... .::::::.::.......:::: . .. :.. ..:. .
CCDS68 ADTVKAKVFKDVFLEMNIPYSVVRGEQIQLKGTVYNYRTSG-MQFCVKMSAVEGICTSES
820 830 840 850 860 870
880 890 900 910 920 930
pF1KE3 TKRRHQQTVT-------IPPKSSLSVPYVIVPLKTGLQEVEVKAAVYHHFISDGVRKSLK
:: : . . .:: : ....::. ::.... . .. : .. . :.:.
CCDS68 PVIDHQGTKSSKCVRQKVEGSSSHLVTFTVLPLEIGLHNINFSLETW--FGKEILVKTLR
880 890 900 910 920
940 950 960 970 980 990
pF1KE3 VVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPADLSDQVPDTESETRILLQGTPVAQM
:::::.. .. .: ::::. . .....: : :: :: . . ..: :...
CCDS68 VVPEGVKRESYSGV-TLDPRGIYGTISRRKEFPYRIPLDLVPKTEIKRILSVKGLLVGEI
930 940 950 960 970 980
1000 1010 1020 1030 1040
pF1KE3 TEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAVHYLDETEQWEKFG---LEKRQGALE
... : .. : :.: .: ......:. . :::. ..:. : : ..: .
CCDS68 LSAVLSQEGINILTHLPKGSAEAELMSVVPVFYVFHYLETGNHWNIFHSDPLIEKQKLKK
990 1000 1010 1020 1030 1040
1050 1060 1070 1080 1090 1100
pF1KE3 LIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTAYVVKVFSLAVNLIAIDSQVLCGAVKWL
.:.:. . ...:. . ..... . ::::::....:.. . . . ... .:... ::
CCDS68 KLKEGMLSIMSYRNADYSYSVWKGGSASTWLTAFALRVLGQVNKYVEQNQNSICNSLLWL
1050 1060 1070 1080 1090 1100
1110 1120 1130 1140 1150 1160
pF1KE3 ILEKQKPDGVFQEDAPVIHQEMIGGLR-NNNEKDMALTAFVLISLQEAKDICEEQVNSLP
. . : .: :.:.. .. : : . :... ::::..:....: ::: . ..
CCDS68 VENYQLDNGSFKENSQYQPIKLQGTLPVEARENSLYLTAFTVIGIRKAFDIC--PLVKID
1110 1120 1130 1140 1150 1160
1170 1180 1190 1200 1210
pF1KE3 GSITKAGDFLEANYMNLQRSYTVAIAGYALAQMGRLKGPLLNKFLTTAKDKNR-------
.. :: .:: : . : ..:.::..:::. .: : . ..... : .
CCDS68 TALIKADNFLLENTLPAQSTFTLAISAYALS-LGDKTHPQFRSIVSALKREALVKGNPPI
1170 1180 1190 1200 1210 1220
1220 1230 1240 1250 1260
pF1KE3 ---WED----PGKQLYN------VEATSYALLALLQLKDFDFVPPVVRWLNEQRYYGGGY
:.: ... : ::.:.::::. :.:::...: ::..::.:.. ::::.
CCDS68 YRFWKDNLQHKDSSVPNTGTARMVETTAYALLTSLNLKDINYVNPVIKWLSEEQRYGGGF
1230 1240 1250 1260 1270 1280
1270 1280 1290 1300 1310 1320
pF1KE3 GSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSRSSKITHRIHWESASLL-RSEETK
::: :. ....:..:. . ..: :...... . . : . . ..: : :.
CCDS68 YSTQDTINAIEGLTEYSLLV---KQLRLSMDIDVSYKHKGALHNYKMTDKNFLGRPVEVL
1290 1300 1310 1320 1330 1340
1330 1340 1350 1360 1370 1380
pF1KE3 ENEGFTV-TAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVTIKPAPETEKRPQDAKNTM
:. . : :. :.: .:. :.:. : . .. .:. : ::. . .. : ..
CCDS68 LNDDLIVSTGFGSGLATVHVTTVVHKTSTSEEVCS-FYLKIDTQDIEASHYRGYGNSDYK
1350 1360 1370 1380 1390 1400
1390 1400 1410 1420 1430
pF1KE3 ILEICTRYRGDQDATMS-----ILDISMMTGFAPDTDDLKQLANGVDRYISKYELDKAFS
. :. :. ... . : ..:::. ::.. . .::: :..:::. .. :.. .
CCDS68 RIVACASYKPSREESSSGSSHAVMDISLPTGISANEEDLKALVEGVDQLFTDYQIKDGH-
1410 1420 1430 1440 1450
1440 1450 1460 1470 1480 1490
pF1KE3 DRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEESCTRFYHPEKED
.:. :... :. :. :.. . :.: ...:.. :: :. ...:: :: .
CCDS68 ----VILQLNSIPSSDFLCVRFRIFELFEVGFLSPATFTVYEYHRPDKQCTMFYSTS--N
1460 1470 1480 1490 1500 1510
1500 1510 1520 1530 1540 1550
pF1KE3 GKLNKLCRDELCRCAEENC--FIQKSDDKVTLEERLDKACEPGVDYVYKTRLVKVQLSND
:..:.:. :.:.: .: . .. : .. : : . ::.: . :.::. .... . :
CCDS68 IKIQKVCEGAACKCVEADCGQMQEELDLTISAETRKQTACKPEIAYAYKVSITSITVENV
1520 1530 1540 1550 1560 1570
1560 1570 1580 1590 1600 1610
pF1KE3 FDEYIMAIEQTIKSGSDEVQVGQQRTFISPIKCREALKLEEKKHYLMWGLSSDFWGEKPN
: .: .. . :.: .. .. :::. . : .: .: . ..::. : .. : :
CCDS68 FVKYKATLLDIYKTGEAVAEKDSEITFIKKVTCTNA-ELVKGRQYLIMG--KEALQIKYN
1580 1590 1600 1610 1620 1630
1620 1630 1640 1650 1660
pF1KE3 LS--YIIGKD--TWVEHWPEEDECQDEENQKQCQDLGAFTESMVVFGCPN
.: :: : ::.:.::.. :.. : .: :.:.. . ::
CCDS68 FSFRYIYPLDSLTWIEYWPRDTTCSS--CQAFLANLDEFAEDIFLNGC
1640 1650 1660 1670
>>CCDS4982.1 CD109 gene_id:135228|Hs108|chr6 (1445 aa)
initn: 515 init1: 110 opt: 673 Z-score: 783.6 bits: 157.8 E(32554): 2.5e-37
Smith-Waterman score: 1106; 24.6% identity (56.2% similar) in 1444 aa overlap (130-1516:131-1418)
100 110 120 130 140 150
pF1KE3 KGRNKFVTVQATFGTQVVEKVVLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPV
.::::::..: : . : .:: :. . :
CCDS49 IYELRVTGRTQDEILFSNSTRLSFETKRISVFIQTDKALYKPKQEVKFRIVTLFSDFKPY
110 120 130 140 150 160
160 170 180 190 200 210
pF1KE3 GRTVMVNIENPEGIPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYYENSPQQVFS
.. . :..:.. ..: ::.:..:::. .... .:.:.:.. .. :..
CCDS49 KTSLNILIKDPKSNLIQQ-WLSQQSDLGVISKTFQLSSHPILGDWSIQVQVND---QTYY
170 180 190 200 210
220 230 240 250 260 270
pF1KE3 TEFEVKEYVLPSFEVIVEPTEKFYYIYNEKGLEVTITARFLYGKKVEGTAFVIF-GIQDG
:.:.:::::.::: .. .: .: : :. ::::.. ::: :.: . . : ..
CCDS49 QSFQVSEYVLPKFEVTLQTP--LYCSMNSKHLNGTITAKYTYGKPVKGDVTLTFLPLSFW
220 230 240 250 260 270
280 290 300 310 320 330
pF1KE3 EQRISLPESLKRIPIEDGSGEVVLSR---KVLLDGVQNPRAE--DLVGKSLYVSATVILH
.. .. ...: .::.. .. : ..:. .: .: :: . . :.. .
CCDS49 GKKKNITKTFKI----NGSANFSFNDEEMKNVMDS-SNGLSEYLDLSSPGPVEILTTVTE
280 290 300 310 320
340 350 360 370 380 390
pF1KE3 SGSDMVQAERSGIPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQG
: . . . ... . : :.: .::.. : : :: ::. .. . .
CCDS49 SVTGISRNVSTNVFFKQHDYIIEFFDYTTVLKPSLNFTATVKVTRADGN---QLTLEERR
330 340 350 360 370 380
400 410 420 430 440
pF1KE3 EDTVQSLTQGDGVAKLSINTHPSQK-----PLSITVR---TKKQELSEAEQATRTMQALP
...: ..:: . . : .. .:: .. :: : : :. :.... .:
CCDS49 NNVVITVTQRNYTEYWSGSNSGNQKMEAVQKINYTVPQSGTFKIEFPILEDSSE-LQLKA
390 400 410 420 430 440
450 460 470 480 490
pF1KE3 YSTVGNSNNYLHLSVLRT------ELRP-GETLNVNFLLRMDRAHEAKIRYYTYLIMNKG
: ..:. .: :.... .:. :...:. ... . . ... .:.....:
CCDS49 YFLGSKSSMAVH-SLFKSPSKTYIQLKTRDENIKVGSPFELVVSGNKRLKELSYMVVSRG
450 460 470 480 490 500
500 510 520 530 540 550
pF1KE3 RLLKAGRQVREPGQDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVKDS
.:. .:.: . ... :. ... :. ...:: : .: :...: . . :.
CCDS49 QLVAVGKQ------NSTMFSLTPENSWTPKACVIVYY--IEDDG--EIISDVLKIPVQ--
510 520 530 540 550
560 570 580 590 600 610
pF1KE3 CVGSLVVKSGQSEDRQPVPGQQMTLKIEGDHGARVV-LVAVDKGVFVLNKKNKLTQSKIW
: . .: :. . :.....:.: . .: .:::::.: ..: .: .:. ..
CCDS49 LVFKNKIKLYWSKVKAE-PSEKVSLRISVTQPDSIVGIVAVDKSVNLMNASNDITMENVV
560 570 580 590 600 610
620 630 640 650 660 670
pF1KE3 DVVEKADIGCTPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQPAARRRRSVQLTE
.: . : : . .::.. :: .... ::.
CCDS49 HELELYNTGYYLGMFMNSFAVFQECGLWVLTDAN-----------------------LTK
620 630 640
680 690 700 710 720 730
pF1KE3 KRMDKVGKYPKELRKCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYITELRRQ
.: :. .: . ::. .:. .:....
CCDS49 DYID---------------GVYDNA-----EYAERFMEENEG----------HIVDIH--
650 660 670
740 750 760 770 780 790
pF1KE3 HARASHLGLARSNLDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGIST-KLMNIFLK
: .. . .. :..:::.:.: .. : . ... .
CCDS49 --------------DFSLGSSPHV--RKHFPETWIWLDTNM------GYRIYQEFEVTVP
680 690 700 710
800 810 820 830 840 850
pF1KE3 DSITTWEILAVSMSDKKGICVAD-PFEVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNY-
::::.: . .:. :. .. : :. ..: ::: : :::::.:.:. .. ...::
CCDS49 DSITSWVATGFVISEDLGLGLTTTPVELQAFQPFFIFLNLPYSVIRGEEFALEITIFNYL
720 730 740 750 760 770
860 870 880 890 900 910
pF1KE3 RQNQELKVRVELLHNPAFCSLATTKR----RHQQTVTIPPKSSLSVPYVIVPLKTGLQEV
.. :.:: .: .. : : :... ::::. .: ... .: . : : : : :.
CCDS49 KDATEVKVIIE--KSDKFDILMTSNEINATGHQQTLLVPSEDGATVLFPIRP--THLGEI
780 790 800 810 820 830
920 930 940 950 960
pF1KE3 EVKAAVYHHFISDGVRKSLKVVPEGIR--MNKTVAVRTLDPERLGREGVQKEDIPPADLS
. ... ::.: . . : :::. ..... . : . . . . ..:: .
CCDS49 PITVTALSPTASDAVTQMILVKAEGIEKSYSQSILLDLTDNRLQSTLKTLSFSFPPNTV-
840 850 860 870 880
970 980 990 1000 1010 1020
pF1KE3 DQVPDTESETRILLQGTPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAVHYL
: :: :. : : .... .... : :: : ::::::::...:.. . ::
CCDS49 -----TGSE-RV--QITAIGDVLGPSING--LASLIRMPYGCGEQNMINFAPNIYILDYL
890 900 910 920 930
1030 1040 1050 1060 1070 1080
pF1KE3 DETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPS--TWLTAYVVKVF
. .: :: :: ....:: ..: ... ...:.:: . :: :::.:.:.. :
CCDS49 TKKKQLTDNLKEK---ALSFMRQGYQRELLYQREDGSFSAFGNYDPSGSTWLSAFVLRCF
940 950 960 970 980 990
1090 1100 1110 1120 1130 1140
pF1KE3 SLAVNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAF
: : ::..:: . :: .:: .: : . . :::.:. :: :.. ..:::.
CCDS49 LEADPYIDIDQNVLHRTYTWLK-GHQKSNGEFWDPGRVIHSELQGG----NKSPVTLTAY
1000 1010 1020 1030 1040 1050
1150 1160 1170 1180 1190 1200
pF1KE3 VLISLQEAKDICEEQVNSLPGSITKAGDFLEANYM-NLQRSYTVAIAGYALAQMGRLKGP
.. :: . . : : .. .. :::... ... .::.:. :::...: :.
CCDS49 IVTSLLGYR---KYQPNI---DVQESIHFLESEFSRGISDNYTLALITYALSSVGSPKAK
1060 1070 1080 1090 1100
1210 1220 1230 1240 1250
pF1KE3 -LLNKFLTTAKDKNR---WEDPGKQL--------YNVEATSYALLA-LLQLKDFDFVPPV
:: . :.... : . ..: ..:...::::. .::.. . .: .
CCDS49 EALNMLTWRAEQEGGMQFWVSSESKLSDSWQPRSLDIEVAAYALLSHFLQFQTSEGIP-I
1110 1120 1130 1140 1150 1160
1260 1270 1280 1290 1300 1310
pF1KE3 VRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSRSSKITHRIH
.:::..:: ::..::: : ....::... . .. :..:.. :: : . :
CCDS49 MRWLSRQRNSLGGFASTQDTTVALKALSEFAA-LMNTERTNIQVTVTGPSSPSPVKFLID
1170 1180 1190 1200 1210 1220
1320 1330 1340 1350 1360
pF1KE3 WESASLLRSEETK--ENEGFTVTAEGKGQGTLSVVTMYHAKA-----KDQLTCNK--FDL
.. ::.. : . . ...:.: : . .. ..:..:: . . :. :::
CCDS49 THNRLLLQTAELAVVQPTAVNISANGFGFAICQLNVVYNVKASGSSRRRRSIQNQEAFDL
1230 1240 1250 1260 1270 1280
1370 1380 1390 1400 1410 1420
pF1KE3 KVTIKPAPETEKRPQDAKNTMILEICTRYRGDQDATMSILDISMMTGFAPDTDDLKQLAN
:.. :. .: : . :..:: . : . :.........:: .. :
CCDS49 DVAV-------KENKDDLNHVDLNVCTSFSGPGRSGMALMEVNLLSGFMVPSE-----AI
1290 1300 1310 1320 1330
1430 1440 1450 1460 1470 1480
pF1KE3 GVDRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYY
.... ..: : :.. : .:::.:.... :. . . . :.: : ..:.. ::
CCDS49 SLSETVKKVEY-----DHGKLNLYLDSVNETQF-CVNIPAVRNFKVSNTQDASVSIVDYY
1340 1350 1360 1370 1380
1490 1500 1510 1520 1530 1540
pF1KE3 NLEESCTRFYHPEKEDGKLNKLCRD-ELCRCAEENCFIQKSDDKVTLEERLDKACEPGVD
. ... .: :. : . .. . :: : . :: :.
CCDS49 EPRRQAVRSYNSEVKLSSCD-LCSDVQGCRPCEDGASGSHHHSSVIFIFCFKLLYFMELW
1390 1400 1410 1420 1430 1440
1550 1560 1570 1580 1590 1600
pF1KE3 YVYKTRLVKVQLSNDFDEYIMAIEQTIKSGSDEVQVGQQRTFISPIKCREALKLEEKKHY
CCDS49 L
>>CCDS55039.1 CD109 gene_id:135228|Hs108|chr6 (1368 aa)
initn: 503 init1: 110 opt: 614 Z-score: 714.2 bits: 144.9 E(32554): 1.8e-33
Smith-Waterman score: 1024; 24.0% identity (55.0% similar) in 1478 aa overlap (123-1516:20-1341)
100 110 120 130 140 150
pF1KE3 NREFKSEKGRNKFVTVQATFGTQVVEKVVLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTV
... : :. : : ::..: . .
CCDS55 MQGPPLLTAAHLLCVCTAALAVAPGPRFLVTAPGIIRPGGNVTIGVELL
10 20 30 40
160 170 180
pF1KE3 NH---------KLLPVGRTVMVNIENPEGIPVK-----------------QDSLSSQNQL
.: .:: .. .. :.. . ::. : :. ::.:..:
CCDS55 EHCPSQVTVKAELLKTASNLTVSVLEAEGVFEKGSFKTLTLPSDPKSNLIQQWLSQQSDL
50 60 70 80 90 100
190 200 210 220 230 240
pF1KE3 GVLPLSWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSFEVIVEPTEKFYYIY
::. .... .:.:.:.. .. :.. :.:.:::::.::: .. .: .
CCDS55 GVISKTFQLSSHPILGDWSIQVQVND---QTYYQSFQVSEYVLPKFEVTLQTP--LYCSM
110 120 130 140 150 160
250 260 270 280 290 300
pF1KE3 NEKGLEVTITARFLYGKKVEGTAFVIFGIQD--GEQRISLPESLKRIPIEDGSGEVVLSR
: : :. ::::.. ::: :.: . . : . :... .. ...: .::.. ..
CCDS55 NSKHLNGTITAKYTYGKPVKGDVTLTFLPLSFWGKKK-NITKTFKI----NGSANFSFND
170 180 190 200 210
310 320 330 340 350
pF1KE3 ---KVLLDGVQNPRAE--DLVGKSLYVSATVILHSGSDMVQAERSGIPIVTSPYQIHFTK
: ..:. .: .: :: . . :.. .: . . . ... . : :.:
CCDS55 EEMKNVMDS-SNGLSEYLDLSSPGPVEILTTVTESVTGISRNVSTNVFFKQHDYIIEFFD
220 230 240 250 260 270
360 370 380 390 400 410
pF1KE3 TPKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQGEDTVQSLTQGDGVAKLSINTHPSQK-
.::.. : : :: ::. .. . . ...: ..:: . . : .. .::
CCDS55 YTTVLKPSLNFTATVKVTRADGN---QLTLEERRNNVVITVTQRNYTEYWSGSNSGNQKM
280 290 300 310 320 330
420 430 440 450 460
pF1KE3 ----PLSITVR---TKKQELSEAEQATRTMQALPYSTVGNSNNYLHLSVLRT------EL
.. :: : : :. :.... .: : ..:. .: :.... .:
CCDS55 EAVQKINYTVPQSGTFKIEFPILEDSSE-LQLKAYFLGSKSSMAVH-SLFKSPSKTYIQL
340 350 360 370 380 390
470 480 490 500 510 520
pF1KE3 RP-GETLNVNFLLRMDRAHEAKIRYYTYLIMNKGRLLKAGRQVREPGQDLVVLPLSITTD
. :...:. ... . . ... .:.....:.:. .:.: . ... :. ..
CCDS55 KTRDENIKVGSPFELVVSGNKRLKELSYMVVSRGQLVAVGKQ------NSTMFSLTPENS
400 410 420 430 440
530 540 550 560 570 580
pF1KE3 FIPSFRLVAYYTLIGASGQREVVADSVWVDVKDSCVGSLVVKSGQSEDRQPVPGQQMTLK
. :. ...:: : .: :...: . . :. : . .: :. . :.....:.
CCDS55 WTPKACVIVYY--IEDDG--EIISDVLKIPVQ--LVFKNKIKLYWSKVKAE-PSEKVSLR
450 460 470 480 490 500
590 600 610 620 630 640
pF1KE3 IEGDHGARVV-LVAVDKGVFVLNKKNKLTQSKIWDVVEKADIGCTPGSGKDYAGVFSDAG
: . .: .:::::.: ..: .: .:. .. .: . : : . .::.. :
CCDS55 ISVTQPDSIVGIVAVDKSVNLMNASNDITMENVVHELELYNTGYYLGMFMNSFAVFQECG
510 520 530 540 550 560
650 660 670 680 690 700
pF1KE3 LTFTSSSGQQTAQRAELQCPQPAARRRRSVQLTEKRMDKVGKYPKELRKCCEDGMRENPM
: .... ::. .: :. .:
CCDS55 LWVLTDAN-----------------------LTKDYID---------------GVYDNA-
570 580
710 720 730 740 750 760
pF1KE3 RFSCQRRTRFISLGEACKKVFLDCCNYITELRRQHARASHLGLARSNLDEDIIAEENIVS
. ::. .:. .:... : : .. . ..
CCDS55 ----EYAERFMEENEG----------HIVDI--------H--------DFSLGSSPHV--
590 600
770 780 790 800 810 820
pF1KE3 RSEFPESWLWNVEDLKEPPKNGIST-KLMNIFLKDSITTWEILAVSMSDKKGICVAD-PF
:..:::.:.: .. : . ... . ::::.: . .:. :. .. :
CCDS55 RKHFPETWIWLDTNM------GYRIYQEFEVTVPDSITSWVATGFVISEDLGLGLTTTPV
610 620 630 640 650 660
830 840 850 860 870 880
pF1KE3 EVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNY-RQNQELKVRVELLHNPAFCSLATTKR
:. ..: ::: : :::::.:.:. .. ...:: .. :.:: .: .. : : :...
CCDS55 ELQAFQPFFIFLNLPYSVIRGEEFALEITIFNYLKDATEVKVIIE--KSDKFDILMTSNE
670 680 690 700 710 720
890 900 910 920 930
pF1KE3 ----RHQQTVTIPPKSSLSVPYVIVPLKTGLQEVEVKAAVYHHFISDGVRKSLKVVPEGI
::::. .: ... .: . : : . : :. . ... ::.: . . : :::
CCDS55 INATGHQQTLLVPSEDGATVLFPIRPTHLG--EIPITVTALSPTASDAVTQMILVKAEGI
730 740 750 760 770
940 950 960 970 980 990
pF1KE3 R--MNKTVAVRTLDPERLGREGVQKEDIPPADLSDQVPDTESETRILLQGTPVAQMTEDA
. ..... . : . . . . ..:: . : .: :. : : .... .
CCDS55 EKSYSQSILLDLTDNRLQSTLKTLSFSFPP----NTVTGSE---RV--QITAIGDVLGPS
780 790 800 810 820 830
1000 1010 1020 1030 1040 1050
pF1KE3 VDAERLKHLIVTPSGCGEQNMIGMTPTVIAVHYLDETEQWEKFGLEKRQGALELIKKGYT
... : :: : ::::::::...:.. . :: . .: :: :: ....::
CCDS55 ING--LASLIRMPYGCGEQNMINFAPNIYILDYLTKKKQLTDNLKEK---ALSFMRQGYQ
840 850 860 870 880
1060 1070 1080 1090 1100 1110
pF1KE3 QQLAFRQPSSAFAAFVKRAPS--TWLTAYVVKVFSLAVNLIAIDSQVLCGAVKWLILEKQ
..: ... ...:.:: . :: :::.:.:.. : : : ::..:: . :: .:
CCDS55 RELLYQREDGSFSAFGNYDPSGSTWLSAFVLRCFLEADPYIDIDQNVLHRTYTWLK-GHQ
890 900 910 920 930 940
1120 1130 1140 1150 1160 1170
pF1KE3 KPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAFVLISLQEAKDICEEQVNSLPGSITKA
: .: : . . :::.:. :: :.. ..:::... :: . . : : .. ..
CCDS55 KSNGEFWDPGRVIHSELQGG----NKSPVTLTAYIVTSLLGYR---KYQPNI---DVQES
950 960 970 980 990
1180 1190 1200 1210 1220
pF1KE3 GDFLEANYM-NLQRSYTVAIAGYALAQMGRLKGP-LLNKFLTTAKDKNR---WEDPGKQL
:::... ... .::.:. :::...: :. :: . :.... : . ..:
CCDS55 IHFLESEFSRGISDNYTLALITYALSSVGSPKAKEALNMLTWRAEQEGGMQFWVSSESKL
1000 1010 1020 1030 1040 1050
1230 1240 1250 1260 1270
pF1KE3 --------YNVEATSYALLA-LLQLKDFDFVPPVVRWLNEQRYYGGGYGSTQATFMVFQA
..:...::::. .::.. . .: ..:::..:: ::..::: : ....:
CCDS55 SDSWQPRSLDIEVAAYALLSHFLQFQTSEGIP-IMRWLSRQRNSLGGFASTQDTTVALKA
1060 1070 1080 1090 1100 1110
1280 1290 1300 1310 1320 1330
pF1KE3 LAQYQKDAPDHQELNLDVSLQLPSRSSKITHRIHWESASLLRSEETK--ENEGFTVTAEG
:... . .. :..:.. :: : . : .. ::.. : . . ...:.:
CCDS55 LSEFAALM-NTERTNIQVTVTGPSSPSPVKFLIDTHNRLLLQTAELAVVQPTAVNISANG
1120 1130 1140 1150 1160 1170
1340 1350 1360 1370 1380
pF1KE3 KGQGTLSVVTMYHAKA-----KDQLTCNK--FDLKVTIKPAPETEKRPQDAKNTMILEIC
: . .. ..:..:: . . :. ::: :..: .: : . :..:
CCDS55 FGFAICQLNVVYNVKASGSSRRRRSIQNQEAFDLDVAVKEN-------KDDLNHVDLNVC
1180 1190 1200 1210 1220
1390 1400 1410 1420 1430 1440
pF1KE3 TRYRGDQDATMSILDISMMTGFAPDTDDLKQLANGVDRYISKYELDKAFSDRNTLIIYLD
: . : . :.........:: .. : .... ..: : :.. : .:::
CCDS55 TSFSGPGRSGMALMEVNLLSGFMVPSE-----AISLSETVKKVEY-----DHGKLNLYLD
1230 1240 1250 1260 1270
1450 1460 1470 1480 1490 1500
pF1KE3 KVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEESCTRFYHPEKEDGKLNKLCRD-
.:.... :. . . . :.: : ..:.. ::. ... .: :. : . .. . :: :
CCDS55 SVNETQF-CVNIPAVRNFKVSNTQDASVSIVDYYEPRRQAVRSYNSEVKLSSCD-LCSDV
1280 1290 1300 1310 1320 1330
1510 1520 1530 1540 1550 1560
pF1KE3 ELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVYKTRLVKVQLSNDFDEYIMAIEQT
. :: :.
CCDS55 QGCRPCEDGASGSHHHSSVIFIFCFKLLYFMELWL
1340 1350 1360
>>CCDS8600.1 PZP gene_id:5858|Hs108|chr12 (1482 aa)
initn: 476 init1: 123 opt: 576 Z-score: 668.8 bits: 136.6 E(32554): 6.2e-31
Smith-Waterman score: 1160; 24.7% identity (56.0% similar) in 1556 aa overlap (9-1493:13-1469)
10 20 30 40 50
pF1KE3 MGPTSGPSLLLLLLTHLPLALGSPMYSIITPNILRLES-EETMVLEAHDAQGDVPV
:::.::. :.: ...:..:. :. .. :: .: . :
CCDS86 MRKDRLLHLCLVLLLILLSASDSNSTEPQYMVLVPSLLHTEAPKKGCVLLSHLNE---TV
10 20 30 40 50
60 70 80 90 100 110
pF1KE3 TVTVHDFPGKKLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQ
::.. :.. : : :. . . :.::.: : ... :...: ::
CCDS86 TVSASLESGRE--NRSLFTDLVAEKDLFHCVSFTLPRI----SASSEVAFLSIQIKGPTQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE3 VVEK--VVLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTV-MVNIENPEG
.: .::: .. .:.:::: .: ::.:: .:. .:.... : .. . .. .:::.
CCDS86 DFRKRNTVLVLNTQSLVFVQTDKPMYKPGQTVRFRVVSVDENFRPRNELIPLIYLENPRR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 IPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSF
. : . : . . :. ::. . .:.... . :.. . .. : :.:.:::.:
CCDS86 NRIAQWQ-SLKLEAGINQLSFPLSSEPIQGSYRVVVQTESGGR--IQHPFTVEEFVLPKF
180 190 200 210 220
240 250 260 270 280
pF1KE3 EVIVEPTEKFYYIYNEKGLEVTITARFLYGKKVEGTAFV-----IFGIQDGEQRISLPES
:: :. . :. :..:: ...:. ... ::: : : : : . . . ... :
CCDS86 EVKVQ-VPKIISIMDEK-VNITVCGEYTYGKPVPGLATVSLCRKLSRVLNCDKQEVCEEF
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE3 LKRIPIEDGSGEVVLSRKVLLDGVQNPRAEDLVGKSLYVSATVILHSGSDM-VQAER-SG
... ...: .. . .. . . : : .: : : : . :.:. : :.: :
CCDS86 SQQL---NSNGCITQQVHTKMLQITNTGFE----MKLRVEAR-IREEGTDLEVTANRISE
290 300 310 320 330
350 360 370 380 390 400
pF1KE3 IPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSPAYRVP-----VAVQGEDTVQSL
: ..: ...:.:. ..:. :.:: .:.... : : .: ..:. . ..
CCDS86 ITNIVS--KLKFVKVDSHFRQGIPFFAQVLLVDGKGVP---IPNKLFFISVNDANYYSNA
340 350 360 370 380 390
410 420 430 440 450
pF1KE3 TQGD-GVAKLSINTHP-SQKPLSITVRTKKQEL----SEAEQATRTMQALPYSTVGNSNN
: .. :.:..:::: : . : . : : . .: : . . . : . . :..
CCDS86 TTNEQGLAQFSINTTSISVNKLFVRVFTVHPNLCFHYSWVAEDHQGAQHTANRVFSLSGS
400 410 420 430 440 450
460 470 480 490 500 510
pF1KE3 YLHLSVLRTELRPG--ETLNVNFLLRMDRAHEAKIRYYTYLIMNKGRLLKAGRQVR--EP
:.:: . : : ::..... : . : . . :::: :: ....: .. :
CCDS86 YIHLEPVAGTLPCGHTETITAHYTLNRQAMGELSELSFHYLIMAKGVIVRSGTHTLPVES
460 470 480 490 500 510
520 530 540 550 560
pF1KE3 G--QDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVKDSCVGSLVVKSG
: . .: . . .: : :. . : .: :::.:: .. ..:... : :
CCDS86 GDMKGSFALSFPVESDVAPIARMFIFAIL--PDG--EVVGDSEKFEI-ENCLANKVDLSF
520 530 540 550 560
570 580 590 600 610 620
pF1KE3 QSEDRQPVPGQQMTLKIEGDHGARVVLVAVDKGVFVLNKKNKLTQSKIWDVVEKADIGCT
: ..: :... :.. . . .: :::..:.... . .:. :...... :.
CCDS86 -SPAQSP-PASHAHLQVAAAPQSLCALRAVDQSVLLMKPEAELSVSSVYNLLTVKDL---
570 580 590 600 610 620
630 640 650 660 670 680
pF1KE3 PGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQPAARRRRS--VQLTEKRMDKVGKY
.: .. :: ... .::.: . . : :. .. : . ..
CCDS86 ---------------TNFPDNVDQQEEEQG--HCPRPFFIHNGAIYVPLSSNEAD-IYSF
630 640 650 660
690 700 710 720 730 740
pF1KE3 PKELR-KCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYITELRRQHARASHLG
: . : .. ..: ::. .: : : . . ..: ...
CCDS86 LKGMGLKVFTNSKIRKPK--SCSVIPS-VSAG-AVGQGYYGAGLGVVERPYVPQLGTYNV
670 680 690 700 710 720
750 760 770 780 790 800
pF1KE3 LARSNLDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGISTKLMNIFLKDSITTWEIL
. .: . . . :.. :: :::.:.: .: ..:.. ... . :.:: :.
CCDS86 IPLNNEQSSGPVPETV--RSYFPETWIW---ELVAVNSSGVAE--VGVTVPDTITEWKAG
730 740 750 760 770
810 820 830 840 850 860
pF1KE3 AVSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNYRQNQELKVRVE
: .:. :. ... . ..: ::..: .::::.:.: ..:.. :: . ..: :.
CCDS86 AFCLSEDAGLGISSTASLRAFQPFFVELTMPYSVIRGEVFTLKATVLNYLP-KCIRVSVQ
780 790 800 810 820 830
870 880 890 900 910 920
pF1KE3 LLHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQEVEVKAAVYHHFISDGV
: .::: ::. . . ... : . .. ....: : . :.: ... . :
CCDS86 LKASPAF--LASQNTKGEESYCICGNERQTLSWTVTPKTLGNVNFSVSAEAMQSLELCG-
840 850 860 870 880 890
930 940 950 960 970
pF1KE3 RKSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDI-------PPADLSDQVPDTESET
. . ::: :. . :: ..:: : ::...: :..:.:. .
CCDS86 -NEVVEVPE-IKRKDTV-IKTLLVEA---EGIEQEKTFSSMTCASGANVSEQLSLKLPSN
900 910 920 930 940
980 990 1000 1010 1020 1030
pF1KE3 RILLQGTPVAQMTEDAVDA--ERLKHLIVTPSGCGEQNMIGMTPTVIAVHYLDETEQWEK
. .. .. : . . . ...:. : :::::::. ..:.. ...::.::.: .
CCDS86 VVKESARASFSVLGDILGSAMQNIQNLLQMPYGCGEQNMVLFAPNIYVLNYLNETQQLTQ
950 960 970 980 990 1000
1040 1050 1060 1070 1080 1090
pF1KE3 FGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKR----APSTWLTAYVVKVFSLAVNL
: . :. . :: .:: ... ......: .: .:::::.:.:.:. : .
CCDS86 ---EIKAKAVGYLITGYQRQLNYKHQDGSYSTFGERYGRNQGNTWLTAFVLKTFAQARSY
1010 1020 1030 1040 1050 1060
1100 1110 1120 1130 1140 1150
pF1KE3 IAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAFVLISLQ
: :: . .. :: . :: .: :. .. .... . ::. : . .:.:.: :.:
CCDS86 IFIDEAHITQSLTWLS-QMQKDNGCFRSSGSLLNNAIKGGV----EDEATLSAYVTIALL
1070 1080 1090 1100 1110
1160 1170 1180 1190 1200
pF1KE3 EAK-DICEEQVNSLPGSITKAGDFLEANYMNLQRSYTVAIAGYALAQMGRLKG--PLLNK
: . . : . . .: . . . . .. :: :. .::.. .:. . .::.
CCDS86 EIPLPVTNPIVRNALFCLESAWNVAKEGTHG-SHVYTKALLAYAFSLLGKQNQNREILNS
1120 1130 1140 1150 1160 1170
1210 1220 1230 1240
pF1KE3 FLTTA-KDKN--RWEDPGK------QLYN-------VEATSYALLALLQLK------DFD
. : :. : .:: : . .::. :: :::.::: : . :.
CCDS86 LDKEAVKEDNLVHWERPQRPKAPVGHLYQTQAPSAEVEMTSYVLLAYLTAQPAPTSGDLT
1180 1190 1200 1210 1220 1230
1250 1260 1270 1280 1290 1300
pF1KE3 FVPPVVRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSRSSKI
. .:.:. .:. ::..::: : ....::..: . . : . .:..: :.. .
CCDS86 SATNIVKWIMKQQNAQGGFSSTQDTVVALHALSRYGAATFTRTEKTAQVTVQ-DSQTFST
1240 1250 1260 1270 1280 1290
1310 1320 1330 1340 1350 1360
pF1KE3 THRIHWESASLLRSEETKENEG-FTVTAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVT
. .. .. ::.. : : ...:. :. :.. :. . . . : :::
CCDS86 NFQVDNNNLLLLQQISLPELPGEYVITVTGERCVYLQTSMKYNILPEKEDS--PFALKV-
1300 1310 1320 1330 1340 1350
1370 1380 1390 1400 1410 1420
pF1KE3 IKPAPETEKRPQDAKNTMILEICTRYRGDQDAT-MSILDISMMTGFAPDTDDLKQLANGV
. .:.: . :.... . . : :.. :. : :.:..:..:: : .:.: .
CCDS86 -QTVPQTCD-GHKAHTSFQISLTISYTGNRPASNMVIVDVKMVSGFIPLKPTVKMLERSS
1360 1370 1380 1390 1400
1430 1440 1450 1460 1470 1480
pF1KE3 DRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNL
. .:. :... : ..::...:.. . ..: : : . : ..:. :::: ::.
CCDS86 S--VSRTEVSN-----NHVLIYVEQVTN-QTLSFSFMVLQDIPVGDLKPAIVKVYDYYET
1410 1420 1430 1440 1450 1460
1490 1500 1510 1520 1530 1540
pF1KE3 EESCTRFYHPEKEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVY
.:: . :
CCDS86 DESVVAEYIAPCSTDTEHGNV
1470 1480
>>CCDS44827.1 A2M gene_id:2|Hs108|chr12 (1474 aa)
initn: 455 init1: 118 opt: 542 Z-score: 628.6 bits: 129.1 E(32554): 1.1e-28
Smith-Waterman score: 1262; 25.0% identity (55.8% similar) in 1565 aa overlap (7-1499:9-1470)
10 20 30 40 50
pF1KE3 MGPTSGPSLLLLLLTHLPL---ALGSPMYSIITPNILRLESEETMVLEAHDAQGDVPV
:::.::::. :: . :.:.: ...:..:. :. : . . : :
CCDS44 MGKNKLLHPSLVLLLLVLLPTDASVSGKPQYMVLVPSLLHTETTEKGCVLLSYLNETVTV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 TVTVHDFPGKKLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQ
...... :.. .... : .. . :.:..: . : . . :.:::. ::
CCDS44 SASLESVRGNRSLFTD----LEAENDVLHCVAFAVPKS----SSNEEVMFLTVQVKGPTQ
70 80 90 100 110
120 130 140 150 160 170
pF1KE3 VVEK--VVLVSLQSGYLFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTV-MVNIENPEG
.: .:.:. ... .:.::::.:: ::.:: .:. ...... :... . .: :..:.:
CCDS44 EFKKRTTVMVKNEDSLVFVQTDKSIYKPGQTVKFRVVSMDENFHPLNELIPLVYIQDPKG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 IPVKQDSLSSQNQLGVLPLSWDIPELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSF
. : . : : . :. .:. . .:..:. . ... . : :.:.:::.:
CCDS44 NRIAQWQ-SFQLEGGLKQFSFPLSSEPFQGSYKVVVQKKSGGRT--EHPFTVEEFVLPKF
180 190 200 210 220
240 250 260 270 280 290
pF1KE3 EVIVEPTEKFYYIYNEKGLEVTITARFLYGKKVEGTAFVIFGIQDGEQRISLPESLKRIP
:: : . :. : .:. ..:.. . . ::: : : . : . . .. :. . .
CCDS44 EVQVT-VPKIITILEEE-MNVSVCGLYTYGKPVPGHVTVSICRKYSDASDCHGEDSQAF-
230 240 250 260 270 280
300 310 320 330 340
pF1KE3 IEDGSGEV----VLSRKVLLDGVQNPRAEDLVGKSLYVSATVILHSGSDMVQAERSGIPI
: ::.. . ..: : : : . .:.. : : . :. . . :.. :
CCDS44 CEKFSGQLNSHGCFYQQVKTKVFQLKRKEYEM--KLHTEAQ-IQEEGTVVELTGRQSSEI
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE3 VTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSPAYRVPVAVQGEDT---VQSLTQGDG
. . .. :.:. ..:. :.:: .: ... : : . ..:... .. :. :
CCDS44 TRTITKLSFVKVDSHFRQGIPFFGQVRLVDGKGVPIPNKVIFIRGNEANYYSNATTDEHG
350 360 370 380 390 400
410 420 430 440 450
pF1KE3 VAKLSINTHPSQKPLSITVRTKKQELS----------EAEQATRTMQALPYSTVGNSNNY
....:::: . :.:::.. .. : : :.: .: : . . :...
CCDS44 LVQFSINT-TNVMGTSLTVRVNYKDRSPCYGYQWVSEEHEEAHHTA----YLVFSPSKSF
410 420 430 440 450
460 470 480 490 500
pF1KE3 LHLSVLRTELRPGETLNV--NFLLRMDRAHEAKIRYYTYLIMNKGRLLKAG------RQV
.:: . :: :.: .: ...: : . :::: :: ....: .:
CCDS44 VHLEPMSHELPCGHTQTVQAHYILNGGTLLGLKKLSFYYLIMAKGGIVRTGTHGLLVKQE
460 470 480 490 500 510
510 520 530 540 550 560
pF1KE3 REPGQDLVVLPLSITTDFIPSFRLVAYYTLIGASGQREVVADSVWVDVKDSCVGSLVVKS
:. . .: . .:. : ::. : .: .: .:..::. :: ..:... : :
CCDS44 DMKGHFSISIP--VKSDIAPVARLLIYAVL--PTG--DVIGDSAKYDV-ENCLANKVDLS
520 530 540 550 560 570
570 580 590 600 610 620
pF1KE3 GQSEDRQPVPGQQMTLKIEGDHGARVVLVAVDKGVFVLNKKNKLTQSKIWDVVEKADIGC
. : .:... :.. . . .: :::..:.... .:. :...... . :.
CCDS44 FSPS--QSLPASHAHLRVTAAPQSVCALRAVDQSVLLMKPDAELSASSVYNLLPEKDLTG
580 590 600 610 620
630 640 650 660 670 680
pF1KE3 TPGSGKDYAGVFSDAGLTFTSSSGQQTAQRAELQCPQPAARRRRSVQLTEKRMDKVGKYP
:: .: ..... .: .. . :. .:: : . .
CCDS44 FPGPLND--------------QDNEDCINRHNVYINGITYTPVSST--NEKDMYSFLE-D
630 640 650 660 670
690 700 710 720 730 740
pF1KE3 KELRKCCEDGMRENPMRFSCQRRTRFISLGEACKKVFLDCCNYITE-LRRQHARASHLGL
:. .. .:. : : . .. : .: . : .. . : ::: :.
CCDS44 MGLKAFTNSKIRKPKM---CPQLQQYEMHGPEGLRVGF----YESDVMGRGHARLVHV--
680 690 700 710 720
750 760 770 780 790 800
pF1KE3 ARSNLDEDIIAEENIVSRSEFPESWLWNVEDLKEPPKNGISTKLMNIFLKDSITTWEILA
:. .: . :. :::.:.: :: . :.. ... . :.:: :. :
CCDS44 ------EEPHTE---TVRKYFPETWIW---DLVVVNSAGVAE--VGVTVPDTITEWKAGA
730 740 750 760
810 820 830 840 850 860
pF1KE3 VSMSDKKGICVADPFEVTVMQDFFIDLRLPYSVVRNEQVEIRAVLYNYRQNQELKVRVEL
.:. :. ... . ..: ::..: .::::.:.: ..:.. :: . ..: :.:
CCDS44 FCLSEDAGLGISSTASLRAFQPFFVELTMPYSVIRGEAFTLKATVLNYLP-KCIRVSVQL
770 780 790 800 810 820
870 880 890 900 910 920
pF1KE3 LHNPAFCSLATTKRRHQQTVTIPPKSSLSVPYVIVPLKTGLQEVEVKAAVYHHFISDGVR
.::: ::. ...: : .. .: ....: . : . :.: . . :..
CCDS44 EASPAF--LAVPVEKEQAPHCICANGRQTVSWAVTPKSLGNVNFTVSAEALESQELCGTE
830 840 850 860 870 880
930 940 950 960 970 980
pF1KE3 KSLKVVPEGIRMNKTVAVRTLDPERLGREGVQKEDIPPA------DLSDQVPDTESETRI
. ::: : . .. ..:: : .: . . . :. .:: ..: . :
CCDS44 --VPSVPEHGRKDTVIKPLLVEPEGLEKETTFNSLLCPSGGEVSEELSLKLPPNVVEESA
890 900 910 920 930 940
990 1000 1010 1020 1030 1040
pF1KE3 LLQGTPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAVHYLDETEQWEKFGLE
. . .... .:. . ..:. : :::::::. ..:.. .. ::.::.: :
CCDS44 RASVSVLGDILGSAM--QNTQNLLQMPYGCGEQNMVLFAPNIYVLDYLNETQQLTP---E
950 960 970 980 990
1050 1060 1070 1080 1090
pF1KE3 KRQGALELIKKGYTQQLAFRQPSSAFAAFVKR----APSTWLTAYVVKVFSLAVNLIAID
.. :. .. :: .:: ... ......: .: .:::::.:.:.:. : : ::
CCDS44 IKSKAIGYLNTGYQRQLNYKHYDGSYSTFGERYGRNQGNTWLTAFVLKTFAQARAYIFID
1000 1010 1020 1030 1040 1050
1100 1110 1120 1130 1140 1150
pF1KE3 SQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAFVLISLQEAKD
. :. :: ..:: .: :. .. .... . ::. : ...:.:.. :.: :
CCDS44 EAHITQALIWLS-QRQKDNGCFRSSGSLLNNAIKGGV----EDEVTLSAYITIALLEIPL
1060 1070 1080 1090 1100 1110
1160 1170 1180 1190 1200
pF1KE3 ICEEQV--NSL-----PGSITKAGDFLEANYMNLQRSYTVAIAGYALAQMGRLKGPLLNK
. : :.: . .. :: : . .:. :.:: . ::. ::.
CCDS44 TVTHPVVRNALFCLESAWKTAQEGDHGSHVYTKALLAYAFALAGNQDKRKEVLKS--LNE
1120 1130 1140 1150 1160 1170
1210 1220 1230 1240 1250
pF1KE3 FLTTAKDKNRWEDPGK------QLYN-------VEATSYALLALLQLK------DFDFVP
. .. .:: : : ..:. :: :::.::: : . :. .
CCDS44 EAVKKDNSVHWERPQKPKAPVGHFYEPQAPSAEVEMTSYVLLAYLTAQPAPTSEDLTSAT
1180 1190 1200 1210 1220 1230
1260 1270 1280 1290 1300
pF1KE3 PVVRWLNEQRYYGGGYGSTQATFMVFQALAQYQKDAPDHQELNLDVSLQLPSR-SSKITH
.:.:...:. ::..::: : ....::..: . . .:..: . :::.
CCDS44 NIVKWITKQQNAQGGFSSTQDTVVALHALSKYGAATFTRTGKAAQVTIQSSGTFSSKF--
1240 1250 1260 1270 1280 1290
1310 1320 1330 1340 1350 1360
pF1KE3 RIHWESASLLRSEETKENEG-FTVTAEGKGQGTLSVVTMYHAKAKDQLTCNKFDLKVTIK
.. .. ::.. : : ... . :.: :.. :. . . .: . . ..
CCDS44 QVDNNNRLLLQQVSLPELPGEYSMKVTGEGCVYLQTSLKYNILPEKE----EFPFALGVQ
1300 1310 1320 1330 1340
1370 1380 1390 1400 1410 1420
pF1KE3 PAPETEKRPQDAKNTMILEICTRYRGDQDAT-MSILDISMMTGFAPDTDDLKQLANGVDR
:.: .:. :.... . . . : :...:. :.:.:..:..:: : .:.: .
CCDS44 TLPQTCDEPK-AHTSFQISLSVSYTGSRSASNMAIVDVKMVSGFIPLKPTVKMLER--SN
1350 1360 1370 1380 1390 1400
1430 1440 1450 1460 1470 1480
pF1KE3 YISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELIQPGAVKVYAYYNLEE
..:. :... : ..:::::::. . : : : : :. ..:. :::: ::. .:
CCDS44 HVSRTEVSS-----NHVLIYLDKVSN-QTLSLFFTVLQDVPVRDLKPAIVKVYDYYETDE
1410 1420 1430 1440 1450
1490 1500 1510 1520 1530 1540
pF1KE3 SCTRFYH-PEKEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDKACEPGVDYVYK
:. : ..:
CCDS44 FAIAEYNAPCSKDLGNA
1460 1470
1663 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:13:47 2016 done: Sun Nov 6 09:13:48 2016
Total Scan time: 5.980 Total Display time: 1.160
Function used was FASTA [36.3.4 Apr, 2011]