FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2518, 1456 aa
1>>>pF1KE2518 1456 - 1456 aa - 1456 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3489+/-0.00108; mu= 24.0988+/- 0.066
mean_var=90.3946+/-18.423, 0's: 0 Z-trim(105.6): 143 B-trim: 219 in 1/49
Lambda= 0.134897
statistics sampled from 8373 (8532) to 8373 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.262), width: 16
Scan time: 4.200
The best scores are: opt bits E(32554)
CCDS7123.2 MRC1 gene_id:4360|Hs108|chr10 (1456) 10319 2019.7 0
CCDS33309.1 PLA2R1 gene_id:22925|Hs108|chr2 (1463) 2327 464.4 1.1e-129
CCDS42767.1 PLA2R1 gene_id:22925|Hs108|chr2 (1324) 2256 450.5 1.5e-125
CCDS11634.1 MRC2 gene_id:9902|Hs108|chr17 (1479) 2251 449.6 3.2e-125
CCDS2211.1 LY75 gene_id:4065|Hs108|chr2 (1722) 1480 299.6 5.3e-80
CCDS56140.1 CD302 gene_id:100526664|Hs108|chr2 (1817) 1480 299.6 5.5e-80
CCDS56141.1 CD302 gene_id:100526664|Hs108|chr2 (1873) 1480 299.6 5.6e-80
CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321) 357 80.9 2.7e-14
CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 ( 911) 337 76.9 3.1e-13
CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530) 332 76.3 1.3e-12
CCDS47242.1 VCAN gene_id:1462|Hs108|chr5 ( 655) 320 73.5 2.4e-12
CCDS54875.1 VCAN gene_id:1462|Hs108|chr5 (1642) 320 73.8 4.6e-12
CCDS54876.1 VCAN gene_id:1462|Hs108|chr5 (2409) 320 74.0 6.1e-12
CCDS4060.1 VCAN gene_id:1462|Hs108|chr5 (3396) 320 74.1 7.8e-12
CCDS53971.1 ACAN gene_id:176|Hs108|chr15 (2431) 317 73.4 9.2e-12
>>CCDS7123.2 MRC1 gene_id:4360|Hs108|chr10 (1456 aa)
initn: 10319 init1: 10319 opt: 10319 Z-score: 10847.5 bits: 2019.7 E(32554): 0
Smith-Waterman score: 10319; 99.7% identity (99.9% similar) in 1456 aa overlap (1-1456:1-1456)
10 20 30 40 50 60
pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAESQKFRW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAESQKFRW
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 VSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGEDLFFNYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 VSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGEDLFFNYG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 NRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKFENKWYA
:::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::
CCDS71 NRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGATCAFPFKFENKWYA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 DCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSESLWNKDPLTSVSYQINSKSALTW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 DCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSESLWNKDPLTSVSYQINSKSALTW
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 HQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWSDRSPFRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 HQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWSDRSPFRY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 LNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKKGNTTLNSFVIPSESDVPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 LNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKKGNTTLNSFVIPSESDVPT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 HCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFIISQLGYEPND
:::::::::::::::::::::::::::::::::::.::.:::::::.:::::::::::::
CCDS71 HCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGGDLTSIHTIEELDFIISQLGYEPND
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 ELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGKDGYWADRGCEW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGKDGYWADRGCEW
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 PLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCYMIGHTLSTFAEANQTCNNENAYLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 PLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCYMIGHTLSTFAEANQTCNNENAYLT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 TIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 TIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGC
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 VAMRTGIAGGLWDVLKCDEKAKFVCKHWAEGVTHPPKPTTTPEPKCPEDWGASSRTSLCF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 VAMRTGIAGGLWDVLKCDEKAKFVCKHWAEGVTHPPKPTTTPEPKCPEDWGASSRTSLCF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 KLYAKGKHEKKTWFESRDFCRALGGDLASINNKEEQQTIWRLITASGSYHKLFWLGLTYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 KLYAKGKHEKKTWFESRDFCRALGGDLASINNKEEQQTIWRLITASGSYHKLFWLGLTYG
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 SPSEGFTWSDGSPVSYENWAYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 SPSEGFTWSDGSPVSYENWAYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 KGQTPKPEPTPAPQDNPPVTEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 KGQTPKPEPTPAPQDNPPVTEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 ESEKKFLWKYVNRNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ESEKKFLWKYVNRNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCV
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 TMYSNSGFWNDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 TMYSNSGFWNDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 GFMEEERKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 GFMEEERKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTF
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 LWTDGRGVHYTNWGKGYPGGRRSSLSYEDADCVVIIGGASNEAGKWMDDTCDSKRGYICQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 LWTDGRGVHYTNWGKGYPGGRRSSLSYEDADCVVIIGGASNEAGKWMDDTCDSKRGYICQ
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 TRSDPSLTNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 TRSDPSLTNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNA
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 FAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 FAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWK
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 TAHCNESFYFLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 TAHCNESFYFLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQAS
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 LECLRMGSSLVSIESAAESSFLSYRVEPLKSKTNFWIGLFRNVEGTWLWINNSPVSFVNW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 LECLRMGSSLVSIESAAESSFLSYRVEPLKSKTNFWIGLFRNVEGTWLWINNSPVSFVNW
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 NTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 NTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMD
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 PSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 PSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSD
1390 1400 1410 1420 1430 1440
1450
pF1KE2 MKDLVGNIEQNEHSVI
::::::::::::::::
CCDS71 MKDLVGNIEQNEHSVI
1450
>>CCDS33309.1 PLA2R1 gene_id:22925|Hs108|chr2 (1463 aa)
initn: 952 init1: 304 opt: 2327 Z-score: 2441.6 bits: 464.4 E(32554): 1.1e-129
Smith-Waterman score: 2430; 29.2% identity (58.8% similar) in 1494 aa overlap (8-1453:23-1463)
10 20 30 40
pF1KE2 MRLPLLLVFASVIPGAVL-LLDTRQFLIYNEDHKRCVDAVSPSAV
: :.. : .: : :.: .:. :.:..: . :..
CCDS33 MLLSPSLLLLLLLGAPRGCAEGVAAALTPERLLEWQDKGIFVIQSESLKKCIQA-GKSVL
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 QTAACNQDAESQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKN
:.: . . ..:::. ..... . :::. .. ..:: ::: .:.:.
CCDS33 TLENCKQANKHMLWKWVSNHGLFNIGGSGCLGLNFSAPEQPLSLYECDSTLVSLRWRCNR
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 DTLLGIKGEDLFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTD-NLCSRGYEAMYTLLGNA
. : ..:. . .. . . .: ::. ..: .. ..:. ::.
CCDS33 KMITGP------LQYSVQVAHDNTVVASRKYIHKWISYGSGGGDICEYLHKDLHTIKGNT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 NGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE---GSESLW
.: : :::.....:. .:: :: : :::.::. :. :. .:.:: : ...:
CCDS33 HGMPCMFPFQYNHQWHHECTREGREDDLLWCATTSRYERDEKWGFCPDPTSAEVGCDTIW
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 NKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIG
.:: . . ::.: :.:.: .:..:::.:.. :::::. :.... :: : .:.:
CCDS33 EKDLNSHICYQFNLLSSLSWSEAHSSCQMQGGTLLSITDETEENFIREHMSSKTVEVWMG
240 250 260 270 280 290
290 300 310 320 330
pF1KE2 LNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGY
::.:. ..:::::: .:. :::: : . :: : ... . :.. .: . : :
CCDS33 LNQLDEHAGWQWSDGTPLNYLNWSP-EVNFEPFVEDHCGTFSSFMPSAWRSRDCESTLPY
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE2 ICKKGNTTLNSFVIPSES--DVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS
:::: . .. .. ... ::: : :: .:::....:: ..:: .:. ..:
CCDS33 ICKKYLNHIDHEIVEKDAWKYYATHCEPGWNPYNRNCYKLQKEEKT-WHEALRSCQADNS
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE
: .: .. : .:... :: : .: ::::.. :: . ::::. . : ::.: ::
CCDS33 ALIDITSLAEVEFLVTLLGDENASETWIGLSSNKIPVSFEWSNDSSVIFTNWHTLEPHIF
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCY
::.. :: . ..:.: ..:: : :::: . : . ..:.::..::..: .::
CCDS33 PNRSQLCVSAEQSEGHWKVKNCEERLFYICK----KAGHVLSDAESGCQEGWERHGGFCY
480 490 500 510 520
520 530 540 550 560 570
pF1KE2 MIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGL---RPEKYFWTGLSDIQTK
: .: .: .:.. : :.:: .:.::::.::... ..::: .:.: .
CCDS33 KIDTVLRSFDQASSGYYCPPA-LVTITNRFEQAFITSLISSVVKMKDSYFWIALQDQNDT
530 540 550 560 570 580
580 590 600 610 620
pF1KE2 GTFQWTI----EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHW
: . : : :..::::. .: . :::::: : :.: .: . :: .::.
CCDS33 GEYTWKPVGQKPEPVQYTHWNTHQPRYSGGCVAMRGRHPLGRWEVKHCRHFKAMSLCKQP
590 600 610 620 630 640
630 640 650 660 670 680
pF1KE2 AEGVTHPPKPTTTPEPKCPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDL
.:. . : : :: . . :::.. . : :.:: :.. ::. .:. :
CCDS33 VENQEKAEYEERWPFHPCYLDWESEPGLASCFKVFHSEKVLMKRTWREAEAFCEEFGAHL
650 660 670 680 690 700
690 700 710 720 730 740
pF1KE2 ASINNKEEQQTIWRLITASGSY--HKLFWLGLTYGSP-SEG-FTWSDGSPV--SY-ENWA
::. . ::.. . .:. .. .. .. ::.:.. .: . : . ::: .:: :. .:
CCDS33 ASFAHIEEENFVNELLHSKFNWTEERQFWIGFNKRNPLNAGSWEWSDRTPVVSSFLDNTY
710 720 730 740 750 760
750 760 770 780 790 800
pF1KE2 YGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPVT
.:: ... :. :.. :. ..: .:::.: . :: : : :
CCDS33 FGE-----DARNCAVYKANKTLL--PLHCGSKREWICKIPRDVKPKI-PFWYQYDVP---
770 780 790 800 810
810 820 830 840 850
pF1KE2 EDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNRNDAQSA-
:..:.: .: : : . :. .::..:.: :..:. . .. . .:
CCDS33 ---WLFYQDAEYLFHTFASEWLNFEFVCSWLHSDLLTIHSAHEQEFIHSKIKALSKYGAS
820 830 840 850 860 870
860 870 880 890 900 910
pF1KE2 YFIGLLIS-LDKKFAWMDGSKVDYVSWATG-EPNFANEDENCVTMYSNSGFWNDINCGYP
..::: . .: : ::. : : .: :: : . :... : . : .:.:.. .:.
CCDS33 WWIGLQEERANDEFRWRDGTPVIYQNWDTGRERTVNNQSQRCGFISSITGLWGSEECSVS
880 890 900 910 920 930
920 930 940 950 960 970
pF1KE2 NAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEER--KNWQEARK
::.:.. . :. . : .:: ... ::. .... .. ::: .:..
CCDS33 MPSICKRKK--VWLIEKKKDTPKQHGTCPKGWLYFNYKCL-LLNIPKDPSSWKNWTHAQH
940 950 960 970 980
980 990 1000 1010 1020 1030
pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK
: ::.::.:..: ::::.:... .: :.: ::.. . : : .:. : :.::.
CCDS33 FCAEEGGTLVAIESEVEQAFITMNLFGQTTSVWIGLQNDDYE---TWLNGKPVVYSNWSP
990 1000 1010 1020 1030 1040
1040 1050 1060 1070 1080
pF1KE2 ----GYPGGRRSSLSYEDADCVVIIGGAS-NEAGKWMDDTCDSK-RGYICQTRSDPSL--
. :. . .. . :... .. . . .:::. . : .. :..:. .: :
CCDS33 FDIINIPSHNTTEVQKHIPLCALLSSNPNFHFTGKWYFEDCGKEGYGFVCEKMQDTSGHG
1050 1060 1070 1080 1090 1100
1090 1100 1110 1120 1130 1140
pF1KE2 TNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQME
.: . ..::. .:... .. :. : : .:.. ..:: : : ..: . ..
CCDS33 VNTSDMYPMPNTLEYGNRTYKIINANMTWYAAIKTCLMHKAQLVSITDQYHQSFLTVVLN
1110 1120 1130 1140 1150 1160
1150 1160 1170 1180 1190 1200
pF1KE2 TSNERVWIALNSNLTDN--QYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCN
. ::.: . ::: .. :.: . .: : .: .: . ::. : .: :... :
CCDS33 RLGYAHWIGLFT--TDNGLNFDWSDGTKSSFTFWKDEESSLLGDCVFADSNGRWHSTAC-
1170 1180 1190 1200 1210 1220
1210 1220 1230 1240 1250 1260
pF1KE2 ESFY--FLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQASLE-
::: .:. : .: :.: : :.. :: :...:: . . .:. :
CCDS33 ESFLQGAICHVPPETRQSEHPEL---CSETS-IPWIKFKSNCYSFSTVLDSMSFEAAHEF
1230 1240 1250 1260 1270
1270 1280 1290 1300 1310 1320
pF1KE2 CLRMGSSLVSIESAAESSFLSYRVEPLKSKTNF-WIGL-FRNVEGTWLWINNSPVSFVNW
: . ::.:..:.. ::..:: .. . :.... :.. : . . : :....:.. ::
CCDS33 CKKEGSNLLTIKDEAENAFLLEELFAFGSSVQMVWLNAQFDGNNETIKWFDGTPTDQSNW
1280 1290 1300 1310 1320 1330
1330 1340 1350 1360 1370
pF1KE2 NTGDPSGER---NDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTR
. :. . . ::::. :.:. :. ::.::: : : : : :.
CCDS33 GIRKPDTDYFKPHHCVALRIPEGLWQLSPCQEKKGFICKMEADIH---TAEALPEKG---
1340 1350 1360 1370 1380 1390
1380 1390 1400 1410 1420 1430
pF1KE2 KMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPG
:: .. ..... :..... .. .::. . . ..:.: : .. :
CCDS33 ------PSHSIIPLAVVLTLIVIVAICTLSFCIYKHNGGFFRRLAGFRNPYYPATNFSTV
1400 1410 1420 1430 1440
1440 1450
pF1KE2 TSDMKDLVGNIEQNEHSVI
. . :....:....
CCDS33 YLEENILISDLEKSDQ
1450 1460
>>CCDS42767.1 PLA2R1 gene_id:22925|Hs108|chr2 (1324 aa)
initn: 952 init1: 304 opt: 2256 Z-score: 2367.5 bits: 450.5 E(32554): 1.5e-125
Smith-Waterman score: 2286; 30.1% identity (59.4% similar) in 1334 aa overlap (8-1297:23-1315)
10 20 30 40
pF1KE2 MRLPLLLVFASVIPGAVL-LLDTRQFLIYNEDHKRCVDAVSPSAV
: :.. : .: : :.: .:. :.:..: . :..
CCDS42 MLLSPSLLLLLLLGAPRGCAEGVAAALTPERLLEWQDKGIFVIQSESLKKCIQA-GKSVL
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 QTAACNQDAESQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKN
:.: . . ..:::. ..... . :::. .. ..:: ::: .:.:.
CCDS42 TLENCKQANKHMLWKWVSNHGLFNIGGSGCLGLNFSAPEQPLSLYECDSTLVSLRWRCNR
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 DTLLGIKGEDLFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTD-NLCSRGYEAMYTLLGNA
. : ..:. . .. . . .: ::. ..: .. ..:. ::.
CCDS42 KMITGP------LQYSVQVAHDNTVVASRKYIHKWISYGSGGGDICEYLHKDLHTIKGNT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 NGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE---GSESLW
.: : :::.....:. .:: :: : :::.::. :. :. .:.:: : ...:
CCDS42 HGMPCMFPFQYNHQWHHECTREGREDDLLWCATTSRYERDEKWGFCPDPTSAEVGCDTIW
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 NKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIG
.:: . . ::.: :.:.: .:..:::.:.. :::::. :.... :: : .:.:
CCDS42 EKDLNSHICYQFNLLSSLSWSEAHSSCQMQGGTLLSITDETEENFIREHMSSKTVEVWMG
240 250 260 270 280 290
290 300 310 320 330
pF1KE2 LNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGY
::.:. ..:::::: .:. :::: : . :: : ... . :.. .: . : :
CCDS42 LNQLDEHAGWQWSDGTPLNYLNWSP-EVNFEPFVEDHCGTFSSFMPSAWRSRDCESTLPY
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE2 ICKKGNTTLNSFVIPSES--DVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS
:::: . .. .. ... ::: : :: .:::....:: ..:: .:. ..:
CCDS42 ICKKYLNHIDHEIVEKDAWKYYATHCEPGWNPYNRNCYKLQKEEKT-WHEALRSCQADNS
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE
: .: .. : .:... :: : .: ::::.. :: . ::::. . : ::.: ::
CCDS42 ALIDITSLAEVEFLVTLLGDENASETWIGLSSNKIPVSFEWSNDSSVIFTNWHTLEPHIF
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKKHHFYCY
::.. :: . ..:.: ..:: : :::: . : . ..:.::..::..: .::
CCDS42 PNRSQLCVSAEQSEGHWKVKNCEERLFYICK----KAGHVLSDAESGCQEGWERHGGFCY
480 490 500 510 520
520 530 540 550 560 570
pF1KE2 MIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGL---RPEKYFWTGLSDIQTK
: .: .: .:.. : :.:: .:.::::.::... ..::: .:.: .
CCDS42 KIDTVLRSFDQASSGYYCPPA-LVTITNRFEQAFITSLISSVVKMKDSYFWIALQDQNDT
530 540 550 560 570 580
580 590 600 610 620
pF1KE2 GTFQWTI----EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHW
: . : : :..::::. .: . :::::: : :.: .: . :: .::.
CCDS42 GEYTWKPVGQKPEPVQYTHWNTHQPRYSGGCVAMRGRHPLGRWEVKHCRHFKAMSLCKQP
590 600 610 620 630 640
630 640 650 660 670 680
pF1KE2 AEGVTHPPKPTTTPEPKCPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDL
.:. . : : :: . . :::.. . : :.:: :.. ::. .:. :
CCDS42 VENQEKAEYEERWPFHPCYLDWESEPGLASCFKVFHSEKVLMKRTWREAEAFCEEFGAHL
650 660 670 680 690 700
690 700 710 720 730 740
pF1KE2 ASINNKEEQQTIWRLITASGSY--HKLFWLGLTYGSP-SEG-FTWSDGSPV--SY-ENWA
::. . ::.. . .:. .. .. .. ::.:.. .: . : . ::: .:: :. .:
CCDS42 ASFAHIEEENFVNELLHSKFNWTEERQFWIGFNKRNPLNAGSWEWSDRTPVVSSFLDNTY
710 720 730 740 750 760
750 760 770 780 790 800
pF1KE2 YGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPVT
.:: ... :. :.. :. ..: .:::.: . :: : : :
CCDS42 FGE-----DARNCAVYKANKTLL--PLHCGSKREWICKIPRDVKPKI-PFWYQYDVP---
770 780 790 800 810
810 820 830 840 850
pF1KE2 EDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNRNDAQSA-
:..:.: .: : : . :. .::..:.: :..:. . .. . .:
CCDS42 ---WLFYQDAEYLFHTFASEWLNFEFVCSWLHSDLLTIHSAHEQEFIHSKIKALSKYGAS
820 830 840 850 860 870
860 870 880 890 900 910
pF1KE2 YFIGLLIS-LDKKFAWMDGSKVDYVSWATG-EPNFANEDENCVTMYSNSGFWNDINCGYP
..::: . .: : ::. : : .: :: : . :... : . : .:.:.. .:.
CCDS42 WWIGLQEERANDEFRWRDGTPVIYQNWDTGRERTVNNQSQRCGFISSITGLWGSEECSVS
880 890 900 910 920 930
920 930 940 950 960 970
pF1KE2 NAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEER--KNWQEARK
::.:.. . :. . : .:: ... ::. .... .. ::: .:..
CCDS42 MPSICKRKK--VWLIEKKKDTPKQHGTCPKGWLYFNYKCL-LLNIPKDPSSWKNWTHAQH
940 950 960 970 980
980 990 1000 1010 1020 1030
pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK
: ::.::.:..: ::::.:... .: :.: ::.. . : : .:. : :.::.
CCDS42 FCAEEGGTLVAIESEVEQAFITMNLFGQTTSVWIGLQNDDYE---TWLNGKPVVYSNWSP
990 1000 1010 1020 1030 1040
1040 1050 1060 1070 1080
pF1KE2 ----GYPGGRRSSLSYEDADCVVIIGGAS-NEAGKWMDDTCDSK-RGYICQTRSDPSL--
. :. . .. . :... .. . . .:::. . : .. :..:. .: :
CCDS42 FDIINIPSHNTTEVQKHIPLCALLSSNPNFHFTGKWYFEDCGKEGYGFVCEKMQDTSGHG
1050 1060 1070 1080 1090 1100
1090 1100 1110 1120 1130 1140
pF1KE2 TNPPATIQTDGFVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQME
.: . ..::. .:... .. :. : : .:.. ..:: : : ..: . ..
CCDS42 VNTSDMYPMPNTLEYGNRTYKIINANMTWYAAIKTCLMHKAQLVSITDQYHQSFLTVVLN
1110 1120 1130 1140 1150 1160
1150 1160 1170 1180 1190 1200
pF1KE2 TSNERVWIALNSNLTDN--QYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCN
. ::.: . ::: .. :.: . .: : .: .: . ::. : .: :... :
CCDS42 RLGYAHWIGLFT--TDNGLNFDWSDGTKSSFTFWKDEESSLLGDCVFADSNGRWHSTAC-
1170 1180 1190 1200 1210 1220
1210 1220 1230 1240 1250 1260
pF1KE2 ESFY--FLCKRSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYIESSYTRNWGQASLE-
::: .:. : .: :.: : :.. :: :...:: . . .:. :
CCDS42 ESFLQGAICHVPPETRQSEHPEL---CSETS-IPWIKFKSNCYSFSTVLDSMSFEAAHEF
1230 1240 1250 1260 1270
1270 1280 1290 1300 1310 1320
pF1KE2 CLRMGSSLVSIESAAESSFLSYRVEPLKSKTNF-WIGLFRNVEGTWLWINNSPVSFVNWN
: . ::.:..:.. ::..:: .. . :.... :.
CCDS42 CKKEGSNLLTIKDEAENAFLLEELFAFGSSVQMVWLNAQFDGNSK
1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 TGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKPTHELLTTKADTRKMDP
>>CCDS11634.1 MRC2 gene_id:9902|Hs108|chr17 (1479 aa)
initn: 1870 init1: 917 opt: 2251 Z-score: 2361.6 bits: 449.6 E(32554): 3.2e-125
Smith-Waterman score: 3190; 33.5% identity (64.2% similar) in 1482 aa overlap (14-1453:33-1477)
10 20 30 40
pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSA
:: . : . :::... . :..: . ..
CCDS11 PGRPAPAPWPRHLLRCVLLLGCLHLGRPGAPGDAALPEPNVFLIFSHGLQGCLEAQGGQV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 VQTAACNQDAESQKFRWVSESQIMSVAFKLCLGV--PSKTDWVAITLYACDSKSEFQKWE
: ::: . .:...:::........ :::. :. . ... .: :: .. .:.
CCDS11 RVTPACNTSLPAQRWKWVSRNRLFNLGTMQCLGTGWPGTNTTASLGMYECDREALNLRWH
70 80 90 100 110 120
110 120 130 140 150
pF1KE2 CKNDTLLGIKGEDLFFNYGNRQE---KNIMLYKGSGLWS-RWKIYGTTDNLCSRGYEAMY
:. :: :..: . : : : : .:. : .:.:::. ..::. :. .:
CCDS11 CR--TL----GDQLSLLLGARTSNISKPGTLERGDQTRSGQWRIYGSEEDLCALPYHEVY
130 140 150 160 170
160 170 180 190 200 210
pF1KE2 TLLGNANGAICAFPFKFENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFEGSE
:. ::..: :..:::..:.:. :::.:: :: :::.:: :: :. .:.::.: . :
CCDS11 TIQGNSHGKPCTIPFKYDNQWFHGCTSTGREDGHLWCATTQDYGKDERWGFCPIKSNDCE
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE2 SLWNKDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGL
..:.:: ::. ::.: .:.:.:..: ::.::.:.::::::::::::..:: .. .: :
CCDS11 TFWDKDQLTDSCYQFNFQSTLSWREAWASCEQQGADLLSITEIHEQTYINGLLTGYSSTL
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE2 WIGLNSLSFNSGWQWSDRSPFRYLNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLG
:::::.:. ..:::::: ::..:::: .:. ..: . ... :.: .: :
CCDS11 WIGLNDLDTSGGWQWSDNSPLKYLNWESDQPDNPSEENCGVIRTESSGGWQNRDCSIALP
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE2 YICKKGNTTLNSFVIPSE-SDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS
:.::: .. . :.. ..: ..: .: :. ::::... ::. ... .: . :.
CCDS11 YVCKKKPNATAEPTPPDRWANVKVECEPSWQPFQGHCYRLQA-EKRSWQESKKACLRGGG
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE
::.:::.. :..:: .:. : .::::::::.:.:: ::::::. :.::.: ::..
CCDS11 DLVSIHSMAELEFITKQIKQEV-EELWIGLNDLKLQMNFEWSDGSLVSFTHWHPFEPNNF
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE2 NNRQEDCVVMKGKDGYWADRGCEWPLGYICKMKSR-SQGPEIVEVEKGCRKGWKKHHFYC
. ::::.. : .: : : :. : ::: .. ::: .: ..:::::: : :
CCDS11 RDSLEDCVTIWGPEGRWNDSPCNQSLPSICKKAGQLSQG--AAEEDHGCRKGWTWHSPSC
480 490 500 510 520 530
520 530 540 550 560 570
pF1KE2 YMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSDIQTKGT
: .:. :..:: . :..... :.:: .:.::::..:.. .::::.:.:... :.
CCDS11 YWLGEDQVTYSEARRLCTDHGSQLVTITNRFEQAFVSSLIYNWEGEYFWTALQDLNSTGS
540 550 560 570 580 590
580 590 600 610 620 630
pF1KE2 FQWTIEEEVRFTHWNSDMPGR-KPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVT
: : .:: .:::: :.:: . ::::. :: : :::.: .: .:...:.. .
CCDS11 FFWLSGDEVMYTHWNRDQPGYSRGGCVALATGSAMGLWEVKNCTSFRARYICRQSLGTPV
600 610 620 630 640 650
640 650 660 670 680
pF1KE2 HPPKPTTTPEPK----CPEDWGASSRTSLCFKLYAKGK-HEKKTWFESRDFCRALGGDLA
: : : :. ::. :..... :.:.... . ..::.: ... :. ::..:
CCDS11 TPELPGPDPTPSLTGSCPQGWASDTKLRYCYKVFSSERLQDKKSWVQAQGACQELGAQLL
660 670 680 690 700 710
690 700 710 720 730
pF1KE2 SINNKEEQQTIWRLIT-----ASGSYHKL--FWLGLTYGSPSEG--FTWSDGSPVSYENW
:. . ::.. . ... . :. ::.::. .: : . :::: ::.:.
CCDS11 SLASYEEEHFVANMLNKIFGESEPEIHEQHWFWIGLNRRDPRGGQSWRWSDGVGFSYHNF
720 730 740 750 760 770
740 750 760 770 780 790
pF1KE2 AYGEPNNYQNVEYCGELKGDPTMSWNDINCEHLNNWICQIQKGQTPKPEPTPAPQDNPPV
.. .. .... :. : ...: ..:. .:::.: .: : :: .::
CCDS11 DRSRHDD-DDIRGCAVLDL-ASLQWVAMQCDTQLDWICKIPRG-TDVREPDDSPQG----
780 790 800 810 820
800 810 820 830 840 850
pF1KE2 TEDGWVIYKDYQYYFSKEKETMDNARAFCKRNFGDLVSIQSESEKKFLWKYVNR-NDAQS
. :. ... .: : ... : .:. .: ..:.:..:..: :: . ... . ::
CCDS11 -RREWLRFQEAEYKFFEHHSTWAQAQRICTWFQAELTSVHSQAELDFLSHNLQKFSRAQE
830 840 850 860 870 880
860 870 880 890 900 910
pF1KE2 AYF-IGLLISL-DKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFWNDINCGY
.. ::: : : .: : ::: ....::: :.: ...:..:: : .. :.: :
CCDS11 QHWWIGLHTSESDGRFRWTDGSIINFISWAPGKPRPVGKDKKCVYMTASREDWGDQRCLT
890 900 910 920 930 940
920 930 940 950 960 970
pF1KE2 PNAFICQRHNSSINATTVMPTMPSVP-SGCKEGWNFYSNKCFKIFGFMEEERKNWQEARK
.::.: : .. : : .:.. .:: : . ::::.. : . : .:.::.
CCDS11 ALPYICKRSN--VTKETQPPDLPTTALGGCPSDWIQFLNKCFQVQGQEPQSRVKWSEAQF
950 960 970 980 990 1000
980 990 1000 1010 1020 1030
pF1KE2 ACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGRGVHYTNWGK
.: ..::.: : ::::.: . . ::. : ::. :.. : :.. . . :.::.
CCDS11 SCEQQEAQLVTITNPLEQAFITASLPNVTFDLWIGLH--ASQRDFQWVEQEPLMYANWAP
1010 1020 1030 1040 1050 1060
1040 1050 1060 1070 1080 1090
pF1KE2 GYPGGRRSSLS-YEDADCVVIIGGASNE-AGKWMDDTC-DSKRGYICQTRSDPSLTNPPA
: :.: . : . ..:.:.. . : . .:.: : .: . .:.::: .::::. ::
CCDS11 GEPSGPSPAPSGNKPTSCAVVLHSPSAHFTGRWDDRSCTEETHGFICQKGTDPSLSPSPA
1070 1080 1090 1100 1110 1120
1100 1110 1120 1130 1140 1150
pF1KE2 TIQ-TDGF-VKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPYSNAFAWLQMETSN
.. . : ..: .... :... ..::.: :. .:. .: . :::..:: .
CCDS11 ALPPAPGTELSYLNGTFRLLQKPLRWHDALLLCESRNASLAYVPDPYTQAFLTQAARGLR
1130 1140 1150 1160 1170 1180
1160 1170 1180 1190 1200
pF1KE2 ERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDGYWKTAHCNESFY-
.::.: .. . .:.:... . :..: ::. ..:.:.:.:: :.:. :. ..
CCDS11 TPLWIGLAGEEGSRRYSWVSEEPLNYVGWQDGEPQQPGGCTYVDVDGAWRTTSCDTKLQG
1190 1200 1210 1220 1230 1240
1210 1220 1230 1240 1250 1260
pF1KE2 FLCKRSDEIPATEPPQLPGRCPES-DHTAWIPFHGHCYYIESSYTRNWGQASLECLRMGS
.: :. : . . : ::.. .:::::. ::: .. . .: .: : :.
CCDS11 AVCGVSSGPPPPRRISYHGSCPQGLADSAWIPFREHCYSFHMELLLGHKEARQRCQRAGG
1250 1260 1270 1280 1290 1300
1270 1280 1290 1300 1310 1320
pF1KE2 SLVSIESAAESSFLSYRVEPLKSKT-NFWIGL-FRNVEGTWLWINNSPVSFVNWNT---G
...:: . :. :. ... .... . :.:. : :: .: .:. :.. ::. :
CCDS11 AVLSILDEMENVFVWEHLQSYEGQSRGAWLGMNFNPKGGTLVWQDNTAVNYSNWGPPGLG
1310 1320 1330 1340 1350 1360
1330 1340 1350 1360 1370 1380
pF1KE2 DPSGERNDCVALHASSGFWSNIHCSSYK-GYICKRPKIIDAKPTHELLTTKADTRKMDPS
.:.: ....::.: :.. : .:: :. :. ...::
CCDS11 PSMLSHNSCYWIQSNSGLWRPGACTNITMGVVCKLPR--------------AEQSSFSPS
1370 1380 1390 1400
1390 1400 1410 1420 1430 1440
pF1KE2 KPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSDMK
: :..:.... ..: : :.: .. .:: . ..::::.. : :.::: . :
CCDS11 ALPENPAALVVVLMAVLLLLALLTAALILYRRRQSI-ERGAFEGARYSRSSSSPTEATEK
1410 1420 1430 1440 1450 1460
1450
pF1KE2 D-LVGNIEQNEHSVI
. ::...:.::.
CCDS11 NILVSDMEMNEQQE
1470
>>CCDS2211.1 LY75 gene_id:4065|Hs108|chr2 (1722 aa)
initn: 1268 init1: 376 opt: 1480 Z-score: 1549.8 bits: 299.6 E(32554): 5.3e-80
Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358)
10 20 30 40 50
pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE
: : . . .:. : : :.. .:
CCDS22 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED
.. ..:::. ... . . :::. . . ...::: : . :.:.. .: :
CCDS22 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF
: .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: .
CCDS22 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN
.. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.:
CCDS22 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS
...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.::
CCDS22 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF
:..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:..
CCDS22 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI
. . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . .
CCDS22 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV
360 370 380 390 400
420 430 440 450 460
pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK
...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :.
CCDS22 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE
: : ..:: : :.:: :... . . .: : .:::.: :: : . :.
CCDS22 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI----
.:: :: .:.:: .:.... . ::::::: :... : ..:.
CCDS22 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR
530 540 550 560 570
590 600 610 620 630
pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT
.. : :..:: :. ::::: :: . : :.: : :: .::. . : : . .
CCDS22 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS
580 590 600 610 620 630
640 650 660 670 680 690
pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT
:. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: .
CCDS22 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE
640 650 660 670 680 690
700 710 720 730 740 750
pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC
. ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... :
CCDS22 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC
700 710 720 730 740 750
760 770 780 790
pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD
. .: : .:. . :. .:.::: ::.::: :. : :
CCDS22 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH
760 770 780 790 800 810
800 810 820 830 840 850
pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN-
.::. .: .:.: . . ....: .: : . :..: : . : . : .:
CCDS22 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI
820 830 840 850 860
860 870 880 890 900
pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW---
.:.:. .. .: .:.. . : .:..: : .: .. :
CCDS22 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID
870 880 890 900 910
910 920 930 940 950 960
pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE
. .:. :::...: : . : .. :.: : ..:::: :: .
CCDS22 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV
920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR
....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.:
CCDS22 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070
pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI--
. :.:. .:: : .. . . :..:.. : .: : .: :.: ..
CCDS22 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120 1130
pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY
:: :. .. :.:. . ::: .. :... . . :: :. : : ..:: :::
CCDS22 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY
1090 1100 1110 1120 1130 1140
1140 1150 1160 1170 1180 1190
pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG
..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: ::
CCDS22 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230 1240 1250
pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR
.:::. ::.. .: : .: : .:: .: ::::.. :: . . .:
CCDS22 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300
pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG
. . .. : : ... : ..::.. :..:. .. .. .. :. : .::
CCDS22 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K
1270 1280 1290 1300 1310 1320
1310 1320 1330 1340 1350 1360
pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP
. .:....:.:...: .: :. . . .: ...:::
CCDS22 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK
1330 1340 1350 1360 1370 1380
1370 1380 1390 1400 1410 1420
pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE
CCDS22 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL
1390 1400 1410 1420 1430 1440
>>CCDS56140.1 CD302 gene_id:100526664|Hs108|chr2 (1817 aa)
initn: 1268 init1: 376 opt: 1480 Z-score: 1549.5 bits: 299.6 E(32554): 5.5e-80
Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358)
10 20 30 40 50
pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE
: : . . .:. : : :.. .:
CCDS56 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED
.. ..:::. ... . . :::. . . ...::: : . :.:.. .: :
CCDS56 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF
: .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: .
CCDS56 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN
.. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.:
CCDS56 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS
...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.::
CCDS56 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF
:..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:..
CCDS56 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI
. . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . .
CCDS56 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV
360 370 380 390 400
420 430 440 450 460
pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK
...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :.
CCDS56 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE
: : ..:: : :.:: :... . . .: : .:::.: :: : . :.
CCDS56 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI----
.:: :: .:.:: .:.... . ::::::: :... : ..:.
CCDS56 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR
530 540 550 560 570
590 600 610 620 630
pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT
.. : :..:: :. ::::: :: . : :.: : :: .::. . : : . .
CCDS56 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS
580 590 600 610 620 630
640 650 660 670 680 690
pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT
:. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: .
CCDS56 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE
640 650 660 670 680 690
700 710 720 730 740 750
pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC
. ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... :
CCDS56 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC
700 710 720 730 740 750
760 770 780 790
pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD
. .: : .:. . :. .:.::: ::.::: :. : :
CCDS56 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH
760 770 780 790 800 810
800 810 820 830 840 850
pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN-
.::. .: .:.: . . ....: .: : . :..: : . : . : .:
CCDS56 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI
820 830 840 850 860
860 870 880 890 900
pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW---
.:.:. .. .: .:.. . : .:..: : .: .. :
CCDS56 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID
870 880 890 900 910
910 920 930 940 950 960
pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE
. .:. :::...: : . : .. :.: : ..:::: :: .
CCDS56 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV
920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR
....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.:
CCDS56 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070
pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI--
. :.:. .:: : .. . . :..:.. : .: : .: :.: ..
CCDS56 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120 1130
pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY
:: :. .. :.:. . ::: .. :... . . :: :. : : ..:: :::
CCDS56 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY
1090 1100 1110 1120 1130 1140
1140 1150 1160 1170 1180 1190
pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG
..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: ::
CCDS56 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230 1240 1250
pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR
.:::. ::.. .: : .: : .:: .: ::::.. :: . . .:
CCDS56 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300
pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG
. . .. : : ... : ..::.. :..:. .. .. .. :. : .::
CCDS56 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K
1270 1280 1290 1300 1310 1320
1310 1320 1330 1340 1350 1360
pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP
. .:....:.:...: .: :. . . .: ...:::
CCDS56 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK
1330 1340 1350 1360 1370 1380
1370 1380 1390 1400 1410 1420
pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE
CCDS56 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL
1390 1400 1410 1420 1430 1440
>>CCDS56141.1 CD302 gene_id:100526664|Hs108|chr2 (1873 aa)
initn: 1268 init1: 376 opt: 1480 Z-score: 1549.3 bits: 299.6 E(32554): 5.6e-80
Smith-Waterman score: 2116; 29.8% identity (58.0% similar) in 1387 aa overlap (25-1342:36-1358)
10 20 30 40 50
pF1KE2 MRLPLLLVFASVIPGAVLLLDTRQFLIYNEDHKRCVDAVSPSAVQTAACNQDAE
: : . . .:. : : :.. .:
CCDS56 ATPRRPAGLLMLLFWFFDLAEPSGRAANDPFTIVHGNTGKCIKPVYGWIVADD-CDE-TE
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 SQKFRWVSESQIMSVAFKLCLGVPSKTDWVAITLYACDSKSEFQKWECKNDTLLGIKGED
.. ..:::. ... . . :::. . . ...::: : . :.:.. .: :
CCDS56 DKLWKWVSQHRLFHLHSQKCLGLDITKSVNELRMFSCDS-SAMLWWKCEHHSLYGAARYR
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 LFFNYGNRQEKNIMLYKGSGLWSRWKIYGTTDNLCSRGYEAMYTLLGNANGAICAFPFKF
: .. :. . . ..: .:.. :. ..::.. :. .:: ::. : : ::: .
CCDS56 LALKDGH----GTAISNASDVWKK---GGSEESLCDQPYHEIYTRDGNSYGRPCEFPFLI
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 ENKWYADCTSAGRSDGWLWCGTTTDYDTDKLFGYCPLKFE-GSESLWNKDPLTSVSYQIN
.. :. :: .: ::.:: .:. :. .: : :: : : :. :.:. . ::.:
CCDS56 DGTWHHDCILDEDHSGP-WCATTLNYEYDRKWGIC-LKPENGCEDNWEKNEQFGSCYQFN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 SKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGLNSLSFNSGWQWS
...::.:..: :::.:.:.::::. : ::: .... .:::::.: ::.::
CCDS56 TQTALSWKEAYVSCQNQGADLLSINSAAELTYLKE-KEGIAKIFWIGLNQLYSARGWEWS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 DRSPFRYLNWLPGSPSAEP--GKSCVSLNPGKNAKWENLECVQKLGYICKKG-NTTLNSF
:..:. .::: : ::: :.::. .. .... :... : .: :.:.: :.:..
CCDS56 DHKPLNFLNWDPDRPSAPTIGGSSCARMD-AESGLWQSFSCEAQLPYVCRKPLNNTVELT
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 VIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGSDLASIHTIEEFDFI
. . :: :.: . : : : :: . .:.. : . :. .::: :::.. . . .
CCDS56 DVWTYSD--TRCDAGWLPNNGFCY-LLVNESNSWDKAHAKCKAFSSDLISIHSLADVEVV
360 370 380 390 400
420 430 440 450 460
pF1KE2 ISQLGYEP-NDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHENNRQEDCVVMKGK
...: : ..:.::::..:.: :.::::: ::.: : ..::. :. .:: . :.
CCDS56 VTKLHNEDIKEEVWIGLKNINIPTLFQWSDGTEVTLTYWDENEPNVPYNKTPNCVSYLGE
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE2 DGYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGC--RKGWKKHHFYCYMIGHTLSTFAE
: : ..:: : :.:: :... . . .: : .:::.: :: : . :.
CCDS56 LGQWKVQSCEEKLKYVCKRKGEKLND--ASSDKMCPPDEGWKRHGETCYKIYEDEVPFGT
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE2 ANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPE---KYFWTGLSDIQTKGTFQWTI----
.:: :: .:.:: .:.... . ::::::: :... : ..:.
CCDS56 ---NCN------LTITSRFEQEYLNDLMKKYDKSLRKYFWTGLRDVDSCGEYNWATVGGR
530 540 550 560 570
590 600 610 620 630
pF1KE2 EEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDVLKCDE-KAKFVCKHWAEGVTHPPKPT
.. : :..:: :. ::::: :: . : :.: : :: .::. . : : . .
CCDS56 RRAVTFSNWNFLEPASPGGCVAMSTGKSVGKWEVKDCRSFKALSICKKMS-GPLGPEEAS
580 590 600 610 620 630
640 650 660 670 680 690
pF1KE2 TTPEPKCPEDWGASSRTSLCFKLY-AKGKHEKKTWFESRDFCRALGGDLASINNKEEQQT
:. ::: : . . :.:.. :. .:..: :.. ::.:::. :.:... .: .
CCDS56 PKPDDPCPEGWQSFPASLSCYKVFHAERIVRKRNWEEAERFCQALGAHLSSFSHVDEIKE
640 650 660 670 680 690
700 710 720 730 740 750
pF1KE2 IWRLITASGSYHKLFWLGLTYGSPS-EG-FTWSDGSPVSYENWAYGEPNNYQ---NVEYC
. ...: . : .. .:.::. ::. .: . ::: .::: . ::..: ... :
CCDS56 FLHFLTDQFSGQHWLWIGLNKRSPDLQGSWQWSDRTPVS----TIIMPNEFQQDYDIRDC
700 710 720 730 740 750
760 770 780 790
pF1KE2 GELK--GDP-TMSWN-----------DINCEHLNNWICQIQKGQTPK-PE---PTPAPQD
. .: : .:. . :. .:.::: ::.::: :. : :
CCDS56 AAVKVFHRPWRRGWHFYDDREFIYLRPFACDTKLEWVCQIPKGRTPKTPDWYNPDRAGIH
760 770 780 790 800 810
800 810 820 830 840 850
pF1KE2 NPPVTEDGWVIYKDYQYYFSKEKE-TMDNARAFCKRNFGDLVSIQSE-SEKKFLWKYVN-
.::. .: .:.: . . ....: .: : . :..: : . : . : .:
CCDS56 GPPLIIEG------SEYWFVADLHLNYEEAVLYCASNHSFLATITSFVGLKAIKNKIANI
820 830 840 850 860
860 870 880 890 900
pF1KE2 RNDAQSAYFIGLLISLDKKFAWMDGSKVDYVSWATGEPNFANEDENCVTMYSNSGFW---
.:.:. .. .: .:.. . : .:..: : .: .. :
CCDS56 SGDGQKWWIRISEWPIDDHFTY------SRYPWHRFPVTFGEE---C--LYMSAKTWLID
870 880 890 900 910
910 920 930 940 950 960
pF1KE2 --NDINCGYPNAFICQRHNSSINATTVMPTMPSVPSGCKEGWNFYSNKCF-KIFGFMEEE
. .:. :::...: : . : .. :.: : ..:::: :: .
CCDS56 LGKPTDCSTKLPFICEKYNVS-SLEKYSPD-SAAKVQCSEQWIPFQNKCFLKI----KPV
920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 RKNWQEARKACIGFGGNLVSIQNEKEQAFLTYHMKDSTFSAWTGLNDVNSEHTFLWTDGR
....: .: ..::.: :. .. :: :.: . : . : :: . :. :::.:
CCDS56 SLTFSQASDTCHSYGGTLPSVLSQIEQDFITSLLPDMEATLWIGLRWTAYEKINKWTDNR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070
pF1KE2 GVHYTNWGKGYPGGR-RSSLSYEDAD----CVVIIG-GASNEAGKWMDDTCDSKRGYI--
. :.:. .:: : .. . . :..:.. : .: : .: :.: ..
CCDS56 ELTYSNFHPLLVSGRLRIPENFFEEESRYHCALILNLQKSPFTGTWNFTSC-SERHFVSL
1030 1040 1050 1060 1070 1080
1080 1090 1100 1110 1120 1130
pF1KE2 CQTRSDPSLTNPPATIQTDG-FVKYGKSSYSLMRQKFQWHEAETYCKLHNSLIASILDPY
:: :. .. :.:. . ::: .. :... . . :: :. : : ..:: :::
CCDS56 CQKYSE---VKSRQTLQNASETVKYLNNLYKIIPKTLTWHSAKRECLKSNMQLVSITDPY
1090 1100 1110 1120 1130 1140
1140 1150 1160 1170 1180 1190
pF1KE2 SNAFAWLQMETSNERVWIALNSNLTDNQYTWTDKWRVRYTNWAADEPKLKSACVYLDLDG
..:: .: : .::.: :. . .. :.: :.... :: . .:.. :: :: ::
CCDS56 QQAFLSVQALLHNSSLWIGLFSQDDELNFGWSDGKRLHFSRWAETNGQLED-CVVLDTDG
1150 1160 1170 1180 1190 1200
1200 1210 1220 1230 1240 1250
pF1KE2 YWKTAHCNESFY-FLCKRS-DEIPATEPPQLPGRCPESD-HTAWIPFHGHCYYIESSYTR
.:::. ::.. .: : .: : .:: .: ::::.. :: . . .:
CCDS56 FWKTVDCNDNQPGAICYYSGNETEKEVKPVDSVKCPSPVLNTPWIPFQNCCYNFIITKNR
1210 1220 1230 1240 1250 1260
1260 1270 1280 1290 1300
pF1KE2 NWGQASLE----CLRMG--SSLVSIESAAESSFLSYRVEPLKSKTNFWIGL---FRNVEG
. . .. : : ... : ..::.. :..:. .. .. .. :. : .::
CCDS56 HMATTQDEVHTKCQKLNPKSHILSIRDEKENNFVLEQLLYFNYMAS-WVMLGITYRN--K
1270 1280 1290 1300 1310 1320
1310 1320 1330 1340 1350 1360
pF1KE2 TWLWINNSPVSFVNWNTGDPSGERNDCVALHASSGFWSNIHCSSYKGYICKRPKIIDAKP
. .:....:.:...: .: :. . . .: ...:::
CCDS56 SLMWFDKTPLSYTHWRAGRPTIKNEKFLAGLSTDGFWDIQTFKVIEEAVYFHQHSILACK
1330 1340 1350 1360 1370 1380
1370 1380 1390 1400 1410 1420
pF1KE2 THELLTTKADTRKMDPSKPSSNVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFE
CCDS56 IEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQLFL
1390 1400 1410 1420 1430 1440
>--
initn: 214 init1: 120 opt: 376 Z-score: 388.2 bits: 84.8 E(32554): 2.7e-15
Smith-Waterman score: 539; 27.0% identity (54.5% similar) in 519 aa overlap (965-1455:1410-1870)
940 950 960 970 980 990
pF1KE2 MPTMPSVPSGCKEGWNFYSNKCFKIFGFMEEERKNWQEARKACIGFGGNLVSIQNEKEQA
... .: :: . : ::.:.:..:.. :
CCDS56 CKIEMVDYKEEYNTTLPQFMPYEDGIYSVIQKKVTWYEALNMCSQSGGHLASVHNQNGQL
1380 1390 1400 1410 1420 1430
1000 1010 1020 1030 1040 1050
pF1KE2 FLTYHMKDSTFSAWTGLNDVN-SEHTFLWTDGRGVHYTNW-GKGYPGGRRSSLSYEDADC
:: .: . : :.::.. . :: .: :.:: : : :. :: .:
CCDS56 FLEDIVKRDGFPLWVGLSSHDGSESSFEWSDGSTFDYIPWKGQTSPG-----------NC
1440 1450 1460 1470 1480
1060 1070 1080 1090 1100
pF1KE2 VVIIGGASNEAGKWMDDTCDS-KRGYICQ--------TRSDPSLTNPPATIQTDGFVKYG
:.. . : : . :.: : : :: .: : : : . . ...:
CCDS56 VLL-----DPKGTWKHEKCNSVKDGAICYKPTKSKKLSRLTYSSRCPAAKENGSRWIQYK
1490 1500 1510 1520 1530 1540
1110 1120 1130 1140 1150
pF1KE2 KSSYSLMRQKFQWHEAETYCKLHN--SLIASILDPYSNAFAWLQMETSNE---RVWIALN
:. . .. ::. :. :. . :.:: : : :. :. .:. :::..:.
CCDS56 GHCYKSDQALHSFSEAKKLCSKHDHSATIVSIKDEDENKFVSRLMRENNNITMRVWLGLS
1550 1560 1570 1580 1590 1600
1160 1170 1180 1190 1200 1210
pF1KE2 SNLTDNQYTWTDKWRVRYTNWAADEPKLKSA---CVYLDLDGY-WKTAHCNESF-YFLCK
.. .:....: : .: ...: : : ::. : .: .. :: ..:...: .::
CCDS56 QHSVDQSWSWLDGSEVTFVKW---ENKSKSGVGRCSMLIASNETWKKVECEHGFGRVVCK
1610 1620 1630 1640 1650 1660
1220 1230 1240 1250 1260 1270
pF1KE2 RSDEIPATEPPQLPGRCPESDHTAWIPFHGHCYYI--ESSYTRNWGQASLECLRMGSSLV
.: :: : .:: :. :: . :. ... .. .: :....
CCDS56 ------------VPLDCPSS---TWIQFQDSCYIFLQEAIKVESIEDVRNQCTDHGADMI
1670 1680 1690 1700
1280 1290 1300 1310 1320
pF1KE2 SIESAAESSF-LSYRVEPLKSKTNFWIGLFRNVE-GTWLWINNSPVSFVNWNTGDPSGER
::.. :..: :. . :. .. .:.: ... ... :..:: ..: .:. : . .
CCDS56 SIHNEEENAFILDTLKKQWKGPDDILLGMFYDTDDASFKWFDNSNMTFDKWTDQDDDEDL
1710 1720 1730 1740 1750 1760
1330 1340 1350 1360 1370 1380
pF1KE2 ND-CVALHASSGFWSNIHC--SSYKGYICKRPKIIDAKPTHELLTTKADTRKMDPSKPSS
: :. :: ..: :.. .: :: .: .:: : : . ::. . .
CCDS56 VDTCAFLHIKTGEWKKGNCEVSSVEGTLCKT-----AIPYK---------RKY--LSDNH
1770 1780 1790 1800
1390 1400 1410 1420 1430 1440
pF1KE2 NVAGVVIIVILLILTGAGLAAYFFYKKRRVHLPQEGAFENTLYFNSQSSPGTSDMKDLVG
. ....:. .::: : .:.::: : ... : .:.. .. .:: . : .::
CCDS56 ILISALVIASTVILTVLGAIIWFLYKK---H--SDSRF-TTVFSTAPQSPYNEDCVLVVG
1810 1820 1830 1840 1850 1860
1450
pF1KE2 NIEQNEHSVI
:.::. :
CCDS56 --EENEYPVQFD
1870
>>CCDS12397.1 NCAN gene_id:1463|Hs108|chr19 (1321 aa)
initn: 289 init1: 145 opt: 357 Z-score: 370.2 bits: 80.9 E(32554): 2.7e-14
Smith-Waterman score: 357; 32.7% identity (58.9% similar) in 214 aa overlap (313-513:1031-1234)
290 300 310 320 330 340
pF1KE2 SLSFNSGWQWSDRSPFRYLNWLPGSPSAEPGKSCVSLNPGKNAKWENLECVQKLGYICKK
: :: . :.: . . .: : :..
CCDS12 NAGAEEVHSDPCENNPCLHGGTCNANGTMYGCSCDQGFAGENCEIDIDDC---LCSPCEN
1010 1020 1030 1040 1050
350 360 370 380 390
pF1KE2 GNTTL---NSFV---IPS------ESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTT
:.: . :.:: .:: :.:. : : . ::::. . ... .::
CCDS12 GGTCIDEVNGFVCLCLPSYGGSFCEKDTEG-CDRGWHKFQGHCYR-YFAHRRAWEDAEKD
1060 1070 1080 1090 1100 1110
400 410 420 430 440 450
pF1KE2 CRKEGSDLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLR
::.... :.:.:. :: .:: : .:.: . :::::: .. :.:.:.: . : .: .
CCDS12 CRRRSGHLTSVHSPEEHSFINS-FGHE---NTWIGLNDRIVERDFQWTDNTGLQFENWRE
1120 1130 1140 1150 1160 1170
460 470 480 490 500
pF1KE2 GEPSHENNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWK
..:.. :::::: ... : : : :.. : :.:: . :: . ::.. : .
CCDS12 NQPDNFFAGGEDCVVMVAHESGRWNDVPCNYNLPYVCKKGTVLCGPPPA-VENASLIGAR
1180 1190 1200 1210 1220 1230
510 520 530 540 550 560
pF1KE2 KHHFYCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSD
: ..
CCDS12 KAKYNVHATVRYQCNEGFAQHHVATIRCRSNGKWDRPQIVCTKPRRSHRMRRHHHHHQHH
1240 1250 1260 1270 1280 1290
>>CCDS1149.1 BCAN gene_id:63827|Hs108|chr1 (911 aa)
initn: 374 init1: 150 opt: 337 Z-score: 351.2 bits: 76.9 E(32554): 3.1e-13
Smith-Waterman score: 337; 42.2% identity (60.0% similar) in 135 aa overlap (362-495:688-817)
340 350 360 370 380 390
pF1KE2 CVQKLGYICKKGNTTLNSFVIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTC
: : . : ::: : . .. ..: : :
CCDS11 GGTCLEEEEGVRCLCLPGYGGDLCDVGLRFCNPGWDAFQGACYK-HFSTRRSWEEAETQC
660 670 680 690 700 710
400 410 420 430 440 450
pF1KE2 RKEGSDLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRG
: :. :::: : :: ::: .. :. . :::::: :. : ::::.:. . .: :
CCDS11 RMYGAHLASISTPEEQDFINNR--YR--EYQWIGLNDRTIEGDFLWSDGVPLLYENWNPG
720 730 740 750 760 770
460 470 480 490 500 510
pF1KE2 EPSHENNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQGPEIVEVEKGCRKGWKK
.:. :.:::: .: : :.: :.. :.: ::: : ::
CCDS11 QPDSYFLSGENCVVMVWHDQGQWSDVPCNYHLSYTCKMGLVSCGPPPELPLAQVFGRPRL
780 790 800 810 820 830
520 530 540 550 560 570
pF1KE2 HHFYCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSFVGLRPEKYFWTGLSDI
CCDS11 RYEVDTVLRYRCREGLAQRNLPLIRCQENGRWEAPQISCVPRRPARALHPEEDPEGRQGR
840 850 860 870 880 890
>>CCDS53970.1 ACAN gene_id:176|Hs108|chr15 (2530 aa)
initn: 285 init1: 161 opt: 332 Z-score: 340.2 bits: 76.3 E(32554): 1.3e-12
Smith-Waterman score: 362; 28.3% identity (50.5% similar) in 321 aa overlap (252-545:2220-2516)
230 240 250 260 270 280
pF1KE2 KDPLTSVSYQINSKSALTWHQARKSCQQQNAELLSITEIHEQTYLTGLTSSLTSGLWIGL
.: . :. .:.: .::: :. :
CCDS53 TASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESSSL---LYSGE
2190 2200 2210 2220 2230 2240
290 300 310 320 330
pF1KE2 NSLSFNSGWQWSDRSPFRYLNWLPGSPS--AEPGKSCVSLNPGKNAKWENLECVQKLGYI
.. . ... . .: : .: : : : :..::. : .. : . :..
CCDS53 ETHTVETATSPTDASIPASPEWKRESESTAAAPARSCAEEPCGAGT------CKETEGHV
2250 2260 2270 2280 2290 2300
340 350 360 370 380 390
pF1KE2 ---CKKGNTTLNSFVIPSESDVPTHCPSQWWPYAGHCYKIHRDEKKIQRDALTTCRKEGS
: : : . . ...: : : : ::::. : ... :: ::.. :
CCDS53 ICLCPPGYTGEHCNI---DQEV---CEEGWNKYQGHCYR-HFPDRETWVDAERRCREQQS
2310 2320 2330 2340 2350
400 410 420 430 440 450
pF1KE2 DLASIHTIEEFDFIISQLGYEPNDELWIGLNDIKIQMYFEWSDGTPVTFTKWLRGEPSHE
:.:: : :: .:. . . .: :::::: :. :.:::: :. : .: ..:..
CCDS53 HLSSIVTPEEQEFVNN----NAQDYQWIGLNDRTIEGDFRWSDGHPMQFENWRPNQPDNF
2360 2370 2380 2390 2400
460 470 480 490
pF1KE2 NNRQEDCVVMKGKD-GYWADRGCEWPLGYICKMKSRSQG-PEIVE---------------
:::::: .. : : : :.. : . :: . . : : .::
CCDS53 FAAGEDCVVMIWHEKGEWNDVPCNYHLPFTCKKGTVACGEPPVVEHARTFGQKKDRYEIN
2410 2420 2430 2440 2450 2460
500 510 520 530 540 550
pF1KE2 --VEKGCRKGWKKHHF---YCYMIGHTLSTFAEANQTCNNENAYLTTIEDRYEQAFLTSF
:. : .:. ..:. : :: . : . ::.. ..: .. :
CCDS53 SLVRYQCTEGFVQRHMPTIRCQPSGH----WEEPQITCTDPTTYKRRLQKRSSRHPRRSR
2470 2480 2490 2500 2510 2520
560 570 580 590 600 610
pF1KE2 VGLRPEKYFWTGLSDIQTKGTFQWTIEEEVRFTHWNSDMPGRKPGCVAMRTGIAGGLWDV
CCDS53 PSTAH
2530
1456 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 03:12:52 2016 done: Tue Nov 8 03:12:53 2016
Total Scan time: 4.200 Total Display time: 0.440
Function used was FASTA [36.3.4 Apr, 2011]