FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3478, 1613 aa
1>>>pF1KE3478 1613 - 1613 aa - 1613 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.4393+/-0.00135; mu= 4.3486+/- 0.081
mean_var=231.1254+/-46.502, 0's: 0 Z-trim(108.1): 73 B-trim: 0 in 0/51
Lambda= 0.084363
statistics sampled from 10082 (10136) to 10082 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.303), width: 16
Scan time: 2.700
The best scores are: opt bits E(33420)
CCDS8647.1 LRP6 gene_id:4040|Hs109|chr12 (1613) 11148 1371.7 0
CCDS8181.1 LRP5 gene_id:4041|Hs109|chr11 (1615) 7864 972.0 0
CCDS31478.1 LRP4 gene_id:4038|Hs109|chr11 (1905) 3069 388.4 1.2e-106
CCDS2182.1 LRP1B gene_id:53353|Hs109|chr2 (4599) 1405 186.2 2.3e-45
CCDS33626.1 LRP5L gene_id:91355|Hs109|chr22 ( 252) 1082 146.0 1.5e-34
CCDS8932.1 LRP1 gene_id:4035|Hs109|chr12 (4544) 996 136.4 2.2e-30
CCDS2232.1 LRP2 gene_id:4036|Hs109|chr2 (4655) 887 123.1 2.2e-26
CCDS54795.1 EGF gene_id:1950|Hs109|chr4 (1165) 862 119.7 5.9e-26
CCDS54794.1 EGF gene_id:1950|Hs109|chr4 (1166) 855 118.8 1.1e-25
CCDS3689.1 EGF gene_id:1950|Hs109|chr4 (1207) 855 118.8 1.1e-25
CCDS6446.1 VLDLR gene_id:7436|Hs109|chr9 ( 873) 827 115.3 9.1e-25
CCDS34979.1 VLDLR gene_id:7436|Hs109|chr9 ( 845) 819 114.3 1.7e-24
CCDS579.1 LRP8 gene_id:7804|Hs109|chr1 ( 700) 751 106.0 4.6e-22
CCDS580.1 LRP8 gene_id:7804|Hs109|chr1 ( 793) 751 106.0 5.1e-22
CCDS8436.1 SORL1 gene_id:6653|Hs109|chr11 (2214) 760 107.4 5.4e-22
CCDS30720.1 LRP8 gene_id:7804|Hs109|chr1 ( 904) 751 106.1 5.7e-22
CCDS578.1 LRP8 gene_id:7804|Hs109|chr1 ( 963) 751 106.1 6e-22
CCDS56084.1 LDLR gene_id:3949|Hs109|chr19 ( 692) 741 104.8 1.1e-21
CCDS56085.1 LDLR gene_id:3949|Hs109|chr19 ( 819) 741 104.8 1.2e-21
CCDS58651.1 LDLR gene_id:3949|Hs109|chr19 ( 858) 741 104.9 1.3e-21
CCDS12254.1 LDLR gene_id:3949|Hs109|chr19 ( 860) 741 104.9 1.3e-21
CCDS56083.1 LDLR gene_id:3949|Hs109|chr19 ( 682) 673 96.5 3.3e-19
CCDS1608.1 NID1 gene_id:4811|Hs109|chr1 (1247) 655 94.5 2.4e-18
CCDS9706.1 NID2 gene_id:22795|Hs109|chr14 (1375) 576 84.9 2e-15
>>CCDS8647.1 LRP6 gene_id:4040|Hs109|chr12 (1613 aa)
initn: 11148 init1: 11148 opt: 11148 Z-score: 7343.4 bits: 1371.7 E(33420): 0
Smith-Waterman score: 11148; 99.9% identity (100.0% similar) in 1613 aa overlap (1-1613:1-1613)
10 20 30 40 50 60
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGLEDAAAVDFVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGLEDAAAVDFVF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 SHGLIYWSDVSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEKLYWTDSETNRIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 SHGLIYWSDVSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEKLYWTDSETNRIE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 VSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIERAGMDGSSRFIIINSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 VSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIERAGMDGSSRFIIINSE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 IYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGSLPHPFALTLFEDILYWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 IYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGSLPHPFALTLFEDILYWT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 DWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCGIDNGGCSHLCLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 DWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCGIDNGGCSHLCLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 PVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTPDFTDIVLQLEDIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTPDFTDIVLQLEDIR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 HAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIAVDWVARNLYWT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 HAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIAVDWVARNLYWT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 DTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIPKIERAALDGSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 DTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIPKIERAALDGSD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 RVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLVEDKIPHIFGFTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLVEDKIPHIFGFTL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 LGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATNVHRVIGSNPCAEENGGCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 LGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATNVHRVIGSNPCAEENGGCS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 HLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRADIRRISLETNNNNVAIPLTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 HLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRADIRRISLETNNNNVAIPLTG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 VKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYPEGMAVDWLGKNLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 VKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYPEGMAVDWLGKNLY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 WADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 WADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 SERTTLVPNVGRANGLTIDYAKRRLYWTDLDTNLIESSNMLGLNREVIADDLPHPFGLTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 SERTTLVPNVGRANGLTIDYAKRRLYWTDLDTNLIESSNMLGLNREVIADDLPHPFGLTQ
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 YQDYIYWTDWSRRSIERANKTSGQNRTIIQGHLDYVMDILVFHSSRQSGWNECASSNGHC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 YQDYIYWTDWSRRSIERANKTSGQNRTIIQGHLDYVMDILVFHSSRQSGWNECASSNGHC
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 SHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAINRMVIDEQQSPDIILP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 SHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAINRMVIDEQQSPDIILP
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 IHSLRNVRAIDYDPLDKQLYWIDSRQNMIRKAQEDGSQGFTVVVSSVPSQNLEIQPYDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 IHSLRNVRAIDYDPLDKQLYWIDSRQNMIRKAQEDGSQGFTVVVSSVPSQNLEIQPYDLS
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 IDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTNLQERS
:::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::
CCDS86 IDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAVVVNPEKGYMYFTNLQERS
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 PKIERAALDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGANRIVLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PKIERAALDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGANRIVLE
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 DSNILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKELNLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 DSNILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKELNLQ
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 EYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSPQQFTCFTGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 EYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSPQQFTCFTGE
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 IDCIPVAWRCDGFTECEDHSDELNCPVCSESQFQCASGQCIDGALRCNGDANCQDKSDEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 IDCIPVAWRCDGFTECEDHSDELNCPVCSESQFQCASGQCIDGALRCNGDANCQDKSDEK
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE3 NCEVLCLIDQFRCANGQCIGKHKKCDHNVDCSDKSDELDCYPTEEPAPQATNTVGSVIGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 NCEVLCLIDQFRCANGQCIGKHKKCDHNVDCSDKSDELDCYPTEEPAPQATNTVGSVIGV
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE3 IVTIFVSGTVYFICQRMLCPRMKGDGETMTNDYVVHGPASVPLGYVPHPSSLSGSLPGMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 IVTIFVSGTVYFICQRMLCPRMKGDGETMTNDYVVHGPASVPLGYVPHPSSLSGSLPGMS
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE3 RGKSMISSLSIMGGSSGPPYDRAHVTGASSSSSSSTKGTYFPAILNPPPSPATERSHYTM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RGKSMISSLSIMGGSSGPPYDRAHVTGASSSSSSSTKGTYFPAILNPPPSPATERSHYTM
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE3 EFGYSSNSPSTHRSYSYRPYSYRHFAPPTTPCSTDVCDSDYAPSRRMTSVATAKGYTSDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 EFGYSSNSPSTHRSYSYRPYSYRHFAPPTTPCSTDVCDSDYAPSRRMTSVATAKGYTSDL
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610
pF1KE3 NYDSEPVPPPPTPRSQYLSAEENYESCPPSPYTERSYSHHLYPPPPSPCTDSS
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 NYDSEPVPPPPTPRSQYLSAEENYESCPPSPYTERSYSHHLYPPPPSPCTDSS
1570 1580 1590 1600 1610
>>CCDS8181.1 LRP5 gene_id:4041|Hs109|chr11 (1615 aa)
initn: 6373 init1: 4592 opt: 7864 Z-score: 5183.3 bits: 972.0 E(33420): 0
Smith-Waterman score: 8021; 70.3% identity (87.8% similar) in 1612 aa overlap (8-1613:19-1615)
10 20 30 40
pF1KE3 MGAVLRSLLACSFCVLLRAA-PLLLYANRRDLRLVDATNGKENATIVVG
::: : :: ::::.:::::.::::: . : ..::::.
CCDS81 MEAAPPGPPWPLLLLLLLLLALCGCPAPAAASPLLLFANRRDVRLVDAGGVKLESTIVVS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE3 GLEDAAAVDFVFSHGLIYWSDVSEEAIKRTEFNKT-ESVQNVVVSGLLSPDGLACDWLGE
:::::::::: ::.: .::.::::::::.: .:.: .:::::.:::.:::::::::.:.
CCDS81 GLEDAAAVDFQFSKGAVYWTDVSEEAIKQTYLNQTGAAVQNVVISGLVSPDGLACDWVGK
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE3 KLYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIERAG
::::::::::::::.::.:. :::::::.:::::::::::. :.::::::::.:.:::::
CCDS81 KLYWTDSETNRIEVANLNGTSRKVLFWQDLDQPRAIALDPAHGYMYWTDWGETPRIERAG
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE3 MDGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGSLPHP
::::.: ::..:.::::::::.: ::::::::::::.:::..::::. :: ::.::: ::
CCDS81 MDGSTRKIIVDSDIYWPNGLTIDLEEQKLYWADAKLSFIHRANLDGSFRQKVVEGSLTHP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE3 FALTLFEDILYWTDWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCG
::::: : ::::::.:.:: :::: :: .:: : ..:::::...::.::: . :
CCDS81 FALTLSGDTLYWTDWQTRSIHACNKRTGGKRKEILSALYSPMDIQVLSQERQPFFHTRCE
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE3 IDNGGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTP
::::::::::.:: .::: :::::::.: .::.::: :: :.:::::::::::::::::
CCDS81 EDNGGCSHLCLLSPSEPFYTCACPTGVQLQDNGRTCKAGAEEVLLLARRTDLRRISLDTP
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE3 DFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDG
::::::::..::::::::::::.:::.::::::::::::...::::.: .:...: :::
CCDS81 DFTDIVLQVDDIRHAIAIDYDPLEGYVYWTDDEVRAIRRAYLDGSGAQTLVNTEINDPDG
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE3 IAVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGE
:::::::::::::::::::::::::::: ::::.::::.:::::.: :..: ::::::::
CCDS81 IAVDWVARNLYWTDTGTDRIEVTRLNGTSRKILVSEDLDEPRAIALHPVMGLMYWTDWGE
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE3 IPKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVL
:::: : :::..: ::::.::::::::::: .:::.::::::::::::.:.::: ::.:
CCDS81 NPKIECANLDGQERRVLVNASLGWPNGLALDLQEGKLYWGDAKTDKIEVINVDGTKRRTL
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE3 VEDKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATNVHRVI
.:::.:::::::::::..::::::::::::::: .: :.::::::::::::::.:: .:.
CCDS81 LEDKLPHIFGFTLLGDFIYWTDWQRRSIERVHKVKASRDVIIDQLPDLMGLKAVNVAKVV
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE3 GSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRADIRRISL
:.::::..::::::::.. :.. ::.::::.::.:::::::::::::.:. :: :.::::
CCDS81 GTNPCADRNGGCSHLCFFTPHATRCGCPIGLELLSDMKTCIVPEAFLVFTSRAAIHRISL
610 620 630 640 650 660
650 660 670 680 690 700
pF1KE3 ETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYP
:::::.::::::::::::::::::..:.:::::.:::::::::::::..:::::::::::
CCDS81 ETNNNDVAIPLTGVKEASALDFDVSNNHIYWTDVSLKTISRAFMNGSSVEHVVEFGLDYP
670 680 690 700 710 720
710 720 730 740 750 760
pF1KE3 EGMAVDWLGKNLYWADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEW
:::::::.::::::::::::::::..:::: ::::::.:::.::.:::::..:..:::::
CCDS81 EGMAVDWMGKNLYWADTGTNRIEVARLDGQFRQVLVWRDLDNPRSLALDPTKGYIYWTEW
730 740 750 760 770 780
770 780 790 800 810 820
pF1KE3 GGKPKIDRAAMDGSERTTLVPNVGRANGLTIDYAKRRLYWTDLDTNLIESSNMLGLNREV
::::.: :: :::.. ::: .::::: :::::: .::::::::::.:::::::: .: :
CCDS81 GGKPRIVRAFMDGTNCMTLVDKVGRANDLTIDYADQRLYWTDLDTNMIESSNMLGQERVV
790 800 810 820 830 840
830 840 850 860 870 880
pF1KE3 IADDLPHPFGLTQYQDYIYWTDWSRRSIERANKTSGQNRTIIQGHLDYVMDILVFHSSRQ
::::::::::::::.::::::::. .:::::.::::.:::.::::::.::::::::::::
CCDS81 IADDLPHPFGLTQYSDYIYWTDWNLHSIERADKTSGRNRTLIQGHLDFVMDILVFHSSRQ
850 860 870 880 890 900
890 900 910 920 930 940
pF1KE3 SGWNECASSNGHCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAINRM
.: :.: .::.:..::::.: :: ::: .::.:. ..:.:: :::::::::::::.::
CCDS81 DGLNDCMHNNGQCGQLCLAIP-GGHRCGCASHYTLDPSSRNCSPPTTFLLFSQKSAISRM
910 920 930 940 950
950 960 970 980 990 1000
pF1KE3 VIDEQQSPDIILPIHSLRNVRAIDYDPLDKQLYWIDSRQNMIRKAQEDGSQGFTVVVSSV
. :.:.:::.:::.:.::::.::::::::: .::.:.::: :..:..::.: : :..:
CCDS81 IPDDQHSPDLILPLHGLRNVKAIDYDPLDKFIYWVDGRQN-IKRAKDDGTQPF-VLTSLS
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KE3 PSQNLEIQPYDLSIDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPE
.:: . ::.::::::::: ..:::::::.::: ::.:...::::.:..:.::::::: :
CCDS81 QGQNPDRQPHDLSIDIYSRTLFWTCEATNTINVHRLSGEAMGVVLRGDRDKPRAIVVNAE
1020 1030 1040 1050 1060 1070
1070 1080 1090 1100 1110 1120
pF1KE3 KGYMYFTNLQERSPKIERAALDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIE
.::.::::.:.:. :::::::::::::::: .:: .:.::..:. ::::::.:.::.:::
CCDS81 RGYLYFTNMQDRAAKIERAALDGTEREVLFTTGLIRPVALVVDNTLGKLFWVDADLKRIE
1080 1090 1100 1110 1120 1130
1130 1140 1150 1160 1170 1180
pF1KE3 SSDLSGANRIVLEDSNILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQ
: :::::::..:::.::.::.:::.. . :::::.::::::... : . ::..:.:.:.
CCDS81 SCDLSGANRLTLEDANIVQPLGLTILGKHLYWIDRQQQMIERVEKTTGDKRTRIQGRVAH
1140 1150 1160 1170 1180 1190
1190 1200 1210 1220 1230 1240
pF1KE3 LSDIHAVKELNLQEYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPP
:. ::::.:..:.:. ::::.:::::::::..::::: :::::.::::::. :.:::::
CCDS81 LTGIHAVEEVSLEEFSAHPCARDNGGCSHICIAKGDGTPRCSCPVHLVLLQNLLTCGEPP
1200 1210 1220 1230 1240 1250
1250 1260 1270 1280 1290 1300
pF1KE3 TCSPQQFTCFTGEIDCIPVAWRCDGFTECEDHSDELNCPVCSESQFQCASGQCIDGALRC
::::.::.: :::::::: ::::::: ::.:.::: .::::: .:: :: :::.: :::
CCDS81 TCSPDQFACATGEIDCIPGAWRCDGFPECDDQSDEEGCPVCSAAQFPCARGQCVDLRLRC
1260 1270 1280 1290 1300 1310
1310 1320 1330 1340 1350 1360
pF1KE3 NGDANCQDKSDEKNCEVLCLIDQFRCANGQCIGKHKKCDHNVDCSDKSDELDCYPTEEPA
.:.:.:::.::: .:...:: .:::::.:::. ...:: :: : :::: : :. :.
CCDS81 DGEADCQDRSDEADCDAICLPNQFRCASGQCVLIKQQCDSFPDCIDGSDELMCEITKPPS
1320 1330 1340 1350 1360 1370
1370 1380 1390 1400 1410 1420
pF1KE3 ---PQATNTVGSVIGVIVTIFVSGTVYFICQRMLCPRMKGDGETMTNDYVVHGPASVPLG
: ....: :::.:...:: : :::.:::..: :. : . . ..:: : :::.
CCDS81 DDSPAHSSAIGPVIGIILSLFVMGGVYFVCQRVVCQRYAGANGPFPHEYV-SGTPHVPLN
1380 1390 1400 1410 1420 1430
1430 1440 1450 1460 1470 1480
pF1KE3 YVPHPSSLSGSLPGMSRGKSMISSLSIMGGSSGPP-YDRAHVTGASSSSSSSTKGTYFPA
.. .: : . :.. ::::.::.:.::: .: : ::: ::::::::::::::.: .:
CCDS81 FIAPGGSQHGPFTGIACGKSMMSSVSLMGGRGGVPLYDRNHVTGASSSSSSSTKATLYPP
1440 1450 1460 1470 1480 1490
1490 1500 1510 1520 1530 1540
pF1KE3 ILNPPPSPATERSHYTMEFGYSSNSPSTHRSYSYRPYSYRHFAPPTTPCSTDVCDSDYAP
::::::::::. : :.:.. :::: :.: : : ::: : .::::::::::::::::.
CCDS81 ILNPPPSPATDPSLYNMDMFYSSNIPATARPY--RPYIIRGMAPPTTPCSTDVCDSDYSA
1500 1510 1520 1530 1540 1550
1550 1560 1570 1580 1590 1600
pF1KE3 SRRMTSVATAKGYTSDLNYDSEPVPPPPTPRSQYLSAEENYESCPPSPYTERSYSHHLYP
:: :. : ::: ::.: ::::::.:::::::. :::::: ::::: ::.:
CCDS81 SRW-----KASKYYLDLNSDSDPYPPPPTPHSQYLSAED---SCPPSPATERSY-FHLFP
1560 1570 1580 1590 1600
1610
pF1KE3 PPPSPCTDSS
::::::::::
CCDS81 PPPSPCTDSS
1610
>>CCDS31478.1 LRP4 gene_id:4038|Hs109|chr11 (1905 aa)
initn: 2275 init1: 1461 opt: 3069 Z-score: 2028.3 bits: 388.4 E(33420): 1.2e-106
Smith-Waterman score: 3069; 47.1% identity (78.1% similar) in 916 aa overlap (22-930:743-1649)
10 20 30 40 50
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVD-ATNGKENATIVVGGL
.::.: : :.: .. :. . .: .. .
CCDS31 CLPSGQNYTCACPTGFRKISSHACAQSLDKFLLFARRMDIRRISFDTEDLSDDVIPLADV
720 730 740 750 760 770
60 70 80 90 100
pF1KE3 EDAAAVDFVFSHGLIYWSDVSEEAIKRTEFNKTESVQNVVV-SGLLSPDGLACDWLGEKL
..:.:.:. .::.::: ..:.:.... : :.::: ..: :: ::: ::. .::
CCDS31 RSAVALDWDSRDDHVYWTDVSTDTISRAKWDGTG--QEVVVDTSLESPAGLAIDWVTNKL
780 790 800 810 820 830
110 120 130 140 150 160
pF1KE3 YWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIERAGMD
::::. :.::::.: :::.: ::.:..::.:: :...: .:.::::::: :::::::::
CCDS31 YWTDAGTDRIEVANTDGSMRTVLIWENLDRPRDIVVEPMGGYMYWTDWGASPKIERAGMD
840 850 860 870 880 890
170 180 190 200 210 220
pF1KE3 GSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGSLPHPFA
.:.: .::.:.. :::::..:: :.:::::: .. :. ..:::..:.... ..:::::.
CCDS31 ASGRQVIISSNLTWPNGLAIDYGSQRLYWADAGMKTIEFAGLDGSKRKVLIGSQLPHPFG
900 910 920 930 940 950
230 240 250 260 270 280
pF1KE3 LTLFEDILYWTDWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCGID
:::. . .:::::.:.:: . .. :: . .. .. . ::::.: ..:.: ...::...
CCDS31 LTLYGERIYWTDWQTKSIQSADRLTGLDRETLQENLENLMDIHVF-HRRRPPVSTPCAME
960 970 980 990 1000
290 300 310 320 330 340
pF1KE3 NGGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTPDF
::::::::: :: ..:.::::..:: .::::. : . .:..::: :.: .::: : :
CCDS31 NGGCSHLCLRSPNPSGFSCTCPTGINLLSDGKTCSPGMNSFLIFARRIDIRMVSLDIPYF
1010 1020 1030 1040 1050 1060
350 360 370 380 390 400
pF1KE3 TDIVLQLE-DIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGI
.:.:. .. ....::: :: :: .::.:. .. : :. .::: . ..:. . ::.
CCDS31 ADVVVPINITMKNTIAIGVDPQEGKVYWSDSTLHRISRANLDGSQHEDIITTGLQTTDGL
1070 1080 1090 1100 1110 1120
410 420 430 440 450 460
pF1KE3 AVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEI
::: ..:..:::::::.:::: :.:.:::.:. ..:. :::::: .:.::::::::
CCDS31 AVDAIGRKVYWTDTGTNRIEVGNLDGSMRKVLVWQNLDSPRAIVLYHEMGFMYWTDWGEN
1130 1140 1150 1160 1170 1180
470 480 490 500 510 520
pF1KE3 PKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLV
:.::...:::::.::.:..:::::::..: ... :.::.:..::. . .:..:..::
CCDS31 AKLERSGMDGSDRAVLINNNLGWPNGLTVDKASSQLLWADAHTERIEAADLNGANRHTLV
1190 1200 1210 1220 1230 1240
530 540 550 560 570 580
pF1KE3 EDKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVII-DQLPDLMGLKATNVHRVI
. . : .:.::: .:.:::::: :::.:. : .. ... ..:: :: ..:.. . .
CCDS31 -SPVQHPYGLTLLDSYIYWTDWQTRSIHRADKGTGSNVILVRSNLPGLMDMQAVDRAQPL
1250 1260 1270 1280 1290 1300
590 600 610 620 630 640
pF1KE3 GSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTC-IVPEAFLLFSRRADIRRIS
: : :. .::::::::: ::.:. :::: :..: .: ::: ::..:::: :..:::::
CCDS31 GFNKCGSRNGGCSHLCLPRPSGFSCACPTGIQLKGDGKTCDPSPETYLLFSSRGSIRRIS
1310 1320 1330 1340 1350 1360
650 660 670 680 690 700
pF1KE3 LETNNN-NVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLD
:.:... .: .:. .... .::.: .:...:.::. : .: :: .::: .: :. ::
CCDS31 LDTSDHTDVHVPVPELNNVISLDYDSVDGKVYYTDVFLDVIRRADLNGSNMETVIGRGLK
1370 1380 1390 1400 1410 1420
710 720 730 740 750 760
pF1KE3 YPEGMAVDWLGKNLYWADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWT
.:.::::...::::.::: : ::.:.:::. :.::. ..:: :::.:. : .:...::
CCDS31 TTDGLAVDWVARNLYWTDTGRNTIEASRLDGSCRKVLINNSLDEPRAIAVFPRKGYLFWT
1430 1440 1450 1460 1470 1480
770 780 790 800 810 820
pF1KE3 EWGGKPKIDRAAMDGSERTTLV-PNVGRANGLTIDYAKRRLYWTDLDTNLIESSNMLGLN
.:: ::.:: .::::: .:. ..: ::::.:: ::.::.: . :::... :
CCDS31 DWGHIAKIERANLDGSERKVLINTDLGWPNGLTLDYDTRRIYWVDAHLDRIESADLNGKL
1490 1500 1510 1520 1530 1540
830 840 850 860 870 880
pF1KE3 REVIADDLPHPFGLTQYQDYIYWTDWSRRSIERANKTSGQNRTIIQGHLDYVMDILVFHS
:.:... . :::.::: . .::::::. .::.:..: ::.:. . .... .:::.:
CCDS31 RQVLVSHVSHPFALTQQDRWIYWTDWQTKSIQRVDKYSGRNKETVLANVEGLMDIIVVSP
1550 1560 1570 1580 1590 1600
890 900 910 920 930 940
pF1KE3 SRQSGWNECASSNGHCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAI
.::.: : :. .:: :.:::.: .. :::.:: . :.: ::
CCDS31 QRQTGTNACGVNNGGCTHLCFAR-ASDFVCACPD----EPDSRPCSLVPGLVPPAPRATG
1610 1620 1630 1640 1650 1660
950 960 970 980 990 1000
pF1KE3 NRMVIDEQQSPDIILPIHSLRNVRAIDYDPLDKQLYWIDSRQNMIRKAQEDGSQGFTVVV
CCDS31 MSEKSPVLPNTPPTTLYSSTTRTRTSLEEVEGRCSERDARLGLCARSNDAVPAAPGEGLH
1670 1680 1690 1700 1710 1720
>--
initn: 1146 init1: 923 opt: 1118 Z-score: 744.9 bits: 151.0 E(33420): 3.7e-35
Smith-Waterman score: 1118; 51.3% identity (78.1% similar) in 310 aa overlap (14-323:433-736)
10 20 30 40
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENA
: : :.::.::: :.: : . .
CCDS31 GYCSQGCTNSEGAFQCWCETGYELRPDRRSCKALGPEPVLLFANRIDIRQV--LPHRSEY
410 420 430 440 450 460
50 60 70 80 90 100
pF1KE3 TIVVGGLEDAAAVDFVFSHGLIYWSDVSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACD
:.....::.: :.:: . :..::::. . : :...: . .:..:: .:: :: ::: :
CCDS31 TLLLNNLENAIALDFHHRRELVFWSDVTLDRILRANLNGS-NVEEVVSTGLESPGGLAVD
470 480 490 500 510
110 120 130 140 150 160
pF1KE3 WLGEKLYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKI
:. .::::::: :.::::.::::. ::::.::.:..:::::: : : .::::::..:.:
CCDS31 WVHDKLYWTDSGTSRIEVANLDGAHRKVLLWQNLEKPRAIALHPMEGTIYWTDWGNTPRI
520 530 540 550 560 570
170 180 190 200 210 220
pF1KE3 ERAGMDGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGS
: ..::::.: :: .....::::::.:: ...::.::: . :...::::..:.::.. .
CCDS31 EASSMDGSGRRIIADTHLFWPNGLTIDYAGRRMYWVDAKHHVIERANLDGSHRKAVISQG
580 590 600 610 620 630
230 240 250 260 270 280
pF1KE3 LPHPFALTLFEDILYWTDWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNAT
::::::.:.::: :::::: :.:: . ::.::.. . :.. . :::::.. :::: .
CCDS31 LPHPFAITVFEDSLYWTDWHTKSINSANKFTGKNQEIIRNKLHFPMDIHTLHPQRQPAGK
640 650 660 670 680 690
290 300 310 320 330 340
pF1KE3 NPCGIDNGGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRIS
: :: .::::.:::: : : :::::: . . ....:
CCDS31 NRCGDNNGGCTHLCL--PSGQNYTCACPTGFRKI-SSHACAQSLDKFLLFARRMDIRRIS
700 710 720 730 740 750
350 360 370 380 390 400
pF1KE3 LDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIA
CCDS31 FDTEDLSDDVIPLADVRSAVALDWDSRDDHVYWTDVSTDTISRAKWDGTGQEVVVDTSLE
760 770 780 790 800 810
>>CCDS2182.1 LRP1B gene_id:53353|Hs109|chr2 (4599 aa)
initn: 1714 init1: 552 opt: 1405 Z-score: 928.2 bits: 186.2 E(33420): 2.3e-45
Smith-Waterman score: 2137; 32.3% identity (62.7% similar) in 1181 aa overlap (274-1413:1519-2668)
250 260 270 280 290 300
pF1KE3 THSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCGIDNGG--CSHLCLMSP
. .:::.: :::. ..: :::.::..
CCDS21 TNTLSKANKWTGQNVSVIQKTSAQPFDLQIYHPSRQPQAPNPCAANDGKGPCSHMCLINH
1490 1500 1510 1520 1530 1540
310 320 330 340 350 360
pF1KE3 VKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTPDFTDIV-LQLEDIR
. :::: .:: . ::: . ..:: :::...: ...:.: :. :. . . ::
CCDS21 NRS-AACACPHLMKLSSDKKTCYE-MKKFLLYARRSEIRGVDIDNPYFNFITAFTVPDID
1550 1560 1570 1580 1590 1600
370 380 390 400 410 420
pF1KE3 HAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIAVDWVARNLYWT
. .::.: : .:::: ....:.:.::.:.: . :.. .: :.:::::.:::::
CCDS21 DVTVIDFDASEERLYWTDIKTQTIKRAFINGTGLETVISRDIQSIRGLAVDWVSRNLYWI
1610 1620 1630 1640 1650 1660
430 440 450 460 470
pF1KE3 DTGTD--RIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIPKIERAALDG
.. : .:.:.::.:... .: . ...:. .. :. : .:::: :. :. : .::
CCDS21 SSEFDETQINVARLDGSLKTSII-HGIDKPQCLAAHPVRGKLYWTD-GNT--INMANMDG
1670 1680 1690 1700 1710 1720
480 490 500 510 520 530
pF1KE3 SDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVL--VEDKIPHIF
:. .: ... : ::..:: :.:.:: .. . :. : :: . .:. ..... .
CCDS21 SNSKILFQNQ-KEPVGLSIDYVENKLYWISSGNGTINRCNLDGGNLEVIESMKEELTKAT
1730 1740 1750 1760 1770 1780
540 550 560 570 580 590
pF1KE3 GFTLLGDYVYWTDWQRRSIERVHKRSAEREVII-DQLPDLMGLKATNVHRVIGSNPCAEE
..:.. ..:.: . .. ::... .:. .. .. .:. . . ::: : .
CCDS21 ALTIMDKKLWWADQNLAQLGTCSKRDGRNPTILRNKTSGVVHMKVYDKEAQQGSNSCQLN
1790 1800 1810 1820 1830 1840
600 610 620 630 640 650
pF1KE3 NGGCSHLCLYRPQGLR-CACPIGFELISDMKTCIVPEAFLLFSRRADIRRISLETNNN-N
:::::.::: . : : : .:. : .. .: :.::..: . :: : :: ... .
CCDS21 NGGCSQLCLPTSETTRTCMCTVGYYLQKNRMSCQGIESFLMYSVHEGIRGIPLEPSDKMD
1850 1860 1870 1880 1890 1900
660 670 680 690 700 710
pF1KE3 VAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYPEGMAVD
. .:..:.. : ..:: . .. :::::.... :::: . . : .. :: ::.:::
CCDS21 ALMPISGTSFAVGIDFHAENDTIYWTDMGFNKISRAKRDQTWKEDIITNGLGRVEGIAVD
1910 1920 1930 1940 1950 1960
720 730 740 750 760 770
pF1KE3 WLGKNLYWADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKPKI
:.. :.::.: : : :::..:.:. : :.. . ::.::..:. : .:...::::: : :
CCDS21 WIAGNIYWTDHGFNLIEVARLNGSFRYVIISQGLDQPRSIAVHPEKGLLFWTEWGQMPCI
1970 1980 1990 2000 2010 2020
780 790 800 810 820 830
pF1KE3 DRAAMDGSERTTLVP-NVGRANGLTIDYAKRRLYWTDLDTNLIESSNM-LGLNRE-VIAD
.: .::::...:: ... ::..::: . .::: : :. :: .. : ::: :..
CCDS21 GKARLDGSEKVVLVSMGIAWPNGISIDYEENKLYWCDARTDKIERIDLETGGNREMVLSG
2030 2040 2050 2060 2070 2080
840 850 860 870 880
pF1KE3 DLPHPFGLTQYQDYIYWTDWSRR--SIERANKTSGQNRTIIQGHLDYVM-DILVFHSSRQ
. :... . ::::.: .. :..:..:... . .. : . .. .:. :.
CCDS21 SNVDMFSVAVFGAYIYWSDRAHANGSVRRGHKNDATETITMRTGLGVNLKEVKIFNRVRE
2090 2100 2110 2120 2130 2140
890 900 910 920 930 940
pF1KE3 SGWNECASSNGHCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAINRM
.: : :: .:: :..::: . .:.: :: : :. :: .::.: .. .. .
CCDS21 KGTNVCARDNGGCKQLCLYRGNSRRTCAC-AHGYLAEDGVTCLRHEGYLLYSGRTILKSI
2150 2160 2170 2180 2190 2200
950 960 970 980 990
pF1KE3 VI-DEQQSPDIILPIHS---LRNVRAI--DYDPLDK---QLYWIDSRQNMIRKAQEDGSQ
. :: . . : : .. ..:: :. ::. : .... :.. . :. . :. .
CCDS21 HLSDETNLNSPIRPYENPRYFKNVIALAFDYNQRRKGTNRIFYSDAHFGNIQLIK-DNWE
2210 2220 2230 2240 2250
1000 1010 1020 1030 1040 1050
pF1KE3 GFTVVVSSVPSQNLEIQPYDLSIDIYSRYIYWTCEATNVINVTRLDGRSVG------VVL
:.: .: : .: : . : .::: .:. :. .: : :.
CCDS21 DRQVIVENVGS--VEGLAYHRAWDT----LYWTSSTTSSITRHTVDQTRPGAFDREAVIT
2260 2270 2280 2290 2300 2310
1060 1070 1080 1090 1100 1110
pF1KE3 KGEQDRPRAIVVNPEKGYMYFTNLQERSPKIERAALDGTEREVLFFSGLSKPIALALDSR
.:.:.:...... .. :..:: .:. :.: :..: : . .:. . . : .:..: :
CCDS21 MSEDDHPHVLALDECQNLMFWTNWNEQHPSIMRSTLTGKNAQVVVSTDILTPNGLTIDYR
2320 2330 2340 2350 2360 2370
1120 1130 1140 1150 1160 1170
pF1KE3 LGKLFWADSDLRRIESSDLSGANRIVLEDSNILQPVGLTVFENWLYWIDKQQQMIEKID-
::...:..: .:: . .:..: :. :. ..:.:..:...: : .. : . .
CCDS21 AEKLYFSDGSLGKIERCEYDGSQRHVIVKSGPGTFLSLAVYDNYIFWSDWGRRAILRSNK
2380 2390 2400 2410 2420 2430
1180 1190 1200 1210 1220
pF1KE3 MTGREGRTKV-QARIAQ--LSDIHAVKELNLQEYRQHPCAQDNGGCSHICLVKGDGTTRC
.:: : ::. .. : . .. : .... : : ::: :::: .::. .: . :
CCDS21 YTG--GDTKILRSDIPHQPMGIIAVANDTNSCELS--PCALLNGGCHDLCLLTPNGRVNC
2440 2450 2460 2470 2480
1230 1240 1250 1260 1270 1280
pF1KE3 SCPMHLVLLQDELSCGEPPTCSP-QQFTCFTGEIDCIPVAWRCDGFTECEDHSDE--LNC
:: .::.:. . .:. ..: : .:: :: :::. .:.:.::: : :
CCDS21 SCRGDRILLEDNRCVTKNSSCNAYSEFECGNGE--CIDYQLTCDGIPHCKDKSDEKLLYC
2490 2500 2510 2520 2530 2540
1290 1300 1310 1320 1330 1340
pF1KE3 P--VCSESQFQCASGQCIDGALRCNGDANCQDKSDEKNCEV-LCLIDQFRCANGQCIGKH
: .. : . .:: . :.:. .: :.::: .:.: : .::::.: :: .
CCDS21 ENRSCRRGFKPCYNRRCIPHGKLCDGENDCGDNSDELDCKVSTCATVEFRCADGTCIPRS
2550 2560 2570 2580 2590 2600
1350 1360 1370 1380 1390 1400
pF1KE3 KKCDHNVDCSDKSDELDCYPTEEPAPQATNTVGSVIGVIVTIFVSGTVYFICQRMLCPRM
.:..:.::.: ::: .: :. : .:: .: :. . .: . :
CCDS21 ARCNQNIDCADASDEKNCNNTD-------CTHFYKLGVKTTGFIRCNSTSLC---VLPTW
2610 2620 2630 2640 2650
1410 1420 1430 1440 1450 1460
pF1KE3 KGDGETMTNDYVVHGPASVPLGYVPHPSSLSGSLPGMSRGKSMISSLSIMGGSSGPPYDR
:: . .::
CCDS21 ICDGSNDCGDYSDELKCPVQNKHKCEENYFSCPSGRCILNTWICDGQKDCEDGRDEFHCD
2660 2670 2680 2690 2700 2710
>--
initn: 972 init1: 326 opt: 877 Z-score: 580.9 bits: 121.9 E(33420): 5e-26
Smith-Waterman score: 1436; 27.3% identity (54.1% similar) in 1331 aa overlap (21-1192:204-1517)
10 20 30 40 50
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGL
:.:: :: . .. : ::.. ::. .
CCDS21 GSYTCSCVEGYLMQPDNRSCKAKIEPTDRPPILLIANFETIE-VFYLNGSKMATLSSVNG
180 190 200 210 220 230
60 70 80 90 100
pF1KE3 EDAAAVDFVFSHGLIYW--SDVSEEAIKRTEFNKTESVQNV----VVSGLLSPDGLACDW
.. ..::.... .: : : : . .: ...:. .. . ..... . . .: ::
CCDS21 NEIHTLDFIYNEDMICWIESRESSNQLKCIQITKAGGLTDEWTINILQSFHNVQQMAIDW
240 250 260 270 280 290
110 120 130 140 150 160
pF1KE3 LGEKLYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIE
: ..::..: .:: : : .::. .:. :: .:.:::.:: .: ...::.:.: :.:
CCDS21 LTRNLYFVDHVGDRIFVCNSNGSVCVTLIDLELHNPKAIAVDPIAGKLFFTDYGNVAKVE
300 310 320 330 340 350
170 180 190 200 210 220
pF1KE3 RAGMDGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKG-S
: ::: .: ::.:. : .:.:: .. .::.: :... . .: ::..:..: .
CCDS21 RCDMDGMNRTRIIDSKTEQPAALALDLVNKLVYWVDLYLDYVGVVDYQGKNRHTVIQGRQ
360 370 380 390 400 410
230 240 250 260 270 280
pF1KE3 LPHPFALTLFEDILYWTDWSTHSILACNKYTGEGLREIHS--DIFSPMDIHAFSQQRQPN
. : ...:.::: :: :. ....:. :...: .::: : . :. .... ::.
CCDS21 VRHLYGITVFEDYLYATNSDNYNIVRINRFNGT---DIHSLIKIENAWGIRIYQKRTQPT
420 430 440 450 460
290 300 310 320 330
pF1KE3 A-TNPCGIDN----GGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLL---
. .. : .: :::::.::.: : : :: .: .:..:: .::.:.
CCDS21 VRSHACEVDPYGMPGGCSHICLLSSSYKTRTCRCRTGFNLGSDGRSCKRPKNELFLFYGK
470 480 490 500 510 520
340 350 360 370 380 390
pF1KE3 ARRTDLRRISLDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSG
.: .: ..:.: . .. .:.. . :.:. .:::..: : :. :::.
CCDS21 GRPGIVRGMDLNTKIADEYMIPIENLVNPRALDFHAETNYIYFADTTSFLIGRQKIDGTE
530 540 550 560 570 580
400 410 420 430 440 450
pF1KE3 SQFVVTAQIAHPDGIAVDWVARNLYWTDTGTDR-IEVTRLN--GTMRKILISEDLEEPRA
. .. .. . .::::::.. :::::. : . :.:.::. . :: :. .. .::.
CCDS21 RETILKDDLDNVEGIAVDWIGNNLYWTNDGHRKTINVARLEKASQSRKTLLEGEMSHPRG
590 600 610 620 630 640
460 470 480 490 500
pF1KE3 IVLDPMVGYMYWTDWGE------IPKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKI
::.::. :.:::::: : . .::.: .:: .: ..:.... :::::.::. . .
CCDS21 IVVDPVNGWMYWTDWEEDEIDDSVGRIEKAWMDGFNRQIFVTSKMLWPNGLTLDFHTNTL
650 660 670 680 690 700
510 520 530 540 550 560
pF1KE3 YWGDAKTDKIEVMNTDGTGRRVLVEDK-IPHIFGFTLLGDYVYWTDWQRRSIERVHKRSA
:: :: :.:: . .:: :... . . : ::.. :.::.:::.. :: .. ..
CCDS21 YWCDAYYDHIEKVFLNGTHRKIVYSGRELNHPFGLSHHGNYVFWTDYMNGSIFQLDLITS
710 720 730 740 750 760
570 580 590 600 610 620
pF1KE3 EREVIIDQLPDLMGLKATNVHRVIGSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISD
: .. . : :.::. . .. :.: : .::::: ::: : : ::: . : .
CCDS21 EVTLLRHERPPLFGLQIYDPRKQQGDNMCRVNNGGCSTLCLAIPGGRVCACADNQLLDEN
770 780 790 800 810 820
630 640 650 660
pF1KE3 MKTCIV-P-EAFLLFSRRADIR---R--ISLETNNNNVAIPLTGVKEASAL---------
:: : ::. . . ...: : :. . . .. : : : :.
CCDS21 GTTCTFNPGEALPHICKAGEFRCKNRHCIQARWKCDGDDDCLDGSDEDSVNCFNHSCPDD
830 840 850 860 870 880
670 680 690
pF1KE3 DFDVTDNRIY---WT-----------DISLKT------------------ISRAFMN---
.: .:: : : : .: : ::..
CCDS21 QFKCQNNRCIPKRWLCDGANDCGSNEDESNQTCTARTCQVDQFSCGNGRCIPRAWLCDRE
890 900 910 920 930 940
700 710 720 730
pF1KE3 ---GSALEHVV--EFGLDYPEGMAVDWLGKNLY--WA-----DTGTNRIEV----SKLDG
:. .... :: : . : :. . : : : . :: : .:.
CCDS21 DDCGDQTDEMASCEFPTCEPLTQFVCKSGRCISSKWHCDSDDDCGDGSDEVGCVHSCFDN
950 960 970 980 990 1000
740 750 760 770 780
pF1KE3 QHR----QVLV--WK-DLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDGSERTTLVPN
: : . . : : :. . : :. : . . .. . ::.
CCDS21 QFRCSSGRCIPGHWACDGDNDCGDFSDEAQINCTKEEIHSPAGCNGNEFQCHPDGNCVPD
1010 1020 1030 1040 1050 1060
790 800 810 820 830 840
pF1KE3 VGRANGLTI--DYAKRR-----LYWTDLDTNLIESSNMLGLNREVIADDLPHPFGLTQYQ
. : .: : . .. . : :.. :. .:. . : .. .
CCDS21 LWRCDGEKDCEDGSDEKGCNGTIRLCDHKTKFSCWSTGRCINKAWVCDGDIDCEDQSDED
1070 1080 1090 1100 1110 1120
850 860 870 880 890
pF1KE3 DYIYWTDWSRRSIERANKTSG--QNRTIIQGHLDYVMDILVFHSSRQSGW--NECASSNG
: . . :: :: : . . .:. : .. . :. .::. .::
CCDS21 DCDSFLCGPPKH-PCANDTSVCLQPEKLCNGKKD-------CPDGSDEGYLCDECSLNNG
1130 1140 1150 1160 1170 1180
900 910 920 930
pF1KE3 HCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSA---------------------------
::. : .:: :.::.:: .:: ::.::
CCDS21 GCSNHCSVVPGRGIVCSCPEGLQLNKDNKTCEIVDYCSNHLKCSQVCEQHKHTVKCSCYE
1190 1200 1210 1220 1230 1240
940 950 960 970
pF1KE3 ---------------P-TTFLLFSQKSAINRMVIDEQQSPDIILPIHSLRNVRAIDYDPL
: .:..:: . : : :: .. : : . .:::. :.:.
CCDS21 GWKLDVDGESCTSVDPFEAFIIFSIRHEIRR--IDLHKR-DYSLLVPGLRNTIALDFHFN
1250 1260 1270 1280 1290
980 990 1000 1010 1020 1030
pF1KE3 DKQLYWIDSRQNMIRKAQEDGSQGFTVVVSSVPSQNLEIQPYDLSIDIYSRYIYWTCEAT
.. ::: : .. : ... . : : ... : .. : :..: . :::
CCDS21 QSLLYWTDVVEDRIYRGKLSESGGVSAI--EVVVEHGLATPEGLTVDWIAGNIYWIDSNL
1300 1310 1320 1330 1340 1350
1040 1050 1060 1070 1080 1090
pF1KE3 NVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTNLQERSPKIERAALDGTEREV
. :.:..::: ... : ...::::...:. : ...:. . :.:: :...:. :..
CCDS21 DQIEVAKLDGSLRTTLIAGAMEHPRAIALDPRYGILFWTDWDANFPRIESASMSGAGRKT
1360 1370 1380 1390 1400 1410
1100 1110 1120 1130 1140 1150
pF1KE3 LF--FSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGANRI-VLEDSNIL-QPVGLT
.. .. . : .:..: .. :.:. : :. .:.: : ... . : .: ...
CCDS21 IYKDMKTGAWPNGLTVDHFEKRIVWTDARSDAIYSALYDGTNMIEIIRGHEYLSHPFAVS
1420 1430 1440 1450 1460 1470
1160 1170 1180 1190 1200 1210
pF1KE3 VFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKELNLQEYRQHPCAQDN
.. . .:: : . . . : . .. . .: :: :..
CCDS21 LYGSEVYWTDWRTNTLSKANKWTGQNVSVIQKTSAQPFDLQIYHPSRQPQAPNPCAANDG
1480 1490 1500 1510 1520 1530
1220 1230 1240 1250 1260 1270
pF1KE3 GGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSPQQFTCFTGEIDCIPVAWRCD
CCDS21 KGPCSHMCLINHNRSAACACPHLMKLSSDKKTCYEMKKFLLYARRSEIRGVDIDNPYFNF
1540 1550 1560 1570 1580 1590
>--
initn: 919 init1: 417 opt: 765 Z-score: 507.3 bits: 108.3 E(33420): 6.4e-22
Smith-Waterman score: 1078; 31.3% identity (52.9% similar) in 788 aa overlap (599-1360:2978-3667)
570 580 590 600 610 620
pF1KE3 IDQLPDLMGLKATNVHRVIGSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDM----
::. :. .: : :.:. :
CCDS21 SYKCKCWPGFQLKDDGKTCVDIDECSSGFPCSQQCINTYGTYKCLCTDGYEIQPDNPNGC
2950 2960 2970 2980 2990 3000
630 640 650 660 670 680
pF1KE3 KTCIVPEAFLLFSRRADIRRISLETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLK
:. : ::... . .::.:: :...: .. :.... :.::: .. ::: : :
CCDS21 KSLSDEEPFLILADHHEIRKIS--TDGSNYTLLKQGLNNVIAIDFDYREEFIYWIDSSRP
3010 3020 3030 3040 3050 3060
690 700 710 720 730 740
pF1KE3 T---ISRAFMNGSALEHVVEFGLDYPEGMAVDWLGKNLYWADTGTNRIEVSKLDGQHRQV
. :.: .::: .. : . :...::::.::::::.:: ::::::.: . .
CCDS21 NGSRINRMCLNGSDIK--VVHNTAVPNALAVDWIGKNLYWSDTEKRIIEVSKLNGLYPTI
3070 3080 3090 3100 3110 3120
750 760 770 780 790 800
pF1KE3 LVWKDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDGSERTTLVPN-VGRANGLTIDY
:: : : :: :.::: :..:: . :.: :..:::....... . ..: .:::::
CCDS21 LVSKRLKFPRDLSLDPQAGYLYWIDCCEYPHIGRVGMDGTNQSVVIETKISRPMALTIDY
3130 3140 3150 3160 3170 3180
810 820 830 840 850
pF1KE3 AKRRLYWTDLDTNLIESSNMLGLNREVIAD-DLPHPFGLTQYQDYIYWTDWSRRSIERAN
..:::::.: : :: ::: : .:. . . :.: ..:: ..::::::: . .:. ::.
CCDS21 VNRRLYWAD--ENHIEFSNMDGSHRHKVPNQDIPGVIALTLFEDYIYWTDGKTKSLSRAH
3190 3200 3210 3220 3230 3240
860 870 880 890 900 910
pF1KE3 KTSGQNRTIIQGHLDYVMDILVFHSSRQSGWNE--CASSNGHCSHLCLAVPVGGFVCGCP
:::: .: . . :: :.:: :: .. : .:: :::::: .: .:.::
CCDS21 KTSGADRLSLIYSWHAITDIQVYHSYRQPDVSKHLCMINNGGCSHLCLLAPGKTHTCACP
3250 3260 3270 3280 3290 3300
920 930 940 950 960 970
pF1KE3 AHYSLNADNRTCSAPTTFLLFSQKSAINRMVIDEQQSPDIILPIHSLRNVRAIDYDPLDK
... : :::::: . : : :. : .:
CCDS21 TNFYLAADNRTCLSNCTASQFRCKT-------------DKCIP-----------------
3310 3320 3330
980 990 1000 1010 1020 1030
pF1KE3 QLYWIDSRQNMIRKAQEDGSQGFTVVVSSVPSQNLEI--QPYDLSIDI-YSRYIYWTCEA
..: . . . .: ..: :. :.. :. :: .. . :..
CCDS21 -FWW---KCDTV----DDCGDG-----SDEPDDCPEFRCQPGRFQCGTGLCALPAFICDG
3340 3350 3360 3370
1040 1050 1060 1070 1080
pF1KE3 TNVI--NVTRLDGRSVGVVLKGE---QDRPRAIVVNPEKGYMYFTNLQER--SPKIERAA
: : .:. . : :.:. . : :: . : :. . . ::
CCDS21 ENDCGDNSDELNCDT-HVCLSGQFKCTKNQKCIPVNLR------CNGQDDCGDEEDERDC
3380 3390 3400 3410 3420 3430
1090 1100 1110 1120 1130 1140
pF1KE3 LDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGANRIVLEDSNILQP
... : .: ..::. : : ..:: .. .. . ..
CCDS21 PENSCSPDYFQCKTTKHC-------ISKLWVCDEDPDCADASDEANCDKKTCGPHEFQCK
3440 3450 3460 3470 3480
1150 1160 1170 1180 1190 1200
pF1KE3 VGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKELNLQEYRQHPC
. . ..: :.:.. .. : : : :. :.:. :
CCDS21 NNNCIPDHWR--CDSQNDCSDNSD----EENCKPQT--CTLKDFL--------------C
3490 3500 3510 3520
1210 1220 1230 1240 1250 1260
pF1KE3 AQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSPQQFTCFTGEIDCIPVA
: :: : :: :. .:: .: .:: .:: : .:. :::.
CCDS21 A--NGDCVS-SRFWCDGDFDCADG------SDERNC--ETSCSKDQFRCSNGQ--CIPAK
3530 3540 3550 3560
1270 1280 1290 1300 1310 1320
pF1KE3 WRCDGFTECEDHSDELNC----PVCSESQFQCASGQCIDGALRCNGDANCQDKSDEKNCE
:.::: .:. :: .: :.:: .. ::: ::...:.:::. .: : ::: .:
CCDS21 WKCDGHEDCKYGEDEKSCEPASPTCSSREYICASDGCISASLKCNGEYDCADGSDEMDCV
3570 3580 3590 3600 3610 3620
1330 1340 1350 1360 1370 1380
pF1KE3 VLCLIDQFRCAN-GQCIGKHKKCDHNVDCSDKSDELDCYPTEEPAPQATNTVGSVIGVIV
. : ::::: : ..:: . :: :: : ::: .:
CCDS21 TECKEDQFRCKNKAHCIPIRWLCDGIHDCVDGSDEENCERGGNICRADEFLCNNSLCKLH
3630 3640 3650 3660 3670 3680
1390 1400 1410 1420 1430 1440
pF1KE3 TIFVSGTVYFICQRMLCPRMKGDGETMTNDYVVHGPASVPLGYVPHPSSLSGSLPGMSRG
CCDS21 FWVCDGEDDCGDNSDEAPDMCVKFLCPSTRPHRCRNNRICLQSEQMCNGIDECGDNSDED
3690 3700 3710 3720 3730 3740
>>CCDS33626.1 LRP5L gene_id:91355|Hs109|chr22 (252 aa)
initn: 1080 init1: 1080 opt: 1082 Z-score: 733.8 bits: 146.0 E(33420): 1.5e-34
Smith-Waterman score: 1082; 62.6% identity (84.6% similar) in 246 aa overlap (370-615:1-246)
340 350 360 370 380 390
pF1KE3 RRISLDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVT
.::..::::::: ::::...::::.: ...
CCDS33 MEGHVYWTDDEVWAIRRAYLDGSGAQTLIN
10 20 30
400 410 420 430 440 450
pF1KE3 AQIAHPDGIAVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGY
..: :: :::.::::.:::: :::..:::: ::.: .:::.:::..:::::.: : .:
CCDS33 TKINDPDDIAVNWVARSLYWTHTGTEHIEVTCLNSTSHKILVSEDMDEPRAIALHPEMGL
40 50 60 70 80 90
460 470 480 490 500 510
pF1KE3 MYWTDWGEIPKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNT
:: :::: :.:.:: :: .. ::::.::::::::::: .:::.:::::::::::....
CCDS33 TYWIDWGENPEIKRANLDRQELRVLVNASLGWPNGLALDLQEGKLYWGDAKTDKIEAISV
100 110 120 130 140 150
520 530 540 550 560 570
pF1KE3 DGTGRRVLVEDKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLK
: : :..:..::.:::: ::::::..::: ::..::.:::: .:.:.:::::::::::::
CCDS33 DETKRQTLLKDKLPHIFRFTLLGDFIYWTAWQHHSIKRVHKVKANRDVIIDQLPDLMGLK
160 170 180 190 200 210
580 590 600 610 620 630
pF1KE3 ATNVHRVIGSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRR
:.:: .:.:.:: :..::: . :: : :
CCDS33 AVNVDKVVGTNPHADRNGGAATCASSRPTQPGLAAPSRAWNC
220 230 240 250
640 650 660 670 680 690
pF1KE3 ADIRRISLETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHV
>>CCDS8932.1 LRP1 gene_id:4035|Hs109|chr12 (4544 aa)
initn: 1221 init1: 766 opt: 996 Z-score: 659.3 bits: 136.4 E(33420): 2.2e-30
Smith-Waterman score: 2323; 33.8% identity (63.8% similar) in 1211 aa overlap (278-1430:1532-2705)
250 260 270 280 290 300
pF1KE3 LACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATNPCGIDNGG---CSHLCLMSPVKP
::: : ::: ::: ::::::.. .
CCDS89 AKANKWTGHNVTVVQRTNTQPFDLQVYHPSRQPMAPNPCEA-NGGQGPCSHLCLINYNRT
1510 1520 1530 1540 1550 1560
310 320 330 340 350 360
pF1KE3 FYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRISLDTPDFTDIV-LQLEDIRHAI
.:::: .:: ... :: . ..:: ::. ..: ..::.: .. :. . . :: ..
CCDS89 V-SCACPHLMKLHKDNTTCYE-FKKFLLYARQMEIRGVDLDAPYYNYIISFTVPDIDNVT
1570 1580 1590 1600 1610
370 380 390 400 410 420
pF1KE3 AIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIAVDWVARNLYWT--D
..::: : .::.: ...::.:.::.:.: . ::.:.. . :.:::::.:::.:: :
CCDS89 VLDYDAREQRVYWSDVRTQAIKRAFINGTGVETVVSADLPNAHGLAVDWVSRNLFWTSYD
1620 1630 1640 1650 1660 1670
430 440 450 460 470 480
pF1KE3 TGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIPKIERAALDGSDR
:. .:.:.::.:.... .. . ::.:...:. :. : .:::: :. .: : .:::.:
CCDS89 TNKKQINVARLDGSFKNAVV-QGLEQPHGLVVHPLRGKLYWTD-GD--NISMANMDGSNR
1680 1690 1700 1710 1720 1730
490 500 510 520 530
pF1KE3 VVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVL--VEDKIPHIFGFT
..: . . : : :::.:. :.:.:: .. . :. : ::.: .:. ..... . ...
CCDS89 TLLFSGQKG-PVGLAIDFPESKLYWISSGNHTINRCNLDGSGLEVIDAMRSQLGKATALA
1740 1750 1760 1770 1780 1790
540 550 560 570 580 590
pF1KE3 LLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDL-MGLKATNV-----HRVIGSNPCA
..:: ..:.: ... : .. :.. . : : .:. . :. :.:::.
CCDS89 IMGDKLWWADQVSEKMGTCSKADGSGSVVLRNSTTLVMHMKVYDESIQLDHK--GTNPCS
1800 1810 1820 1830 1840 1850
600 610 620 630 640 650
pF1KE3 EENGGCSHLCLYRPQGLR-CACPIGFELISDMKTCIVPEAFLLFSRRADIRRISLETNNN
.:: ::.::: . : : : :. : : ...: .:::.: . :: : :. :..
CCDS89 VNNGDCSQLCLPTSETTRSCMCTAGYSLRSGQQACEGVGSFLLYSVHEGIRGIPLDPNDK
1860 1870 1880 1890 1900 1910
660 670 680 690 700 710
pF1KE3 NVA-IPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYPEGMA
. : .:..:.. : ..:: . .. :::.:..:.::::: . . : :: :. ::.:
CCDS89 SDALVPVSGTSLAVGIDFHAENDTIYWVDMGLSTISRAKRDQTWREDVVTNGIGRVEGIA
1920 1930 1940 1950 1960 1970
720 730 740 750 760 770
pF1KE3 VDWLGKNLYWADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKP
:::.. :.::.: : . :::..:.:. : :.. . ::.:::... : .:...::::: :
CCDS89 VDWIAGNIYWTDQGFDVIEVARLNGSFRYVVISQGLDKPRAITVHPEKGYLFWTEWGQYP
1980 1990 2000 2010 2020 2030
780 790 800 810 820
pF1KE3 KIDRAAMDGSERTTLVP-NVGRANGLTIDYAKRRLYWTDLDTNLIESSNM-LGLNREVI-
.:.:. .::.::..:: ... ::...:: .::: : :. :: .. : ::::.
CCDS89 RIERSRLDGTERVVLVNVSISWPNGISVDYQDGKLYWCDARTDKIERIDLETGENREVVL
2040 2050 2060 2070 2080 2090
830 840 850 860 870 880
pF1KE3 ADDLPHPFGLTQYQDYIYWTDWSRR--SIERANKTSGQNRTIIQGHLDYVM-DILVFHSS
... :... ..:.:::.: .. ::.:..: .. . . .. . . :: ::. .
CCDS89 SSNNMDMFSVSVFEDFIYWSDRTHANGSIKRGSKDNATDSVPLRTGIGVQLKDIKVFNRD
2100 2110 2120 2130 2140 2150
890 900 910 920 930 940
pF1KE3 RQSGWNECASSNGHCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPTTFLLFSQKSAIN
::.: : :: .:: :..::: : .:.: :: : :. .: . .::.:... ..
CCDS89 RQKGTNVCAVANGGCQQLCLYRGRGQRACAC-AHGMLAEDGASCREYAGYLLYSERTILK
2160 2170 2180 2190 2200 2210
950 960 970 980 990
pF1KE3 RMVI-DEQQSPDIILPIHS---LRNVRAIDYD------P-LDKQLYWIDSRQNMIRKAQE
. . ::.. . :... ..:: :. .: : ..... : . . :.. ..
CCDS89 SIHLSDERNLNAPVQPFEDPEHMKNVIALAFDYRAGTSPGTPNRIFFSDIHFGNIQQIND
2220 2230 2240 2250 2260 2270
1000 1010 1020 1030 1040
pF1KE3 DGSQGFTVVVSSVPSQNLEIQPYDLSIDIYSRYIYWTCEATNVINVTRLDGRSVG-----
:::. .:.: .: : .: : . : .::: .:..:. .: :
CCDS89 DGSRRITIV-ENVGS--VEGLAYHRGWDT----LYWTSYTTSTITRHTVDQTRPGAFERE
2280 2290 2300 2310 2320
1050 1060 1070 1080 1090 1100
pF1KE3 -VVLKGEQDRPRAIVVNPEKGYMYFTNLQERSPKIERAALDGTEREVLFFSGLSKPIALA
:. . .:.:::.:.. .. :..:: .:. :.: ::::.:.. .:. . . : .::
CCDS89 TVITMSGDDHPRAFVLDECQNLMFWTNWNEQHPSIMRAALSGANVLTLIEKDIRTPNGLA
2330 2340 2350 2360 2370 2380
1110 1120 1130 1140 1150 1160
pF1KE3 LDSRLGKLFWADSDLRRIESSDLSGANRIVLEDSNILQPVGLTVFENWLYWIDKQQQMIE
.: : ::...:. : .:: . .:..: :. :. ..: ::.:. . ..: : .. ..
CCDS89 IDHRAEKLYFSDATLDKIERCEYDGSHRYVILKSEPVHPFGLAVYGEHIFWTDWVRRAVQ
2390 2400 2410 2420 2430 2440
1170 1180 1190 1200 1210 1220
pF1KE3 KID-MTGREGRT-KVQARIAQLSDIHAVKELNLQEYRQHPCAQDNGGCSHICLVKGDGTT
. . .: . . .:. .. : .... : : :: .::::. .::. .: .
CCDS89 RANKHVGSNMKLLRVDIPQQPMGIIAVANDTNSCEL--SPCRINNGGCQDLCLLTHQGHV
2450 2460 2470 2480 2490 2500
1230 1240 1250 1260 1270 1280
pF1KE3 RCSCPMHLVLLQDELSC-GEPPTCSPQ-QFTCFTGEIDCIPVAWRCDGFTECEDHSDE--
::: .: ::.:.: . .: : .: : .:: :: . ::: .:.:.:::
CCDS89 NCSCRGGRIL-QDDLTCRAVNSSCRAQDEFECANGE--CINFSLTCDGVPHCKDKSDEKP
2510 2520 2530 2540 2550
1290 1300 1310 1320 1330
pF1KE3 --LNCPVCSESQFQCASGQCIDGALRCNGDANCQDKSDEKNC-EVLCLIDQFRCANGQCI
: :... ::..:.:... : ::: .: : ::: : .. : . .::: .: ::
CCDS89 SYCNSRRCKKTFRQCSNGRCVSNMLWCNGADDCGDGSDEIPCNKTACGVGEFRCRDGTCI
2560 2570 2580 2590 2600 2610
1340 1350 1360 1370 1380 1390
pF1KE3 GKHKKCDHNVDCSDKSDELDCYPTEEPAPQATNTVGSVIGVIVTIFVSGTVYFICQRM-L
:. ..:.. ::: : :::..: :. . . :.:... :.: :
CCDS89 GNSSRCNQFVDCEDASDEMNCSATDCSS-------------YFRLGVKGVLFQPCERTSL
2620 2630 2640 2650 2660
1400 1410 1420 1430 1440
pF1KE3 C--PRMKGDGETMTNDYV-------VHGPASVPLGYVPHPSSLSGSLPGMSRGKSMISSL
: : :: . .:: :. : ::.: ::
CCDS89 CYAPSWVCDGANDCGDYSDERDCPGVKRP-RCPLNYFACPSGRCIPMSWTCDKEDDCEHG
2670 2680 2690 2700 2710 2720
1450 1460 1470 1480 1490 1500
pF1KE3 SIMGGSSGPPYDRAHVTGASSSSSSSTKGTYFPAILNPPPSPATERSHYTMEFGYSSNSP
CCDS89 EDETHCNKFCSEAQFECQNHRCISKQWLCDGSDDCGDGSDEAAHCEGKTCGPSSFSCPGT
2730 2740 2750 2760 2770 2780
>--
initn: 1221 init1: 766 opt: 996 Z-score: 659.3 bits: 136.4 E(33420): 2.2e-30
Smith-Waterman score: 1271; 26.4% identity (51.8% similar) in 1466 aa overlap (21-1394:3029-4365)
10 20 30 40 50
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGL
:.:..::: :: .. .:. : :.. ::
CCDS89 THGSYKCLCVEGYAPRGGDPHSCKAVTDEEPFLIFANRYYLRKLN-LDGS-NYTLLKQGL
3000 3010 3020 3030 3040 3050
60 70 80 90 100
pF1KE3 EDAAAVDFVFSHGLIYWSDVSEEA--IKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEK
..:.:.:: . . .:::.::. .. :.: ..: . .:: . .:: .::::: ::.: .
CCDS89 NNAVALDFDYREQMIYWTDVTTQGSMIRRMHLNGS-NVQVLHRTGLSNPDGLAVDWVGGN
3060 3070 3080 3090 3100 3110
110 120 130 140 150 160
pF1KE3 LYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVPKIERAGM
::: :. . ::::.:.:. : :: . : .:::...: ..:..::::::. : : ::
CCDS89 LYWCDKGRDTIEVSKLNGAYRTVLVSSGLREPRALVVDVQNGYLYWTDWGDHSLIGRIGM
3120 3130 3140 3150 3160 3170
170 180 190 200 210 220
pF1KE3 DGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKGSLPHPF
::::: .:....: ::::::::: ...:::::. ..:. ..:::.::..:.. ..:: :
CCDS89 DGSSRSVIVDTKITWPNGLTLDYVTERIYWADAREDYIEFASLDGSNRHVVLSQDIPHIF
3180 3190 3200 3210 3220 3230
230 240 250 260 270 280
pF1KE3 ALTLFEDILYWTDWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNATN-PCG
::::::: .::::: :.:: .: :: . . : . :::.:.: :::.. : ::
CCDS89 ALTLFEDYVYWTDWETKSINRAHKTTGTNKTLLISTLHRPMDLHVFHALRQPDVPNHPCK
3240 3250 3260 3270 3280 3290
290 300 310 320 330
pF1KE3 IDNGGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLLAR------------
..:::::.:::.:: ..:::::. : .:.:: .. : .. .
CCDS89 VNNGGCSNLCLLSP-GGGHKCACPTNFYLGSDGRTCVSNCTASQFVCKNDKCIPFWWKCD
3300 3310 3320 3330 3340 3350
340 350 360 370 380 390
pF1KE3 -RTDLRRISLDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGS
. : : . :: .. . ... . .: .:. .: :.. . :.: .
CCDS89 TEDDCGDHSDEPPDCPEFKCRPGQFQCSTGICTNPA--FICDGDNDCQ-------DNS-D
3360 3370 3380 3390 3400
400 410 420 430 440 450
pF1KE3 QFVVTAQIAHPDGIAVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLD
. .. :. . . : . : . : :: . . .:: .. ..
CCDS89 EANCDIHVCLPSQFKCTNTNRCI----PG-----IFRCNG-QDNCGDGEDERDCPEVTCA
3410 3420 3430 3440 3450
460 470 480 490 500
pF1KE3 PMVGYMYWTDWGEIPKI-----ERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDA
: .. ::.. . .::::. . . . . : :. .
CCDS89 PN-QFQCSITKRCIPRVWVCDRDNDCVDGSDEPANCTQMTCGVDEFRCK-DSGRCIPARW
3460 3470 3480 3490 3500 3510
510 520 530 540 550 560
pF1KE3 KTDKIEVMNTDGTGR-RVLVEDKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVI
: : : ::. . . ... . . : .. :: . : :.
CCDS89 KCDG-EDDCGDGSDEPKEECDERTCEPYQFRCKNNRCVPGRWQCDYDNDCGDNSDEESC-
3520 3530 3540 3550 3560 3570
570 580 590 600 610 620
pF1KE3 IDQLPDLMGLKATNVHRVIGSNPCAEENGGCSH-LCL---YRPQGLRCACPIGFELISDM
: ::.: . .:.. :. .. .: . : : ::
CCDS89 ---TP----------------RPCSESEFSCANGRCIAGRWKCDGDH-DCADG----SDE
3580 3590 3600
630 640 650 660 670 680
pF1KE3 KTCIVPEAFLLFSRRADIRRISLETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLK
: : .: : :. ... .... ::: .:.: .: .:.. : .
CCDS89 KDC-TP--------RCDMDQFQCKSGH---CIPLRWRCDADADCMDGSDEEACGTGVRTC
3610 3620 3630 3640 3650
690 700 710 720 730 740
pF1KE3 TISRAFMNGSALEHVVEFGLDYPEGMAVDWLGKNLYWADTGTNRIEVSKLDGQHRQVLVW
... :. ...: . : . : :.. : : : : .
CCDS89 PLDE-FQCNNTLCK--------PLAWKCD--GED----DCGDNSDENPE-----------
3660 3670 3680
750 760 770 780 790 800
pF1KE3 KDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDGSERTTLVPNVGRANGLTIDYAKRR
. : .. : . : . : ::. . ... . : : .: . .
CCDS89 ---ECAR-FVCPPNRPF--------RCKNDRVCLWIGRQCDGTDNCG--DGTDEEDCEPP
3690 3700 3710 3720 3730
810 820 830 840 850
pF1KE3 LYWTDLDTNLIESSNMLGLNREVIADDLPHPFGLTQYQDYIYWTDWSRRSIE--------
: :. .....: :.. ....: ....: .: ::.
CCDS89 TAHT---THCKDKKEFLCRNQRCLSSSLR----CNMFDDCGDGSDEEDCSIDPKLTSCAT
3740 3750 3760 3770 3780
860 870 880 890 900 910
pF1KE3 RANKTSGQNRTIIQGHLDYVMDILVFHS-SRQSG---WNECASSNGHCSHLCLAVPVGGF
:. . . : . . : ::. : : ::: : ::.:: . ::
CCDS89 NASICGDEARCVRTEKAAYCACRSGFHTVPGQPGCQDINECLRF-GTCSQLCNNTK-GGH
3790 3800 3810 3820 3830 3840
920 930 940 950 960
pF1KE3 VCGCPAHYSLNADNRTCSAPTT---FLLFSQKSAINRMVIDEQQSP--DIILPIHSLRNV
.:.: .. ... : ::.: . : ... . : . . .: . . .:.: .
CCDS89 LCSCARNF-MKTHN-TCKAEGSEYQVLYIADDNEIRSLFPGHPHSAYEQAFQGDESVR-I
3850 3860 3870 3880 3890 3900
970 980 990 1000 1010
pF1KE3 RAIDYDPLDKQLYWID------SRQNMIRKAQEDGSQGFTVVVS-SVPSQNLE--IQPYD
:.: ..:: . : ... : :. .. .: :. .:
CCDS89 DAMDVHVKAGRVYWTNWHTGTISYRSLPPAAPPTTSNRHRRQIDRGVTHLNISGLKMPRG
3910 3920 3930 3940 3950 3960
1020 1030 1040 1050 1060 1070
pF1KE3 LSIDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTNLQE
..:: . .::: . .::.:... :.. ....: :.:.::::.: .: ::... .
CCDS89 IAIDWVAGNVYWTDSGRDVIEVAQMKGENRKTLISGMIDEPHAIVVDPLRGTMYWSDWGN
3970 3980 3990 4000 4010 4020
1080 1090 1100 1110 1120 1130
pF1KE3 RSPKIERAALDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGANRIV
. :::: ::.::: ::.: .... : .::.: . .:.:::. : : : :.:.. ::
CCDS89 H-PKIETAAMDGTLRETLVQDNIQWPTGLAVDYHNERLYWADAKLSVIGSIRLNGTDPIV
4030 4040 4050 4060 4070 4080
1140 1150 1160 1170 1180 1190
pF1KE3 LEDSN--ILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKE
::. . .: .. :::...: . .. . :: :. ... . ... ::. .. .
CCDS89 AADSKRGLSHPFSIDVFEDYIYGVTYINNRVFKIHKFGHSPLVNLTGGLSHASDV-VLYH
4090 4100 4110 4120 4130 4140
1200 1210 1220 1230 1240
pF1KE3 LNLQEYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSC-----GEPP----
. : .:: : : .::.. .: . :.:: : :. .: ::
CCDS89 QHKQPEVTNPC--DRKKCEWLCLLSPSGPV-CTCPNGKRL--DNGTCVPVPSPTPPPDAP
4150 4160 4170 4180 4190
1250 1260 1270 1280 1290
pF1KE3 ---TCSPQQF---TCFTG-----EIDCIP--VAWRCDGFTECEDHSDELNCPVCSESQ--
::. : : .:: . . : : .. .:. . .: .: : .:. :
CCDS89 RPGTCNLQCFNGGSCFLNARRQPKCRCQPRYTGDKCE-LDQCWEHCR--NGGTCAASPSG
4200 4210 4220 4230 4240 4250
1300 1310 1320 1330 1340
pF1KE3 ---FQCASG----QCIDG--ALRCNGDANCQ-DKSDEKNCEVLCLIDQFRCANGQCIGKH
.: .: .: . : : ....: ..... .:. : . :: :: :
CCDS89 MPTCRCPTGFTGPKCTQQVCAGYCANNSTCTVNQGNQPQCRCLPGFLGDRCQYRQCSGY-
4260 4270 4280 4290 4300 4310
1350 1360 1370 1380 1390
pF1KE3 KKCDHNVDC---SDKSDELDCYPTEEPAPQATNTVGSVI-GVIVTIFVSGTVYFICQRML
:.. : .: : . : : . .: . . :. :. :: : :
CCDS89 --CENFGTCQMAADGSRQCRCTAYFEGSRCEVNKCSRCLEGACVVNKQSGDVTCNCTDGR
4320 4330 4340 4350 4360
1400 1410 1420 1430 1440 1450
pF1KE3 CPRMKGDGETMTNDYVVHGPASVPLGYVPHPSSLSGSLPGMSRGKSMISSLSIMGGSSGP
CCDS89 VAPSCLTCVGHCSNGGSCTMNSKMMPECQCPPHMTGPRCEEHVFSQQQPGHIASILIPLL
4370 4380 4390 4400 4410 4420
>--
initn: 766 init1: 359 opt: 562 Z-score: 373.8 bits: 83.6 E(33420): 1.7e-14
Smith-Waterman score: 1415; 27.3% identity (52.5% similar) in 1346 aa overlap (21-1187:199-1521)
10 20 30 40 50
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGL
:.:: :: ... :. .: . .::. .
CCDS89 GSFICGCVEGYLLQPDNRSCKAKNEPVDRPPVLLIANSQNI-LATYLSGAQVSTITPTST
170 180 190 200 210 220
60 70 80 90 100
pF1KE3 EDAAAVDFVFSHGLIYWSDVSEEAIK------RTEFNK---TESVQNVVVSGLLSPDGLA
....:.:: ... . : :.. : . : : : . :. .: : . .:
CCDS89 RQTTAMDFSYANETVCWVHVGDSAAQTQLKCARMPGLKGFVDEHTINISLS-LHHVEQMA
230 240 250 260 270 280
110 120 130 140 150 160
pF1KE3 CDWLGEKLYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIALDPSSGFMYWTDWGEVP
::: ..:..:. .:: : : .:. .:. :: .:..:::::. : ...::.:..:
CCDS89 IDWLTGNFYFVDDIDDRIFVCNRNGDTCVTLLDLELYNPKGIALDPAMGKVFFTDYGQIP
290 300 310 320 330 340
170 180 190 200 210 220
pF1KE3 KIERAGMDGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVK
:.:: :::..: ...:.: .:.:.::: . .::::: :..:. . .: .::....
CCDS89 KVERCDMDGQNRTKLVDSKIVFPHGITLDLVSRLVYWADAYLDYIEVVDYEGKGRQTIIQ
350 360 370 380 390 400
230 240 250 260 270
pF1KE3 GSL-PHPFALTLFEDILYWTD------WSTHSILACNKYTGEGLREIHSDIFSPMDIHAF
: : : ..::.::. :: :. . :.. :.... .. . . . .: .
CCDS89 GILIEHLYGLTVFENYLYATNSDNANAQQKTSVIRVNRFNSTEY-QVVTRVDKGGALHIY
410 420 430 440 450 460
280 290 300 310 320
pF1KE3 SQQRQPNA-TNPCGIDN----GGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATE
:.::: . .. : :. :::: .::.. . : : .: .: .::.:: :
CCDS89 HQRRQPRVRSHACENDQYGKPGGCSDICLLANSHKARTCRCRSGFSLGSDGKSCKKPEHE
470 480 490 500 510 520
330 340 350 360 370 380
pF1KE3 LLLL---ARRTDLRRISLDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRR
:.:. .: .: ... . . .. .:.. . :.:. :.::..: : :
CCDS89 LFLVYGKGRPGIIRGMDMGAKVPDEHMIPIENLMNPRALDFHAETGFIYFADTTSYLIGR
530 540 550 560 570 580
390 400 410 420 430 440
pF1KE3 SFIDGSGSQFVVTAQIAHPDGIAVDWVARNLYWTDTGTDR-IEVTRLN--GTMRKILISE
. :::. . .. : . .:.::::.. :::::: : . : :.::. . :: ::
CCDS89 QKIDGTERETILKDGIHNVEGVAVDWMGDNLYWTDDGPKKTISVARLEKAAQTRKTLIEG
590 600 610 620 630 640
450 460 470 480 490
pF1KE3 DLEEPRAIVLDPMVGYMYWTDWGEIPK------IERAALDGSDRVVLVNT-SLGWPNGLA
. .:::::.::. :.:::::: : :: .::: .::: : ..:.. .. :::::.
CCDS89 KMTHPRAIVVDPLNGWMYWTDWEEDPKDSRRGRLERAWMDGSHRDIFVTSKTVLWPNGLS
650 660 670 680 690 700
500 510 520 530 540 550
pF1KE3 LDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLVED-KIPHIFGFTLLGDYVYWTDWQRRSI
:: :..:: :: :.::.. .:: :... : .. : ::. :.:..::... :.
CCDS89 LDIPAGRLYWVDAFYDRIETILLNGTDRKIVYEGPELNHAFGLCHHGNYLFWTEYRSGSV
710 720 730 740 750 760
560 570 580 590 600 610
pF1KE3 ERVHKR--SAEREVII--DQLPDLMGLKATNVHRV-IGSNPCAEENGGCSHLCLYRPQGL
:... .: : . .. : .. .. .... .:.: : .::::: ::: : .
CCDS89 YRLERGVGGAPPTVTLLRSERPPIFEIRMYDAQQQQVGTNKCRVNNGGCSSLCLATPGSR
770 780 790 800 810 820
620 630 640 650
pF1KE3 RCACPIGFELISDMKTCIV-----------PEAFLLFSRRADIRRISLETNN----NNVA
.::: : .: ::.. : : . : .: . . .: :.
CCDS89 QCACAEDQVLDADGVTCLANPSYVPPPQCQPGEFACANSRCIQERWKCDGDNDCLDNSDE
830 840 850 860 870 880
660 670 680 690
pF1KE3 IPLTGVKEASALD-FDVTDNRIY---WT-----------DISLKTISR--------AFMN
: ... : : .:: : : : : : . .
CCDS89 APALCHQHTCPSDRFKCENNRCIPNRWLCDGDNDCGNSEDESNATCSARTCPPNQFSCAS
890 900 910 920 930 940
700 710 720 730
pF1KE3 GSALEHVVEFGLD--------------YPEGMAVDWL----GK--NLYW-ADTGTNRIEV
: . :: :: . . . :. :. : :. .. .
CCDS89 GRCIPISWTCDLDDDCGDRSDESASCAYPTCFPLTQFTCNNGRCININWRCDNDNDCGDN
950 960 970 980 990 1000
740 750 760 770 780
pF1KE3 SKLDG-QHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDGSERTTLV--P
: : .: . .: : . : .:: : . : . .. :. . :
CCDS89 SDEAGCSHSCSSTQFKCNSGRCI---PE----HWTCDGDNDCGDYSDETHANCTNQATRP
1010 1020 1030 1040 1050
790 800 810 820 830
pF1KE3 NVG--------RANGLTIDYAKRRLYWT-DLDTNLIESSNMLGLNREVIADDLPHPFGLT
: : .:: : : : : ::. ..::. . . . . : ::
CCDS89 PGGCHTDEFQCRLDGLCIP-----LRWRCDGDTDCMDSSDEKSCEGVTHVCDPSVKFGCK
1060 1070 1080 1090 1100 1110
840 850 860 870 880
pF1KE3 QYQDYIY--WT-----DWSRRSIE--------RANKTSGQNRTIIQGHLDYVMD-ILVFH
. : :. : : : : . : : . : . :
CCDS89 DSARCISKAWVCDGDNDCEDNSDEENCESLACRPPSHPCANNTSVCLPPDKLCDGNDDCG
1120 1130 1140 1150 1160 1170
890 900 910 920 930
pF1KE3 SSRQSGW--NECASSNGHCSHLCLAVPVGGFVCGCPAHYSLNADNRTCSAPT--------
.. . : ..:. .:: ::: : ..: :.::.:: . :. ::.::. .
CCDS89 DGSDEGELCDQCSLNNGGCSHNCSVAPGEGIVCSCPLGMELGPDNHTCQIQSYCAKHLKC
1180 1190 1200 1210 1220 1230
940 950
pF1KE3 -----------------------------------TFLLFSQKSAINRMVIDEQQSPDII
:..::.. : : :: ... .
CCDS89 SQKCDQNKFSVKCSCYEGWVLEPDGESCRSLDPFKPFIIFSNRHEIRR--IDLHKGDYSV
1240 1250 1260 1270 1280 1290
960 970 980 990 1000 1010
pF1KE3 LPIHSLRNVRAIDYDPLDKQLYWIDSRQNMIRKAQ--EDGS-QGFTVVVSSVPSQNLEIQ
: . .:::. :.:. .. ::: : .. : ... ..:. .: ::. :
CCDS89 L-VPGLRNTIALDFHLSQSALYWTDVVEDKIYRGKLLDNGALTSFEVVI-----QYGLAT
1300 1310 1320 1330 1340
1020 1030 1040 1050 1060 1070
pF1KE3 PYDLSIDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTN
: :..: . :::. . :.:..::: ..: :. ..::::...:. : ...:.
CCDS89 PEGLAVDWIAGNIYWVESNLDQIEVAKLDGTLRTTLLAGDIEHPRAIALDPRDGILFWTD
1350 1360 1370 1380 1390 1400
1080 1090 1100 1110 1120 1130
pF1KE3 LQERSPKIERAALDGTEREVLFFSGLSK--PIALALDSRLGKLFWADSDLRRIESSDLSG
. :.:: :...:. :... : : .:..: ...: :. : :. .:
CCDS89 WDASLPRIEAASMSGAGRRTVHRETGSGGWPNGLTVDYLEKRILWIDARSDAIYSARYDG
1410 1420 1430 1440 1450 1460
1140 1150 1160 1170 1180 1190
pF1KE3 ANRI-VLEDSNIL-QPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDI
.... ::. ..: .: ..:.. . .:: : . . . : . .. : :: .:
CCDS89 SGHMEVLRGHEFLSHPFAVTLYGGEVYWTDWRTNTLAKANKWTGHNVTVVQRTNTQPFDL
1470 1480 1490 1500 1510 1520
1200 1210 1220 1230 1240 1250
pF1KE3 HAVKELNLQEYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSP
CCDS89 QVYHPSRQPMAPNPCEANGGQGPCSHLCLINYNRTVSCACPHLMKLHKDNTTCYEFKKFL
1530 1540 1550 1560 1570 1580
>>CCDS2232.1 LRP2 gene_id:4036|Hs109|chr2 (4655 aa)
initn: 1521 init1: 690 opt: 887 Z-score: 587.4 bits: 123.1 E(33420): 2.2e-26
Smith-Waterman score: 1158; 25.6% identity (51.1% similar) in 1326 aa overlap (21-1277:3199-4411)
10 20 30 40 50
pF1KE3 MGAVLRSLLACSFCVLLRAAPLLLYANRRDLRLVDATNGKENATIVVGGL
: :...:: :: . : .... ::
CCDS22 NVIGSYICKCAPGYLREPDGKTCRQNSNIEPYLIFSNRYYLR--NLTIDGYFYSLILEGL
3170 3180 3190 3200 3210 3220
60 70 80 90 100 110
pF1KE3 EDAAAVDFVFSHGLIYWSDVSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEKLY
....:.:: . .:: :.....:.: .:::.. .... : . ..:: ::...:::
CCDS22 DNVVALDFDRVEKRLYWIDTQRQVIERMFLNKTNK-ETIINHRLPAAESLAVDWVSRKLY
3230 3240 3250 3260 3270 3280
120 130 140 150 160
pF1KE3 WTDSETNRIEVSNLDGSLRKVLFWQELD--------QPRAIALDPSSGFMYWTDWGEVPK
: :.. . . ::.:.:. :..: . .: .::..:: :. :..::.:::.
CCDS22 WLDARLDGLFVSDLNGGHRRMLAQHCVDANNTFCFDNPRGLALHPQYGYLYWADWGHRAY
3290 3300 3310 3320 3330 3340
170 180 190 200 210 220
pF1KE3 IERAGMDGSSRFIIINSEIYWPNGLTLDYEEQKLYWADAKLNFIHKSNLDGTNRQAVVKG
: :.::::... .::.... ::::.:.:: .. ::::::.:..:. :.:.: .:..: :
CCDS22 IGRVGMDGTNKSVIISTKLEWPNGITIDYTNDLLYWADAHLGYIEYSDLEGHHRHTVYDG
3350 3360 3370 3380 3390 3400
230 240 250 260 270 280
pF1KE3 SLPHPFALTLFEDILYWTDWSTHSILACNKYTGEGLREIHSDIFSPMDIHAFSQQRQPNA
.::::::.:.::: .:::::.:... ::: : . . . . :.:::.. ::: .
CCDS22 ALPHPFAITIFEDTIYWTDWNTRTVEKGNKYDGSNRQTLVNTTHRPFDIHVYHPYRQPIV
3410 3420 3430 3440 3450 3460
290 300 310 320 330 340
pF1KE3 TNPCGIDNGGCSHLCLMSPVKPFYQCACPTGVKLLENGKTCKDGATELLLLARRTDLRRI
.:::: .:::::::::..: . : :: . :. .:.: . . :.. .
CCDS22 SNPCGTNNGGCSHLCLIKPGGKGFTCECPDDFRTLQ-----LSGSTYCMPMCSSTQF--L
3470 3480 3490 3500 3510
350 360 370 380 390 400
pF1KE3 SLDTPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDG--SGSQFVVTA
.. : . . . : . . : . . :: .. : . .:
CCDS22 CANNEKCIPIWWKCDGQKDC----SDGSDELALCPQRFCRLGQFQCSDGNCTSPQTLCNA
3520 3530 3540 3550 3560 3570
410 420 430 440 450 460
pF1KE3 QIAHPDGIAVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYM
. ::: : : . : : : : : :.. : .
CCDS22 HQNCPDGSDED----RLLCENHHCDSNEWQCANK--RCI--------PESWQCDTFNDCE
3580 3590 3600 3610 3620
470 480 490 500 510 520
pF1KE3 YWTDWGEIPKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTD
.: :. :. : . .. :.. : :. :: . . :: ..
CCDS22 DNSDEDSSHCASRTCRPGQFRCA---NGRCIPQAWKCDVDNDC---GDHSDEPIEECMSS
3630 3640 3650 3660 3670
530 540 550 560 570
pF1KE3 GTGRRVLVEDKIPHIFGFTLLGDYVYWTDWQR-RSIERVHKRSAEREVIIDQLPDLMGLK
. . :.. . :. .: : ... . : :. : .
CCDS22 AH-----LCDNFTE---FSCKTNYRCIPKWAVCNGVDDCRDNSDEQ-----------GCE
3680 3690 3700 3710
580 590 600 610 620 630
pF1KE3 ATNVHRVIGSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRR
. : : :. : .: :. : .: :: ..: : .
CCDS22 ERTCHPV-GDFRCK------NHHCI--PLRWQCDGQNDCGDNSDEENCAPREC-----TE
3720 3730 3740 3750 3760
640 650 660 670 680 690
pF1KE3 ADIRRISLETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHV
...: . :. :: . . : .:.: : ..: ... .. :
CCDS22 SEFRCV------NQQCIPSRWICDHYNDCGDNSDER----DCEMRTCHPEYFQCTS-GHC
3770 3780 3790 3800 3810
700 710 720 730 740 750
pF1KE3 VEFGLDYPEGMAVDWLGKNLYWADTGTNRIEVSKLDGQHRQVLVWKDLDSPRALALDPAE
:. : .: : : : . :: : :. :: . :. . .. . . :
CCDS22 VHSELKC-DGSA-DCLDAS-DEADCPT-RFP----DGAYCQATM---FECKNHVCIPP--
3820 3830 3840 3850
760 770 780 790 800 810
pF1KE3 GFMYWTEWGGKPKIDRAAMDGS-ERTTLVPNV--GRANGLTIDYAKRRLYWTDLDTNLIE
:: : : ::: :. : .: . : . : .: .: .. ... .
CCDS22 ---YWKCDG-----DDDCGDGSDEELHLCLDVPCNSPNRFRCD-NNRCIYSHEVCNGVDD
3860 3870 3880 3890 3900
820 830 840 850
pF1KE3 SSNMLGLNREVIADDLPHPFGLTQYQ--------------DYIYWTDWS-----RRSIER
.. ..: :.: .:. : ::: .. ::
CCDS22 CGDGTDETEEHCRKPTPKPCTEYEYKCGNGHCIPHDNVCDDADDCGDWSDELGCNKGKER
3910 3920 3930 3940 3950 3960
860 870 880 890 900 910
pF1KE3 --ANKTSGQNRTIIQ--GHLDYV---MDILVFHSSRQSGWNECASSNGHCSHLCLAVPVG
:.. :: : .. : . .. :: . ::: . : : . : . :
CCDS22 TCAENICEQNCTQLNEGGFICSCTAGFETNVFDRTSCLDINECEQF-GTCPQHCRNTK-G
3970 3980 3990 4000 4010 4020
920 930 940 950 960
pF1KE3 GFVCGCPAHYSLNAD--NRTCSAP--TTFLLFSQKSAINRMVIDEQQSPDIILPIHSLRN
.. : : .. .: .. :.: . .::. .. : .. .. .. . . .. .
CCDS22 SYECVCADGFTSMSDRPGKRCAAEGSSPLLLLPDNVRIRKYNLSSERFSEYL---QDEEY
4030 4040 4050 4060 4070 4080
970 980 990 1000 1010
pF1KE3 VRAIDYD--PLDKQLYWI-------DSRQNMIRKAQ-EDGSQGFTVVVSSVPSQ-NLEIQ
..:.::: : : : . :: . :..: . .: . .:. : . . .:
CCDS22 IQAVDYDWDPKDIGLSVVYYTVRGEGSRFGAIKRAYIPNFESGRNNLVQEVDLKLKYVMQ
4090 4100 4110 4120 4130 4140
1020 1030 1040 1050 1060 1070
pF1KE3 PYDLSIDIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTN
: ...: .:.:::. .. :.:..:::: ... . :.: ::.:::. : :..:.
CCDS22 PDGIAVDWVGRHIYWSDVKNKRIEVAKLDGRYRKWLISTDLDQPAAIAVNPKLGLMFWTD
4150 4160 4170 4180 4190 4200
1080 1090 1100 1110 1120 1130
pF1KE3 LQERSPKIERAALDGTEREVLFFSGLSKPIALALDS-RLGKLFWADSDLRRIESSDLSGA
. :::: : ..: .:..: : :. : .:..: ...:.: ::. .:.
CCDS22 WG-KEPKIESAWMNGEDRNILVFEDLGWPTGLSIDYLNNDRIYWSDFKEDVIETIKYDGT
4210 4220 4230 4240 4250 4260
1140 1150 1160 1170 1180 1190
pF1KE3 NRIVLEDSNILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAV
.: :. .. ..: .: .::. ::::.:.. . : . :. . :. . :....
CCDS22 DRRVIA-KEAMNPYSLDIFEDQLYWISKEKGEVWKQNKFGQGKKEKTLVVNPWLTQVRIF
4270 4280 4290 4300 4310 4320
1200 1210 1220 1230 1240
pF1KE3 KELNLQEYRQHPCAQDNGGCSHICLVKGDGTTRCSCPMHLVLLQD---------ELSCGE
..: .. . : : :::.::.. : . :.::. ... :: .
CCDS22 HQLRYNKSVPNLCKQ---ICSHLCLLRPGGYS-CACPQGSSFIEGSTTECDAAIELPINL
4330 4340 4350 4360 4370
1250 1260 1270 1280 1290 1300
pF1KE3 PPTCSPQQF-TCFTGEIDCIPVAWRC-DGFT--ECEDHSDELNCPVCSESQFQCASGQCI
:: : .. .:. : : .: .: .:.: ::
CCDS22 PPPCRCMHGGNCYFDETD-LPKC-KCPSGYTGKYCEMAFSKGISPGTTAVAVLLTILLIV
4380 4390 4400 4410 4420 4430
1310 1320 1330 1340 1350 1360
pF1KE3 DGALRCNGDANCQDKSDEKNCEVLCLIDQFRCANGQCIGKHKKCDHNVDCSDKSDELDCY
CCDS22 VIGALAIAGFFHYRRTGSLLPALPKLPSLSSLVKPSENGNGVTFRSGADLNMDIGVSGFG
4440 4450 4460 4470 4480 4490
>--
initn: 377 init1: 377 opt: 619 Z-score: 411.2 bits: 90.5 E(33420): 1.4e-16
Smith-Waterman score: 963; 28.2% identity (52.8% similar) in 811 aa overlap (587-1368:2341-3076)
560 570 580 590 600 610
pF1KE3 RVHKRSAEREVIIDQLPDLMGLKATNVHRVIGSNPCAEENGGCSHLCLYRPQGL---RCA
...::: :.::::::::. : :: .:
CCDS22 EPPTVIRDNINWLRDVTIFDKQVQPRSPAEVNNNPCLENNGGCSHLCFALP-GLHTPKCD
2320 2330 2340 2350 2360
620 630 640 650 660 670
pF1KE3 CPIGFELISDMKTCIVP-EAFLLFSRRADIRRISLETNNNNVAIPLTGV-KEASALDFDV
: .: : :: :.: . : ::.:. ..: . :. .:.. . .: . . .::.:
CCDS22 CAFG-TLQSDGKNCAISTENFLIFALSNSLRSLHLDPENHSPPFQTINVERTVMSLDYDS
2370 2380 2390 2400 2410 2420
680 690 700 710 720
pF1KE3 TDNRIYWTDI---SLKTISRAFMN-GSALEHVVEFGLDYPEGMAVDWLGKNLYWADTGTN
...:::.:. .. :: : .. : :. :. .:.: ::. . .:..: ..
CCDS22 VSDRIYFTQNLASGVGQISYATLSSGIHTPTVIASGIGTADGIAFDWITRRIYYSDYLNQ
2430 2440 2450 2460 2470 2480
730 740 750 760 770 780
pF1KE3 RIEVSKLDGQHRQVLVWKDLDSPRALALDPAEGFMYWTEWGGKPKIDRAAMDGSERTTLV
:. ::..: :.. . .:::..::: .:..::..: . ::.::.. :. :. .:
CCDS22 MINSMAEDGSNRTVIA--RVPKPRAIVLDPCQGYLYWADWDTHAKIERATLGGNFRVPIV
2490 2500 2510 2520 2530 2540
790 800 810 820 830 840
pF1KE3 -PNVGRANGLTIDYAKRRLYWTDLDTNLIESSNMLGLNREVIADDLPHPFGLTQYQDYIY
.. .:::.:: . :::.: . . :: :.. :..::::.. : :::: : .:::
CCDS22 NSSLVMPSGLTLDYEEDLLYWVDASLQRIERSTLTGVDREVIVNAAVHAFGLTLYGQYIY
2550 2560 2570 2580 2590 2600
850 860 870 880 890 900
pF1KE3 WTDWSRRSIERANKTSGQNRTIIQGHL-DYVMDI-LVFHSSRQSGWNECASSNGHCSHLC
::: . : :::: .:... . .: . : : ....:. : : . :: :::.:
CCDS22 WTDLYTQRIYRANKYDGSGQIAMTTNLLSQPRGINTVVKNQKQQCNNPCEQFNGGCSHIC
2610 2620 2630 2640 2650 2660
910 920 930 940 950 960
pF1KE3 LAVPVGGFVCGCP--AHYSLNADNRTCSAPTTFLLFSQKSAINRMVIDEQQSPDIILPIH
: .: : :: ... : . . : ..:. .
CCDS22 APGP-NGAECQCPHEGNWYLANNRKHC------------------IVDNGERCGA--SSF
2670 2680 2690 2700
970 980 990 1000 1010 1020
pF1KE3 SLRNVRAIDYD-PLDKQLYWIDSRQNMIRKAQEDGSQGFTVVVSSVPSQNLEIQPYDLSI
. : : :. . :.. :. ..: :. : .. : . :.
CCDS22 TCSNGRCISEEWKCDNDNDCGDGSDEM-----ESVCALHTCSPTAFTCANGRCVQYSYRC
2710 2720 2730 2740 2750 2760
1030 1040 1050 1060 1070 1080
pF1KE3 DIYSRYIYWTCEATNVINVTRLDGRSVGVVLKGEQDRPRAIVVNPEKGYMYFTNLQERSP
: :. . :: .. : . .. . .... :: .. : : .. .
CCDS22 DYYNDCGDGSDEAGCLF---RDCNATTEFMCNNRRCIPREFICNG------VDNCHDNNT
2770 2780 2790 2800 2810
1090 1100 1110 1120 1130
pF1KE3 KIERAALDGTEREVLFFSGLSKPIALALDSRLGKLFWADSDLRRIESSDLSGA--NRIVL
. :. : : . :: .: . . ... :.: ..:: . . . .
CCDS22 SDEKNCPDRTCQ-----SGYTK--CHNSNICIPRVYLCDGDNDCGDNSDENPTYCTTHTC
2820 2830 2840 2850 2860
1140 1150 1160 1170 1180 1190
pF1KE3 EDSNILQPVGLTVFENWLYWIDKQQQMIEKIDMTGREGRTKVQARIAQLSDIHAVKELNL
.:.. : . ..: . :.. . .. : . : :. .
CCDS22 SSSEFQCASGRCIPQHW--YCDQETDCFDASDEPASCG--------------HSERTCLA
2870 2880 2890 2900
1200 1210 1220 1230 1240 1250
pF1KE3 QEYRQHPCAQDNGGC---SHICLVKGDGTTRCSCPMHLVLLQDELSCGEPPTCSPQQFTC
.:.. : :.: : :: :: . :. : .:. . .:: ..: :
CCDS22 DEFK---C--DGGRCIPSEWIC----DGDNDCG-DMSD---EDKRHQCQNQNCSDSEFLC
2910 2920 2930 2940 2950
1260 1270 1280 1290 1300 1310
pF1KE3 FTGEID---CIPVAWRCDGFTECEDHSDE-LNCP--VCSESQFQCASGQCIDGALRCNGD
. . ::: .: ::: ..: : :: :: .:::..: :. : :: .::.
CCDS22 VNDRPPDRRCIPQSWVCDGDVDCTDGYDENQNCTRRTCSENEFTCGYGLCIPKIFRCDRH
2960 2970 2980 2990 3000 3010
1320 1330 1340 1350 1360
pF1KE3 ANCQDKSDEKNCEV-LCLIDQFRCANGQCIGKHKKCDHNVDCSDKSDELD--CYPTEEPA
.: : :::..: : .:: : ::.::.: ::.. ::.: :::: :. :
CCDS22 NDCGDYSDERGCLYQTCQQNQFTCQNGRCISKTFVCDEDNDCGDGSDELMHLCHTPEPTC
3020 3030 3040 3050 3060 3070
1370 1380 1390 1400 1410 1420
pF1KE3 PQATNTVGSVIGVIVTIFVSGTVYFICQRMLCPRMKGDGETMTNDYVVHGPASVPLGYVP
:
CCDS22 PPHEFKCDNGRCIEMMKLCNHLDDCLDNSDEKGCGINECHDPSISGCDHNCTDTLTSFYC
3080 3090 3100 3110 3120 3130
>>CCDS54795.1 EGF gene_id:1950|Hs109|chr4 (1165 aa)
initn: 706 init1: 584 opt: 862 Z-score: 579.6 bits: 119.7 E(33420): 5.9e-26
Smith-Waterman score: 991; 28.5% identity (56.5% similar) in 687 aa overlap (56-637:79-748)
30 40 50 60 70 80
pF1KE3 ANRRDLRLVDATNGKENATIVVGGLEDAAAVDFVFSHGLIYWSDVSEEAIKRTEFNKTES
.:: ... ::: :. .. ..:. .: ..
CCDS54 IFSHGNSIFRIDTEGTNYEQLVVDAGVSVIMDFHYNEKRIYWVDLERQLLQRVFLNGSR-
50 60 70 80 90 100
90 100 110 120 130 140
pF1KE3 VQNVVVSGLLSPDGLACDWLGEKLYWTDSETNRIEVSNLDGSLRKVLFWQELDQPRAIAL
:. : . . .:.: .:..:.. :.... . : :... :. ..:. . : : .:.
CCDS54 -QERVCNIEKNVSGMAINWINEEVIWSNQQEGIITVTDMKGNNSHILL-SALKYPANVAV
110 120 130 140 150 160
150 160 170 180 190
pF1KE3 DPSSGFMYWTDWGEVP-KIERAGMDGSS-RFIIINSEIYWPNGLTLDYEEQKLYWA----
:: :..:.. :: .. :: .:: . . .. .:: ....:: ...:.:
CCDS54 DPVERFIFWSS--EVAGSLYRADLDGVGVKALLETSEKI--TAVSLDVLDKRLFWIQYNR
170 180 190 200 210 220
200 210 220 230 240 250
pF1KE3 DAKLNFIHKSNLDGTNRQAVVKGSLPHP-FALTLFEDILYWTDWSTHSILACNKYTGEGL
... ..: . . :: . . . : : ::..:: : .... :. ..: ::.::. .
CCDS54 EGSNSLICSCDYDGGSVH-ISKHPTQHNLFAMSLFGDRIFYSTWKMKTIWIANKHTGKDM
230 240 250 260 270 280
260 270 280 290 300
pF1KE3 REI--HSDIFSPMD----IHAFSQQRQPNAT-----NPCGIDNGGCSHLCLMSPVKPFYQ
.: ::. : :. .: ..: . . : : :.. : ::. : .: . :
CCDS54 VRINLHSS-FVPLGELKVVHPLAQPKAEDDTWEPDVNECAFWNHGCTLGCKNTPGS--YY
290 300 310 320 330
310 320
pF1KE3 CACPTGVKLLENGKTC-----------------------------------KDGAT----
:.::.: :: .:: : .:: :
CCDS54 CTCPVGFVLLPDGKRCHQLVSCPRNVSECSHDCVLTSEGPLCFCPEGSVLERDGKTCSGC
340 350 360 370 380 390
330 340
pF1KE3 -------------------------------------------ELLLLARRTDLRRISLD
.::.: :.:.. .:
CCDS54 SSPDNGGCSQLCVPLSPVSWECDCFPGYDLQLDEKSCAASGPQPFLLFANSQDIRHMHFD
400 410 420 430 440 450
350 360 370 380 390 400
pF1KE3 TPDFTDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHP
:. .. : .. . :.:.::::. ::.. .. :.:. .::: . .. . :
CCDS54 GTDYGTLLSQ--QMGMVYALDHDPVENKIYFAHTALKWIERANMDGSQRERLIEEGVDVP
460 470 480 490 500 510
410 420 430 440 450 460
pF1KE3 DGIAVDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDW
.:.::::..: .:::: : . : . ::: ::. .:.. .::.:.. ::. ..:::
CCDS54 EGLAVDWIGRRFYWTDRGKSLIGRSDLNGKRSKIITKENISQPRGIAVHPMAKRLFWTDT
520 530 540 550 560 570
470 480 490 500 510 520
pF1KE3 GEIPKIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRR
: :.:: ..:.: :.:.....: ::.:...:. :.:: ::: . ::. : ::. ::
CCDS54 GINPRIESSSLQGLGRLVIASSDLIWPSGITIDFLTDKLYWCDAKQSVIEMANLDGSKRR
580 590 600 610 620 630
530 540 550 560 570 580
pF1KE3 VLVEDKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATN---
:... . : :. ... :::...:: :. ::.::... .: .: : :: ..
CCDS54 RLTQNDVGHPFAVAVFEDYVWFSDWAMPSVMRVNKRTGKDRV---RLQGSM-LKPSSLVV
640 650 660 670 680 690
590 600 610 620 630 640
pF1KE3 VHRVI--GSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRA
:: . :..:: .:::: :.: : :.: :: :: :::.. .. :..
CCDS54 VHPLAKPGADPCLYQNGGCEHICKKRLGTAWCSCREGFMKASDGKTCLALDGHQLLAGGE
700 710 720 730 740 750
650 660 670 680 690 700
pF1KE3 DIRRISLETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVV
CCDS54 VDLKNQVTPLDILSKTRVSEDNITESQHMLVAEIMVSDQDDCAPVGCSMYARCISEGEDA
760 770 780 790 800 810
>>CCDS54794.1 EGF gene_id:1950|Hs109|chr4 (1166 aa)
initn: 706 init1: 584 opt: 855 Z-score: 575.0 bits: 118.8 E(33420): 1.1e-25
Smith-Waterman score: 865; 27.2% identity (53.4% similar) in 680 aa overlap (100-637:121-790)
70 80 90 100 110 120
pF1KE3 VSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEKLYWTDSETNRIEVSNLDGSLR
.: .:..:.. :.... . : :... :.
CCDS54 VDLERQLLQRVFLNGSRQERVCNIEKNVSGMAINWINEEVIWSNQQEGIITVTDMKGNNS
100 110 120 130 140 150
130 140 150 160 170 180
pF1KE3 KVLFWQELDQPRAIALDPSSGFMYWTDWGEVP-KIERAGMDGSS-RFIIINSEIYWPNGL
..:. . : : .:.:: :..:. .:: .. :: .:: . . .. .:: ...
CCDS54 HILL-SALKYPANVAVDPVERFIFWS--SEVAGSLYRADLDGVGVKALLETSEKI--TAV
160 170 180 190 200
190 200 210 220 230 240
pF1KE3 TLDYEEQKLYWA----DAKLNFIHKSNLDGTNRQAVVKGSLPHP-FALTLFEDILYWTDW
.:: ...:.: ... ..: . . :: . . . : : ::..:: : .... :
CCDS54 SLDVLDKRLFWIQYNREGSNSLICSCDYDGGSVH-ISKHPTQHNLFAMSLFGDRIFYSTW
210 220 230 240 250 260
250 260 270 280 290
pF1KE3 STHSILACNKYTGEGLREI--HSDIFSPMD----IHAFSQQRQPNAT-NP----CGIDNG
. ..: ::.::. . .: ::. : :. .: ..: . . : .: : . .:
CCDS54 KMKTIWIANKHTGKDMVRINLHSS-FVPLGELKVVHPLAQPKAEDDTWEPEQKLCKLRKG
270 280 290 300 310 320
300 310
pF1KE3 GCS----------HLCL------MSPVKPF------------------------YQCACP
.:: :::. .: . . : :.::
CCDS54 NCSSTVCGQDLQSHLCMCAEGYALSRDRKYCEDVNECAFWNHGCTLGCKNTPGSYYCTCP
330 340 350 360 370 380
320
pF1KE3 TGVKLLENGKTC-----------------------------------KDGAT--------
.: :: .:: : .:: :
CCDS54 VGFVLLPDGKRCHQLVSCPRNVSECSHDCVLTSEGPLCFCPEGSVLERDGKTCSGCSSPD
390 400 410 420 430 440
330 340
pF1KE3 ---------------------------------------ELLLLARRTDLRRISLDTPDF
.::.: :.:.. .: :.
CCDS54 NGGCSQLCVPLSPVSWECDCFPGYDLQLDEKSCAASGPQPFLLFANSQDIRHMHFDGTDY
450 460 470 480 490 500
350 360 370 380 390 400
pF1KE3 TDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIA
.. : .. . :.:.::::. ::.. .. :.:. .::: . .. . :.:.:
CCDS54 GTLLSQ--QMGMVYALDHDPVENKIYFAHTALKWIERANMDGSQRERLIEEGVDVPEGLA
510 520 530 540 550 560
410 420 430 440 450 460
pF1KE3 VDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIP
:::..: .:::: : . : . ::: ::. .:.. .::.:.. ::. ..::: : :
CCDS54 VDWIGRRFYWTDRGKSLIGRSDLNGKRSKIITKENISQPRGIAVHPMAKRLFWTDTGINP
570 580 590 600 610 620
470 480 490 500 510 520
pF1KE3 KIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLVE
.:: ..:.: :.:.....: ::.:...:. :.:: ::: . ::. : ::. :: :..
CCDS54 RIESSSLQGLGRLVIASSDLIWPSGITIDFLTDKLYWCDAKQSVIEMANLDGSKRRRLTQ
630 640 650 660 670 680
530 540 550 560 570 580
pF1KE3 DKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATNVHRVI--
. . : :. ... :::...:: :. ::.::... .: . : : . . :: .
CCDS54 NDVGHPFAVAVFEDYVWFSDWAMPSVMRVNKRTGKDRVRL-QGSMLKPSSLVVVHPLAKP
690 700 710 720 730 740
590 600 610 620 630 640
pF1KE3 GSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRADIRRISL
:..:: .:::: :.: : :.: :: :: :::.. .. :..
CCDS54 GADPCLYQNGGCEHICKKRLGTAWCSCREGFMKASDGKTCLALDGHQLLAGGEVDLKNQV
750 760 770 780 790 800
650 660 670 680 690 700
pF1KE3 ETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYP
CCDS54 TPLDILSKTRVSEDNITESQHMLVAEIMVSDQDDCAPVGCSMYARCISEGEDATCQCLKG
810 820 830 840 850 860
>>CCDS3689.1 EGF gene_id:1950|Hs109|chr4 (1207 aa)
initn: 706 init1: 584 opt: 855 Z-score: 574.8 bits: 118.8 E(33420): 1.1e-25
Smith-Waterman score: 865; 27.2% identity (53.4% similar) in 680 aa overlap (100-637:121-790)
70 80 90 100 110 120
pF1KE3 VSEEAIKRTEFNKTESVQNVVVSGLLSPDGLACDWLGEKLYWTDSETNRIEVSNLDGSLR
.: .:..:.. :.... . : :... :.
CCDS36 VDLERQLLQRVFLNGSRQERVCNIEKNVSGMAINWINEEVIWSNQQEGIITVTDMKGNNS
100 110 120 130 140 150
130 140 150 160 170 180
pF1KE3 KVLFWQELDQPRAIALDPSSGFMYWTDWGEVP-KIERAGMDGSS-RFIIINSEIYWPNGL
..:. . : : .:.:: :..:. .:: .. :: .:: . . .. .:: ...
CCDS36 HILL-SALKYPANVAVDPVERFIFWS--SEVAGSLYRADLDGVGVKALLETSEKI--TAV
160 170 180 190 200
190 200 210 220 230 240
pF1KE3 TLDYEEQKLYWA----DAKLNFIHKSNLDGTNRQAVVKGSLPHP-FALTLFEDILYWTDW
.:: ...:.: ... ..: . . :: . . . : : ::..:: : .... :
CCDS36 SLDVLDKRLFWIQYNREGSNSLICSCDYDGGSVH-ISKHPTQHNLFAMSLFGDRIFYSTW
210 220 230 240 250 260
250 260 270 280 290
pF1KE3 STHSILACNKYTGEGLREI--HSDIFSPMD----IHAFSQQRQPNAT-NP----CGIDNG
. ..: ::.::. . .: ::. : :. .: ..: . . : .: : . .:
CCDS36 KMKTIWIANKHTGKDMVRINLHSS-FVPLGELKVVHPLAQPKAEDDTWEPEQKLCKLRKG
270 280 290 300 310 320
300 310
pF1KE3 GCS----------HLCL------MSPVKPF------------------------YQCACP
.:: :::. .: . . : :.::
CCDS36 NCSSTVCGQDLQSHLCMCAEGYALSRDRKYCEDVNECAFWNHGCTLGCKNTPGSYYCTCP
330 340 350 360 370 380
320
pF1KE3 TGVKLLENGKTC-----------------------------------KDGAT--------
.: :: .:: : .:: :
CCDS36 VGFVLLPDGKRCHQLVSCPRNVSECSHDCVLTSEGPLCFCPEGSVLERDGKTCSGCSSPD
390 400 410 420 430 440
330 340
pF1KE3 ---------------------------------------ELLLLARRTDLRRISLDTPDF
.::.: :.:.. .: :.
CCDS36 NGGCSQLCVPLSPVSWECDCFPGYDLQLDEKSCAASGPQPFLLFANSQDIRHMHFDGTDY
450 460 470 480 490 500
350 360 370 380 390 400
pF1KE3 TDIVLQLEDIRHAIAIDYDPVEGYIYWTDDEVRAIRRSFIDGSGSQFVVTAQIAHPDGIA
.. : .. . :.:.::::. ::.. .. :.:. .::: . .. . :.:.:
CCDS36 GTLLSQ--QMGMVYALDHDPVENKIYFAHTALKWIERANMDGSQRERLIEEGVDVPEGLA
510 520 530 540 550 560
410 420 430 440 450 460
pF1KE3 VDWVARNLYWTDTGTDRIEVTRLNGTMRKILISEDLEEPRAIVLDPMVGYMYWTDWGEIP
:::..: .:::: : . : . ::: ::. .:.. .::.:.. ::. ..::: : :
CCDS36 VDWIGRRFYWTDRGKSLIGRSDLNGKRSKIITKENISQPRGIAVHPMAKRLFWTDTGINP
570 580 590 600 610 620
470 480 490 500 510 520
pF1KE3 KIERAALDGSDRVVLVNTSLGWPNGLALDYDEGKIYWGDAKTDKIEVMNTDGTGRRVLVE
.:: ..:.: :.:.....: ::.:...:. :.:: ::: . ::. : ::. :: :..
CCDS36 RIESSSLQGLGRLVIASSDLIWPSGITIDFLTDKLYWCDAKQSVIEMANLDGSKRRRLTQ
630 640 650 660 670 680
530 540 550 560 570 580
pF1KE3 DKIPHIFGFTLLGDYVYWTDWQRRSIERVHKRSAEREVIIDQLPDLMGLKATNVHRVI--
. . : :. ... :::...:: :. ::.::... .: . : : . . :: .
CCDS36 NDVGHPFAVAVFEDYVWFSDWAMPSVMRVNKRTGKDRVRL-QGSMLKPSSLVVVHPLAKP
690 700 710 720 730 740
590 600 610 620 630 640
pF1KE3 GSNPCAEENGGCSHLCLYRPQGLRCACPIGFELISDMKTCIVPEAFLLFSRRADIRRISL
:..:: .:::: :.: : :.: :: :: :::.. .. :..
CCDS36 GADPCLYQNGGCEHICKKRLGTAWCSCREGFMKASDGKTCLALDGHQLLAGGEVDLKNQV
750 760 770 780 790 800
650 660 670 680 690 700
pF1KE3 ETNNNNVAIPLTGVKEASALDFDVTDNRIYWTDISLKTISRAFMNGSALEHVVEFGLDYP
CCDS36 TPLDILSKTRVSEDNITESQHMLVAEIMVSDQDDCAPVGCSMYARCISEGEDATCQCLKG
810 820 830 840 850 860
1613 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Jul 16 16:10:44 2019 done: Tue Jul 16 16:10:44 2019
Total Scan time: 2.700 Total Display time: 0.530
Function used was FASTA [36.3.4 Apr, 2011]