FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0600, 5300 aa
1>>>pF1KE0600 5300 - 5300 aa - 5300 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.6801+/-0.00179; mu= 5.8352+/- 0.107
mean_var=339.9590+/-69.962, 0's: 0 Z-trim(105.5): 174 B-trim: 0 in 0/51
Lambda= 0.069560
statistics sampled from 8323 (8469) to 8323 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.564), E-opt: 0.2 (0.26), width: 16
Scan time: 15.100
The best scores are: opt bits E(32554)
CCDS435.1 MACF1 gene_id:23499|Hs108|chr1 (5430) 15195 1542.6 0
CCDS47443.1 DST gene_id:667|Hs108|chr6 (5171) 8379 858.6 0
CCDS75474.1 DST gene_id:667|Hs108|chr6 (5537) 8379 858.6 0
CCDS4959.1 DST gene_id:667|Hs108|chr6 (2649) 3289 347.5 1.1e-93
CCDS47936.1 PLEC gene_id:5339|Hs108|chr8 (4515) 2812 299.9 4.2e-79
CCDS43771.1 PLEC gene_id:5339|Hs108|chr8 (4525) 2812 299.9 4.2e-79
CCDS43770.1 PLEC gene_id:5339|Hs108|chr8 (4533) 2812 299.9 4.2e-79
CCDS43773.1 PLEC gene_id:5339|Hs108|chr8 (4547) 2812 299.9 4.2e-79
CCDS43775.1 PLEC gene_id:5339|Hs108|chr8 (4547) 2812 299.9 4.2e-79
CCDS43774.1 PLEC gene_id:5339|Hs108|chr8 (4551) 2812 299.9 4.2e-79
CCDS43769.1 PLEC gene_id:5339|Hs108|chr8 (4574) 2812 299.9 4.2e-79
CCDS43772.1 PLEC gene_id:5339|Hs108|chr8 (4684) 2812 299.9 4.3e-79
CCDS4501.1 DSP gene_id:1832|Hs108|chr6 (2871) 1235 141.5 1.3e-31
CCDS47368.1 DSP gene_id:1832|Hs108|chr6 (2272) 1120 129.8 3.3e-28
CCDS32100.1 SPTB gene_id:6710|Hs108|chr14 (2137) 869 104.6 1.2e-20
CCDS32099.1 SPTB gene_id:6710|Hs108|chr14 (2328) 869 104.6 1.3e-20
CCDS55395.1 DMD gene_id:1756|Hs108|chrX (3681) 873 105.2 1.3e-20
CCDS14233.1 DMD gene_id:1756|Hs108|chrX (3685) 864 104.3 2.5e-20
CCDS8150.1 SPTBN2 gene_id:6712|Hs108|chr11 (2390) 853 103.0 3.9e-20
CCDS33198.1 SPTBN1 gene_id:6711|Hs108|chr2 (2364) 843 102.0 7.8e-20
CCDS33199.1 SPTBN1 gene_id:6711|Hs108|chr2 (2155) 832 100.9 1.6e-19
CCDS12559.1 SPTBN4 gene_id:57731|Hs108|chr19 (2564) 830 100.8 2.1e-19
CCDS34547.1 UTRN gene_id:7402|Hs108|chr6 (3433) 810 98.9 1e-18
CCDS76439.1 ACTN3 gene_id:89|Hs108|chr11 ( 944) 754 92.8 1.9e-17
CCDS5236.2 SYNE1 gene_id:23345|Hs108|chr6 (8797) 774 95.6 2.5e-17
CCDS1613.1 ACTN2 gene_id:88|Hs108|chr1 ( 894) 742 91.5 4.3e-17
CCDS60455.1 ACTN2 gene_id:88|Hs108|chr1 ( 894) 724 89.7 1.5e-16
CCDS12518.1 ACTN4 gene_id:81|Hs108|chr19 ( 911) 724 89.7 1.5e-16
CCDS45129.1 ACTN1 gene_id:87|Hs108|chr14 ( 887) 693 86.6 1.3e-15
CCDS9792.1 ACTN1 gene_id:87|Hs108|chr14 ( 892) 693 86.6 1.3e-15
CCDS45130.1 ACTN1 gene_id:87|Hs108|chr14 ( 914) 693 86.6 1.3e-15
CCDS5235.1 SYNE1 gene_id:23345|Hs108|chr6 (8749) 695 87.7 6.1e-15
CCDS61599.1 SPTBN5 gene_id:51332|Hs108|chr15 (3674) 641 81.9 1.4e-13
CCDS41963.1 SYNE2 gene_id:23224|Hs108|chr14 (6885) 632 81.3 4.1e-13
CCDS9761.2 SYNE2 gene_id:23224|Hs108|chr14 (6907) 632 81.3 4.1e-13
CCDS48036.1 SPTAN1 gene_id:6709|Hs108|chr9 (2477) 596 77.3 2.3e-12
CCDS10526.1 PPL gene_id:5493|Hs108|chr16 (1756) 584 75.9 4.2e-12
>>CCDS435.1 MACF1 gene_id:23499|Hs108|chr1 (5430 aa)
initn: 27577 init1: 15110 opt: 15195 Z-score: 8248.7 bits: 1542.6 E(32554): 0
Smith-Waterman score: 33284; 97.6% identity (97.6% similar) in 5332 aa overlap (1-5202:1-5332)
10 20 30 40 50 60
pF1KE0 MSSSDEETLSERSCRSERSCRSERSYRSERSGSLSPCPPGDTLPWNLPLHEQKKRKSQDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MSSSDEETLSERSCRSERSCRSERSYRSERSGSLSPCPPGDTLPWNLPLHEQKKRKSQDS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 VLDPAERAVVRVADERDRVQKKTFTKWVNKHLMKVRKHINDLYEDLRDGHNLISLLEVLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VLDPAERAVVRVADERDRVQKKTFTKWVNKHLMKVRKHINDLYEDLRDGHNLISLLEVLS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 GIKLPREKGRMRFHRLQNVQIALDFLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GIKLPREKGRMRFHRLQNVQIALDFLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILHF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 QISDIYISGESGDMSAKEKLLLWTQKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QISDIYISGESGDMSAKEKLLLWTQKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE0 VDMERVQIQSNRENLEQAFEVAERLGVTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VDMERVQIQSNRENLEQAFEVAERLGVTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE0 PEGGEGISATEVDSRWQEYQSRVDSLIPWIKQHTILMSDKTFPQNPVELKALYNQYIHFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PEGGEGISATEVDSRWQEYQSRVDSLIPWIKQHTILMSDKTFPQNPVELKALYNQYIHFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE0 ETEILAKEREKGRIEELYKLLEVWIEFGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ETEILAKEREKGRIEELYKLLEVWIEFGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE0 PAVERLELLLQIANKIQNGALNCEEKLTLAKNTLQADAAHLESGQPVQCESDVIMYIQEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PAVERLELLLQIANKIQNGALNCEEKLTLAKNTLQADAAHLESGQPVQCESDVIMYIQEC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE0 EGLIRQLQVDLQILRDENYYQLEELAFRVMRLQDELVTLRLECTNLYRKGHFTSLELVPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EGLIRQLQVDLQILRDENYYQLEELAFRVMRLQDELVTLRLECTNLYRKGHFTSLELVPP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE0 STLTTTHLKAEPLTKATHSSSTSWFRKPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 STLTTTHLKAEPLTKATHSSSTSWFRKPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE0 MKLERAEWGNDLPSVELQLETQQHIHTSVEELGSSVKEARLYEGKMSQNFHTSYAETLGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MKLERAEWGNDLPSVELQLETQQHIHTSVEELGSSVKEARLYEGKMSQNFHTSYAETLGK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE0 LETQYCKLKETSSFRMRHLQSLHKFVSRATAELIWLNEKEEEELAYDWSDNNSNISAKRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LETQYCKLKETSSFRMRHLQSLHKFVSRATAELIWLNEKEEEELAYDWSDNNSNISAKRN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE0 YFSELTMELEEKQDVFRSLQDTAELLSLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 YFSELTMELEEKQDVFRSLQDTAELLSLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE0 HVKENTAYFQFFSDARELESFLRNLQDSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HVKENTAYFQFFSDARELESFLRNLQDSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQ
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE0 SKSSVASLVGRSKTIVQLKPRSPDHVLKNTISVKAVCDYRQIEITICKNDECVLEDNSQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SKSSVASLVGRSKTIVQLKPRSPDHVLKNTISVKAVCDYRQIEITICKNDECVLEDNSQR
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE0 TKWKVISPTGNEAMVPSVCFLIPPPNKDAIEMASRVEQSYQKVMALWHQLHVNTKSLISW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TKWKVISPTGNEAMVPSVCFLIPPPNKDAIEMASRVEQSYQKVMALWHQLHVNTKSLISW
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE0 NYLRKDLDLVQTWNLEKLRSSAPGECHQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NYLRKDLDLVQTWNLEKLRSSAPGECHQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE0 EVEACKARFQHLMKSMENEDKEETVAKMYISELKNIRLRLEEYEQRVVKRIQSLASSRTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EVEACKARFQHLMKSMENEDKEETVAKMYISELKNIRLRLEEYEQRVVKRIQSLASSRTD
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE0 RDAWQDNALRIAEQEHTQEDLQQLRSDLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RDAWQDNALRIAEQEHTQEDLQQLRSDLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVE
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE0 KMDHVYGLSTVYLNKLKTVDVIVRSIQDAELLVKGYEIKLSQEEVVLADLSALEAHWSTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KMDHVYGLSTVYLNKLKTVDVIVRSIQDAELLVKGYEIKLSQEEVVLADLSALEAHWSTL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE0 RHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMSRLTPERNLDLERYQEKGSQLQERWHRVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMSRLTPERNLDLERYQEKGSQLQERWHRVI
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE0 AQLEIRQSELESIQEVLGDYRACHGTLIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AQLEIRQSELESIQEVLGDYRACHGTLIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQT
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE0 ALFAEIERNQTKLDQCQKFSQQYSTIVKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ALFAEIERNQTKLDQCQKFSQQYSTIVKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDA
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE0 ITQEFMDLRTRYTALVTLTTQHVKYISDALRRLEEEEKVVEEEKQEHVEKVKELLGWVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ITQEFMDLRTRYTALVTLTTQHVKYISDALRRLEEEEKVVEEEKQEHVEKVKELLGWVST
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE0 LARNTQGKATSSETKESTDIEKAILEQQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LARNTQGKATSSETKESTDIEKAILEQQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLS
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE0 EKEKKQISEQLNALNKAYHDLCDGSANQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EKEKKQISEQLNALNKAYHDLCDGSANQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLC
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE0 SWVGQAERALAGHQGRTTQQDLSALQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SWVGQAERALAGHQGRTTQQDLSALQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEEN
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE0 QTKLSPRELTALREKLHQAKEQYEALQEETRVAQKELEEAVTSALQQETEKSKAAKELAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QTKLSPRELTALREKLHQAKEQYEALQEETRVAQKELEEAVTSALQQETEKSKAAKELAE
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE0 NKKKIDALLDWVTSVGSSGGQLLTNLPGMEQLSGASLEKGALDTTDGYMGVNQAPEKLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NKKKIDALLDWVTSVGSSGGQLLTNLPGMEQLSGASLEKGALDTTDGYMGVNQAPEKLDK
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE0 QCEMMKARHQELLSQQQNFILATQSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QCEMMKARHQELLSQQQNFILATQSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSL
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE0 AQSEAELKQVQTLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AQSEAELKQVQTLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGS
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE0 FSEDVISHKGDLRFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FSEDVISHKGDLRFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKC
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE0 TRLGSHLNMLLGQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TRLGSHLNMLLGQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQL
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE0 QEELAEHQVPVEKLQKVARDIMEIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QEELAEHQVPVEKLQKVARDIMEIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSSLL
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE0 QKAIAQSQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QKAIAQSQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKS
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE0 SLEATREMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SLEATREMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFE
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE0 HLSGKLQQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HLSGKLQQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSS
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE0 CGFALDLCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CGFALDLCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETE
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE0 GSIPPTETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAPDSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GSIPPTETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAPDSQG
2290 2300 2310 2320 2330 2340
2350 2360 2370
pF1KE0 KT---------------------DLTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRM
:: :::::::::::::::::::::::::::::::::::::
CCDS43 KTGSILPSVGSSVGSVNGYHTCKDLTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRM
2350 2360 2370 2380 2390 2400
2380 2390 2400 2410 2420 2430
pF1KE0 EEVHKEANSVLQWLESKEEVLKSMDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EEVHKEANSVLQWLESKEEVLKSMDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKV
2410 2420 2430 2440 2450 2460
2440 2450 2460 2470 2480 2490
pF1KE0 KEALAGLLVTYPNSQEAENWKKIQEELNSRWERATEVTVARQRQLEESASHLACFQAAES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KEALAGLLVTYPNSQEAENWKKIQEELNSRWERATEVTVARQRQLEESASHLACFQAAES
2470 2480 2490 2500 2510 2520
2500 2510 2520 2530 2540 2550
pF1KE0 QLRPWLMEKELMMGVLGPLSIDPNMLNAQKQQVQFMLKEFEARRQQHEQLNEAAQGILTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QLRPWLMEKELMMGVLGPLSIDPNMLNAQKQQVQFMLKEFEARRQQHEQLNEAAQGILTG
2530 2540 2550 2560 2570 2580
2560 2570 2580 2590 2600 2610
pF1KE0 PGDVSLSTSQVQKELQSINQKWVELTDKLNSRSSQIDQAIVKSTQYQELLQDLSEKVRAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PGDVSLSTSQVQKELQSINQKWVELTDKLNSRSSQIDQAIVKSTQYQELLQDLSEKVRAV
2590 2600 2610 2620 2630 2640
2620 2630 2640 2650 2660 2670
pF1KE0 GQRLSVQSAISTQPEAVKQQLEETSEIRSDLEQLDHEVKEAQTLCDELSVLIGEQYLKDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GQRLSVQSAISTQPEAVKQQLEETSEIRSDLEQLDHEVKEAQTLCDELSVLIGEQYLKDE
2650 2660 2670 2680 2690 2700
2680 2690 2700 2710 2720 2730
pF1KE0 LKKRLETVALPLQGLEDLAADRINRLQAALASTQQFQQMFDELRTWLDDKQSQQAKNCPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LKKRLETVALPLQGLEDLAADRINRLQAALASTQQFQQMFDELRTWLDDKQSQQAKNCPI
2710 2720 2730 2740 2750 2760
2740 2750 2760 2770 2780 2790
pF1KE0 SAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKN
2770 2780 2790 2800 2810 2820
2800 2810 2820 2830 2840 2850
pF1KE0 HWEELSKKTADRQSRLKDCMQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HWEELSKKTADRQSRLKDCMQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSL
2830 2840 2850 2860 2870 2880
2860 2870 2880 2890 2900 2910
pF1KE0 LRSKAMLNEVEKRRSLLEILNSAADILINSSEADEDGIRDEKAGINQNMDAVTEELQAKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LRSKAMLNEVEKRRSLLEILNSAADILINSSEADEDGIRDEKAGINQNMDAVTEELQAKT
2890 2900 2910 2920 2930 2940
2920 2930 2940 2950 2960 2970
pF1KE0 GSLEEMTQRLREFQESFKNIEKKVEGAKHQLEIFDALGSQACSNKNLEKLRAQQEVLQAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GSLEEMTQRLREFQESFKNIEKKVEGAKHQLEIFDALGSQACSNKNLEKLRAQQEVLQAL
2950 2960 2970 2980 2990 3000
2980 2990 3000 3010 3020 3030
pF1KE0 EPQVDYLRNFTQGLVEDAPDGSDASQLLHQAEVAQQEFLEVKQRVNSGCVMMENKLEGIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EPQVDYLRNFTQGLVEDAPDGSDASQLLHQAEVAQQEFLEVKQRVNSGCVMMENKLEGIG
3010 3020 3030 3040 3050 3060
3040 3050 3060 3070 3080 3090
pF1KE0 QFHCRVREMFSQLADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKIHVLKLDIEASEAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QFHCRVREMFSQLADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKIHVLKLDIEASEAE
3070 3080 3090 3100 3110 3120
3100 3110 3120 3130 3140 3150
pF1KE0 CRHMLEEEGTLDLLGLKRELEALNKQCGKLTERGKARQEQLELTLGRVEDFYRKLKGLND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 CRHMLEEEGTLDLLGLKRELEALNKQCGKLTERGKARQEQLELTLGRVEDFYRKLKGLND
3130 3140 3150 3160 3170 3180
3160 3170 3180 3190 3200 3210
pF1KE0 ATTAAEEAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMKLQQVNGLGQGLIQSAGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ATTAAEEAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMKLQQVNGLGQGLIQSAGK
3190 3200 3210 3220 3230 3240
3220 3230 3240 3250 3260 3270
pF1KE0 DCDVQGLEHDMEEINARWNTLNKKVAQRIAQLQEALLHCGKFQDALEPLLSWLADTEELI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DCDVQGLEHDMEEINARWNTLNKKVAQRIAQLQEALLHCGKFQDALEPLLSWLADTEELI
3250 3260 3270 3280 3290 3300
3280 3290 3300 3310 3320 3330
pF1KE0 ANQKPPSAEYKVVKAQIQEQKLLQRLLDDRKATVDMLQAEGGRIAQSAELADREKITGQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ANQKPPSAEYKVVKAQIQEQKLLQRLLDDRKATVDMLQAEGGRIAQSAELADREKITGQL
3310 3320 3330 3340 3350 3360
3340 3350 3360 3370 3380 3390
pF1KE0 ESLESRWTELLSKAAARQKQLEDILVLAKQFHETAEPISDFLSVTEKKLANSEPVGTQTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ESLESRWTELLSKAAARQKQLEDILVLAKQFHETAEPISDFLSVTEKKLANSEPVGTQTA
3370 3380 3390 3400 3410 3420
3400 3410
pF1KE0 KIQQQIIRHKAL------------------------------------------------
::::::::::::
CCDS43 KIQQQIIRHKALEEDIENHATDVHQAVKIGQSLSSLTSPAEQGVLSEKIDSLQARYSEIQ
3430 3440 3450 3460 3470 3480
pF1KE0 ------------------------------------------------------------
CCDS43 DRCCRKAALLDQALSNARLFGEDEVEVLNWLAEVEDKLSSVFVKDFKQDVLHRQHADHLA
3490 3500 3510 3520 3530 3540
3420 3430 3440 3450 3460 3470
pF1KE0 -NEEIVNRKKNVDQAIKNGQALLKQTTGEEVLLIQEKLDGIKTRYADITVTSSKALRTLE
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LNEEIVNRKKNVDQAIKNGQALLKQTTGEEVLLIQEKLDGIKTRYADITVTSSKALRTLE
3550 3560 3570 3580 3590 3600
3480 3490 3500 3510 3520 3530
pF1KE0 QARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVMEHRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVMEHRLV
3610 3620 3630 3640 3650 3660
3540 3550 3560 3570 3580 3590
pF1KE0 LDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQQYEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQQYEQ
3670 3680 3690 3700 3710 3720
3600 3610 3620 3630 3640 3650
pF1KE0 AADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSIDIIRHKDSMDELFSHRSEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 AADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSIDIIRHKDSMDELFSHRSEI
3730 3740 3750 3760 3770 3780
3660 3670 3680 3690 3700 3710
pF1KE0 FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWETYEELSPWIEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWETYEELSPWIEE
3790 3800 3810 3820 3830 3840
3720 3730 3740 3750 3760 3770
pF1KE0 TRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQLKELNPEEGEMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQLKELNPEEGEMV
3850 3860 3870 3880 3890 3900
3780 3790 3800 3810 3820 3830
pF1KE0 EEKYQKAENMYAQIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLETLENLSSRLRMPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EEKYQKAENMYAQIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLETLENLSSRLRMPP
3910 3920 3930 3940 3950 3960
3840 3850 3860 3870 3880 3890
pF1KE0 LIPAEVDKIRECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGADKDLAAKEIQDKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LIPAEVDKIRECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGADKDLAAKEIQDKL
3970 3980 3990 4000 4010 4020
3900 3910 3920 3930 3940 3950
pF1KE0 DQMVFFWEDIKARAEEREIKFLDVLELAEKFWYDMAALLTTIKDTQDIVHDLESPGIDPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DQMVFFWEDIKARAEEREIKFLDVLELAEKFWYDMAALLTTIKDTQDIVHDLESPGIDPS
4030 4040 4050 4060 4070 4080
3960 3970 3980 3990 4000 4010
pF1KE0 IIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKSIDEMNNAWENLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKSIDEMNNAWENLN
4090 4100 4110 4120 4130 4140
4020 4030 4040 4050 4060 4070
pF1KE0 KTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDLNTVKDQLNEMKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDLNTVKDQLNEMKE
4150 4160 4170 4180 4190 4200
4080 4090 4100 4110 4120 4130
pF1KE0 FKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWENLGEKIAHRQHKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 FKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWENLGEKIAHRQHKL
4210 4220 4230 4240 4250 4260
4140 4150 4160 4170 4180 4190
pF1KE0 EGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKHHVLKNDVLAHQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKHHVLKNDVLAHQA
4270 4280 4290 4300 4310 4320
4200 4210 4220 4230 4240 4250
pF1KE0 TVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQLQSTLQQAQGFH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQLQSTLQQAQGFH
4330 4340 4350 4360 4370 4380
4260 4270 4280 4290 4300 4310
pF1KE0 SEIEDFLLELTRMESQLSASKPTGGLPETAREQLDTHMELYSQLKAKEETYNQLLDKGRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SEIEDFLLELTRMESQLSASKPTGGLPETAREQLDTHMELYSQLKAKEETYNQLLDKGRL
4390 4400 4410 4420 4430 4440
4320 4330 4340 4350 4360 4370
pF1KE0 MLLSRDDSGSGSKTEQSVALLEQKWHVVSSKMEERKSKLEEALNLATEFQNSLQEFINWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MLLSRDDSGSGSKTEQSVALLEQKWHVVSSKMEERKSKLEEALNLATEFQNSLQEFINWL
4450 4460 4470 4480 4490 4500
4380 4390 4400 4410 4420 4430
pF1KE0 TLAEQSLNIASPPSLILNTVLSQIEEHKVFANEVNAHRDQIIELDQTGNQLKFLSQKQDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 TLAEQSLNIASPPSLILNTVLSQIEEHKVFANEVNAHRDQIIELDQTGNQLKFLSQKQDV
4510 4520 4530 4540 4550 4560
4440 4450 4460 4470 4480 4490
pF1KE0 VLIKNLLVSVQSRWEKVVQRSIERGRSLDDARKRAKQFHEAWKKLIDWLEDAESHLDSEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VLIKNLLVSVQSRWEKVVQRSIERGRSLDDARKRAKQFHEAWKKLIDWLEDAESHLDSEL
4570 4580 4590 4600 4610 4620
4500 4510 4520 4530 4540 4550
pF1KE0 EISNDPDKIKLQLSKHKEFQKTLGGKQPVYDTTIRTGRALKEKTLLPEDSQKLDNFLGEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EISNDPDKIKLQLSKHKEFQKTLGGKQPVYDTTIRTGRALKEKTLLPEDSQKLDNFLGEV
4630 4640 4650 4660 4670 4680
4560 4570 4580 4590 4600 4610
pF1KE0 RDKWDTVCGKSVERQHKLEEALLFSGQFMDALQALVDWLYKVEPQLAEDQPVHGDLDLVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RDKWDTVCGKSVERQHKLEEALLFSGQFMDALQALVDWLYKVEPQLAEDQPVHGDLDLVM
4690 4700 4710 4720 4730 4740
4620 4630 4640 4650 4660 4670
pF1KE0 NLMDAHKVFQKELGKRTGTVQVLKRSGRELIENSRDDTTWVKGQLQELSTRWDTVCKLSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NLMDAHKVFQKELGKRTGTVQVLKRSGRELIENSRDDTTWVKGQLQELSTRWDTVCKLSV
4750 4760 4770 4780 4790 4800
4680 4690 4700 4710 4720 4730
pF1KE0 SKQSRLEQALKQAEVFRDTVHMLLEWLSEAEQTLRFRGALPDDTEALQSLIDTHKEFMKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SKQSRLEQALKQAEVFRDTVHMLLEWLSEAEQTLRFRGALPDDTEALQSLIDTHKEFMKK
4810 4820 4830 4840 4850 4860
4740 4750 4760 4770 4780 4790
pF1KE0 VEEKRVDVNSAVAMGEVILAVCHPDCITTIKHWITIIRARFEEVLTWAKQHQQRLETALS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VEEKRVDVNSAVAMGEVILAVCHPDCITTIKHWITIIRARFEEVLTWAKQHQQRLETALS
4870 4880 4890 4900 4910 4920
4800 4810 4820 4830 4840 4850
pF1KE0 ELVANAELLEELLAWIQWAETTLIQRDQEPIPQNIDRVKALIAEHQTFMEEMTRKQPDVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ELVANAELLEELLAWIQWAETTLIQRDQEPIPQNIDRVKALIAEHQTFMEEMTRKQPDVD
4930 4940 4950 4960 4970 4980
4860 4870 4880 4890 4900 4910
pF1KE0 RVTKTYKRKNIEPTHAPFIEKSRSGGRKSLSQPTPPPMPILSQSEAKNPRINQLSARWQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RVTKTYKRKNIEPTHAPFIEKSRSGGRKSLSQPTPPPMPILSQSEAKNPRINQLSARWQQ
4990 5000 5010 5020 5030 5040
4920 4930 4940 4950 4960 4970
pF1KE0 VWLLALERQRKLNDALDRLEELKEFANFDFDVWRKKYMRWMNHKKSRVMDFFRRIDKDQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 VWLLALERQRKLNDALDRLEELKEFANFDFDVWRKKYMRWMNHKKSRVMDFFRRIDKDQD
5050 5060 5070 5080 5090 5100
4980 4990 5000 5010 5020 5030
pF1KE0 GKITRQEFIDGILASKFPTTKLEMTAVADIFDRDGDGYIDYYEFVAALHPNKDAYRPTTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GKITRQEFIDGILASKFPTTKLEMTAVADIFDRDGDGYIDYYEFVAALHPNKDAYRPTTD
5110 5120 5130 5140 5150 5160
5040 5050 5060 5070 5080 5090
pF1KE0 ADKIEDEVTRQVAQCKCAKRFQVEQIGENKYRFGDSQQLRLVRILRSTVMVRVGGGWMAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 ADKIEDEVTRQVAQCKCAKRFQVEQIGENKYRFGDSQQLRLVRILRSTVMVRVGGGWMAL
5170 5180 5190 5200 5210 5220
5100 5110 5120 5130 5140 5150
pF1KE0 DEFLVKNDPCRARGRTNIELREKFILPEGASQGMTPFRSRGRRSKPSSRAASPTRSSSSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DEFLVKNDPCRARGRTNIELREKFILPEGASQGMTPFRSRGRRSKPSSRAASPTRSSSSA
5230 5240 5250 5260 5270 5280
5160 5170 5180 5190 5200 5210
pF1KE0 SQSNHSCTSMPSSPATPASGTKVIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGA
::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SQSNHSCTSMPSSPATPASGTKVIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGA
5290 5300 5310 5320 5330 5340
5220 5230 5240 5250 5260 5270
pF1KE0 KTNRADPKKSASRPGSRAGSRAGSRASSRRGSDASDFDLLETQSACSDTSESSAAGGQGN
CCDS43 KTNRADPKKSASRPGSRAGSRAGSRASSRRGSDASDFDLLETQSACSDTSESSAAGGQGN
5350 5360 5370 5380 5390 5400
>--
initn: 630 init1: 630 opt: 630 Z-score: 349.2 bits: 81.0 E(32554): 3.9e-13
Smith-Waterman score: 630; 100.0% identity (100.0% similar) in 98 aa overlap (5203-5300:5333-5430)
5180 5190 5200 5210 5220 5230
pF1KE0 VIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGAKTNRADPKKSASRPGSRAGSRA
::::::::::::::::::::::::::::::
CCDS43 VIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGAKTNRADPKKSASRPGSRAGSRA
5310 5320 5330 5340 5350 5360
5240 5250 5260 5270 5280 5290
pF1KE0 GSRASSRRGSDASDFDLLETQSACSDTSESSAAGGQGNSRRGLNKPSKIPTMSKKTTTAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GSRASSRRGSDASDFDLLETQSACSDTSESSAAGGQGNSRRGLNKPSKIPTMSKKTTTAS
5370 5380 5390 5400 5410 5420
5300
pF1KE0 PRTPGPKR
::::::::
CCDS43 PRTPGPKR
5430
>>CCDS47443.1 DST gene_id:667|Hs108|chr6 (5171 aa)
initn: 12872 init1: 2772 opt: 8379 Z-score: 4552.2 bits: 858.6 E(32554): 0
Smith-Waterman score: 17124; 52.1% identity (78.9% similar) in 5130 aa overlap (425-5288:56-5160)
400 410 420 430 440 450
pF1KE0 GYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEKLTLAKNTL
:::.: ::::..: .. ::.:: :: :.:
CCDS47 DSNENLLLVHCGPTLINSCISFGSESFDGHRLEMLQQIANRVQRDSVICEDKLILAGNAL
30 40 50 60 70 80
460 470 480 490 500 510
pF1KE0 QADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELAFRVMRLQD
:.:. .:::: : :... :: :::.:.:: .:.::: : .::: ..:. :: .:.:
CCDS47 QSDSKRLESGVQFQNEAEIAGYILECENLLRQHVIDVQILIDGKYYQADQLVQRVAKLRD
90 100 110 120 130 140
520 530 540
pF1KE0 ELVTLRLECTNLYRKGHFTSLE-------------------LVPPSTLT------TTHLK
:...:: ::...: ::.. . : . :: . : :
CCDS47 EIMALRNECSSVYSKGRILTTEQTKLMISGITQSLNSGFAQTLHPSLTSGLTQSLTPSLT
150 160 170 180 190 200
550 560 570
pF1KE0 AEPLTKATHSSSTS-------------------------------------WFRKPMTRA
. .:.. :. :: .:::. ..
CCDS47 SSSMTSGLSSGMTSRLTPSVTPAYTPGFPSGLVPNFSSGVEPNSLQTLKLMQIRKPLLKS
210 220 230 240 250 260
580 590 600 610 620 630
pF1KE0 ELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIHTSVEEL
:. . .:.: :..:: .::.::.:::..:.:.:::.:::::: .::.....: ..::.
CCDS47 SLLDQNLTEEEINMKFVQDLLNWVDEMQVQLDRTEWGSDLPSVESHLENHKNVHRAIEEF
270 280 290 300 310 320
640 650 660 670 680 690
pF1KE0 GSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFVSRATAE
::.:::.. : .:. .. .::: : .::.:: :: .:: . :::..::.:::::: :
CCDS47 ESSLKEAKISEIQMTAPLKLTYAEKLHRLESQYAKLLNTSRNQERHLDTLHNFVSRATNE
330 340 350 360 370 380
700 710 720 730 740 750
pF1KE0 LIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELLSLENHP
:::::::::::.:::::. :.::. :..: .:: ::..:.. ..:.:. :: : :::::
CCDS47 LIWLNEKEEEEVAYDWSERNTNIARKKDYHAELMRELDQKEENIKSVQEIAEQLLLENHP
390 400 410 420 430 440
760 770 780 790 800 810
pF1KE0 AKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQDSIKRK
:. :.::: ::.:.: .:. ::: :::::.:::::::.::.::.: ..::::.:.:.::
CCDS47 ARLTIEAYRAAMQTQWSWILQLCQCVEQHIKENTAYFEFFNDAKEATDYLRNLKDAIQRK
450 460 470 480 490 500
820 830 840 850 860 870
pF1KE0 YSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHVLKNTIS
::::...:. .::::.:.::.:::.:.: ::..:.:.:..:::.:::::. : ::..:
CCDS47 YSCDRSSSIHKLEDLVQESMEEKEELLQYKSTIANLMGKAKTIIQLKPRNSDCPLKTSIP
510 520 530 540 550 560
880 890 900 910 920 930
pF1KE0 VKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPNKDAIEM
.::.:::::::::: :.::::: .::.:.::::::::::::::::::: .:::::.:...
CCDS47 IKAICDYRQIEITIYKDDECVLANNSHRAKWKVISPTGNEAMVPSVCFTVPPPNKEAVDL
570 580 590 600 610 620
940 950 960 970 980 990
pF1KE0 ASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGECHQIMKN
:.:.::.::.:..:::. :.: ::..::.:: ...: ... :. .... ::: .:...:
CCDS47 ANRIEQQYQNVLTLWHESHINMKSVVSWHYLINEIDRIRASNVASIKTMLPGEHQQVLSN
630 640 650 660 670 680
1000 1010 1020 1030 1040 1050
pF1KE0 LQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVAKMYISE
::...::::.::..: .:: .: .::.::..:: .:.:.:: : :..::.: ..::::
CCDS47 LQSRFEDFLEDSQESQVFSGSDITQLEKEVNVCKQYYQELLKSAEREEQEESVYNLYISE
690 700 710 720 730 740
1060 1070 1080 1090 1100 1110
pF1KE0 LKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRSDLDAVS
..:::::::. :.:....:.. .:: .....::.:::. ...:..:..:: ...
CCDS47 VRNIRLRLENCEDRLIRQIRT----PLERDDLHESVFRITEQEKLKKELERLKDDLGTIT
750 760 770 780 790 800
1120 1130 1140 1150 1160 1170
pF1KE0 MKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSIQDAELL
::. :. :. .::::::::::::.....:..::..:..:..:::::...... : :: :
CCDS47 NKCEEFFSQAAASSSVPTLRSELNVVLQNMNQVYSMSSTYIDKLKTVNLVLKNTQAAEAL
810 820 830 840 850 860
1180 1190 1200 1210 1220 1230
pF1KE0 VKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMS
:: :: :: .::.:.:: . .: :::..: :.: .: .:: .:..:. :::.....:
CCDS47 VKLYETKLCEEEAVIADKNNIENLISTLKQWRSEVDEKRQVFHALEDELQKAKAISDEMF
870 880 890 900 910 920
1240 1250 1260 1270 1280 1290
pF1KE0 RLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGTLIKWIE
. ::.::.. ..::..:: :::. : .:.. : .::.: . : :: . : ::.
CCDS47 KTYKERDLDFDWHKEKADQLVERWQNVHVQIDNRLRDLEGIGKSLKYYRDTYHPLDDWIQ
930 940 950 960 970 980
1300 1310 1320 1330 1340 1350
pF1KE0 ETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTIVKDYEL
.. . :. .. .: :.:..:. ::.:: : .::: .:.:.:.:::...:::. ::::::
CCDS47 QVETTQRKIQENQPENSKTLATQLNQQKMLVSEIEMKQSKMDECQKYAEQYSATVKDYEL
990 1000 1010 1020 1030 1040
1360 1370 1380 1390 1400 1410
pF1KE0 QLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYISDALRR
: :::.:.:.:::::: ::::: ::.: : :::::::::::::::: ::..:. .:.:.:
CCDS47 QTMTYRAMVDSQQKSPVKRRRMQSSADLIIQEFMDLRTRYTALVTLMTQYIKFAGDSLKR
1050 1060 1070 1080 1090 1100
1420 1430 1440 1450 1460 1470
pF1KE0 LEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKAILEQQVLSE
:::::: .::::.:::::.::: :::..... . ... : .:.. ::
CCDS47 LEEEEKSLEEEKKEHVEKAKELQKWVSNISKTLKDAEKAGKPPFS--------KQKISSE
1110 1120 1130 1140 1150
1480 1490 1500 1510 1520 1530
pF1KE0 ELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCDGSANQLQQL
:..:::::.:::..: :.:::::: :....:.... .:...:...:. : . : .:::.
CCDS47 EISTKKEQLSEALQTIQLFLAKHGDKMTDEERNELEKQVKTLQESYNLLFSESLKQLQES
1160 1170 1180 1190 1200 1210
1540 1550 1560 1570 1580 1590
pF1KE0 QSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQQDLSA-LQKNQSD
:.. ..:.: . ..:. ...:. .:. . :.: : ::: : .. :.: ::
CCDS47 QTSGDVKVEEKIVAERQQEYKEKLQGICDLLTQTENRLIGHQEAFMIGDGTVELKKYQSK
1220 1230 1240 1250 1260 1270
1600 1610 1620 1630 1640 1650
pF1KE0 LKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAKEQYEALQEETR
..:: :.:. : ..: :::. :.:..:: ::: .. . ...::..:: . : :. ...
CCDS47 QEELQKDMQGSAQALAEVVKNTENFLKENGEKLSQEDKALIEQKLNEAKIKCEQLNLKAE
1280 1290 1300 1310 1320 1330
1660 1670 1680 1690 1700 1710
pF1KE0 VAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGGQLLTNLPGMEQ
..:::...::.:...:::: :.:.: :.: ::. ::::...: ... . :. . .
CCDS47 QSKKELDKVVTTAIKEETEKVAAVKQLEESKTKIENLLDWLSNVDKDSERAGTKHKQVIE
1340 1350 1360 1370 1380 1390
1720 1730 1740 1750
pF1KE0 LSGASLEKGA---------------LDT-TDGYMGVNQAPEKLDKQCEMMKARHQELLSQ
.:. ...: :.: .:: .:..: :.:..: . .::.:....::
CCDS47 QNGTHFQEGDGKSAIGEEDEVNGNLLETDVDGQVGTTQ--ENLNQQYQKVKAQHEKIISQ
1400 1410 1420 1430 1440 1450
1760 1770 1780 1790 1800 1810
pF1KE0 QQNFILATQSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELKQVQTLQD
.: :.::::::..:...:. :.:::.. ::... ::: .: :.::.:: ..: ...::.
CCDS47 HQAVIIATQSAQVLLEKQGQYLSPEEKEKLQKNMKELKVHYETALAESEKKMKLTHSLQE
1460 1470 1480 1490 1500 1510
1820 1830 1840 1850 1860 1870
pF1KE0 ELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISHKGDLRFV
::.:: :. ::: ::..::.::::.. :... . : . :::: ::::::::::::::..
CCDS47 ELEKFDADYTEFEHWLQQSEQELENLEAGADDINGLMTKLKRQKSFSEDVISHKGDLRYI
1520 1530 1540 1550 1560 1570
1880 1890 1900 1910 1920 1930
pF1KE0 TISGQKVLDMENSFKE---GK-EPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLL
::::..::. .: .. :: . : :. :: ::.:. .:.:::. ::..:. :.
CCDS47 TISGNRVLEAAKSCSKRDGGKVDTSATHREVQRKLDHATDRFRSLYSKCNVLGNNLKDLV
1580 1590 1600 1610 1620 1630
1940 1950 1960 1970 1980 1990
pF1KE0 GQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQVPV
.:....... .: : .:::::.. : ::. .: :: ::.:: :: :: ... .:: :
CCDS47 DKYQHYEDASCGLLAGLQACEATASKHLSEPIAVDPKNLQRQLEETKALQGQISSQQVAV
1640 1650 1660 1670 1680 1690
2000 2010 2020 2030 2040 2050
pF1KE0 EKLQKVARDIMEIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSSLLQKAIAQSQSVQ
:::.:.:. ... .: : . .:.: :.:......:: :. ::. :: ....: :::
CCDS47 EKLKKTAEVLLDARGSLLPAKNDIQKTLDDIVGRYEDLSKSVNERNEKLQITLTRSLSVQ
1700 1710 1720 1730 1740 1750
2060 2070 2080 2090 2100 2110
pF1KE0 ESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATREMVTR
..:. .:. .:.::..:. . :.: ..:. .. :. :.:::: ..::..: : : .
CCDS47 DGLDEMLDWMGNVESSLKEQGQVPLNSTALQDIISKNIMLEQDIAGRQSSINAMNEKVKK
1760 1770 1780 1790 1800 1810
2120 2130 2140 2150 2160 2170
pF1KE0 FMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKLQQFME
::::.: .::. ::.:. ..: :: . ...: .....: ..:.::.:: ::: :.:
CCDS47 FMETTDPSTASSLQAKMKDLSARFSEASHKHKETLAKMEELKTKVELFENLSEKLQTFLE
1820 1830 1840 1850 1860 1870
2180 2190 2200 2210 2220 2230
pF1KE0 NKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGFALDLCQHQ
.:.. :. . : .:.:.. : .:: . :. .....:..:. :. :.:: :. :
CCDS47 TKTQALTEVDVPGKDVTELSQYMQESTSEFLEHKKHLEVLHSLLKEISSHGLPSDKALVL
1880 1890 1900 1910 1920 1930
2240 2250 2260 2270 2280 2290
pF1KE0 DRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSIPPTETSMS
....:: : : :.. :.::... ..::::::: :. ::.....:.::: ..: .. :..
CCDS47 EKTNNLSKKFKEMEDTIKEKKEAVTSCQEQLDAFQVLVKSLKSWIKETTKKVPIVQPSFG
1940 1950 1960 1970 1980 1990
2300 2310 2320 2330
pF1KE0 AKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP--------------D
:..: :..: :.: . :. : ....: .: :: ::: .:.: .
CCDS47 AEDLGKSLEDTKKLQEKWSLKTPEIQKVNNSGISLCNLISAVTTPAKAIAAVKSGGAVLN
2000 2010 2020 2030 2040 2050
2340 2350 2360 2370 2380
pF1KE0 SQGKTD----------LTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEAN
..: . :: :. ::.:.. :: :: .:... :.. :........:..
CCDS47 GEGTATNTEEFWANKGLTSIKKDMTDISHGYEDLGLLLKDKIAELNTKLSKLQKAQEESS
2060 2070 2080 2090 2100 2110
2390 2400 2410 2420 2430 2440
pF1KE0 SVLQWLESKEEVLKSMDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKVKEALAGLL
...:::.. ... . . .:: ::.::.:.:.::.: :::.:: :.:..:. :. ::
CCDS47 AMMQWLQKMNKTATKWQQTPAPTDTEAVKTQVEQNKSFEAELKQNVNKVQELKDKLTELL
2120 2130 2140 2150 2160 2170
2450 2460 2470 2480 2490 2500
pF1KE0 VTYPNSQEAENWKKIQEELNSRWERATEVTVARQRQLEESASHLACFQAAESQLRPWLME
:.. :: ::.. :..:.:.. ...:. ::..::::...:. ::..:.::. ::.:
CCDS47 EENPDTPEAPRWKQMLTEIDSKWQELNQLTIDRQQKLEESSNNLTQFQTVEAQLKQWLVE
2180 2190 2200 2210 2220 2230
2510 2520 2530 2540 2550 2560
pF1KE0 KELMMGVLGPLSIDPNMLNAQKQQVQFMLKEFEARRQQHEQLNEAAQGILTGPG-DVSLS
::::..:::::::::::::.:.::::..:.:: .:. :.:::. :.::::. :: : ::
CCDS47 KELMVSVLGPLSIDPNMLNTQRQQVQILLQEFATRKPQYEQLTAAGQGILSRPGEDPSLR
2240 2250 2260 2270 2280 2290
2570 2580 2590 2600 2610 2620
pF1KE0 TSQVQKELQSINQKWVELTDKLNSRSSQIDQAIVKSTQYQELLQDLSEKVRAVGQRLSVQ
. :...: ...::: :: .:..: . :::::::::::: ::..::.:. . ..:: .
CCDS47 -GIVKEQLAAVTQKWDSLTGQLSDRCDWIDQAIVKSTQYQSLLRSLSDKLSDLDNKLSSS
2300 2310 2320 2330 2340 2350
2630 2640 2650 2660 2670 2680
pF1KE0 SAISTQPEAVKQQLEETSEIRSDLEQLDHEVKEAQTLCDELSVLIGEQYLKDELKKRLET
:.::.:.:..:::: .........: ...: ::.::..::.:. :.::: ::...::
CCDS47 LAVSTHPDAMNQQLETAQKMKQEIQQEKKQIKVAQALCEDLSALVKEEYLKAELSRQLEG
2360 2370 2380 2390 2400 2410
2690 2700 2710 2720 2730 2740
pF1KE0 VALPLQGLEDLAADRINRLQAALASTQQFQQMFDELRTWLDDKQSQQAKNCPISAKLERL
. .. .:. : .....::.: ::..::::: ....::: :. .: :. ::::::. :
CCDS47 ILKSFKDVEQKAENHVQHLQSACASSHQFQQMSRDFQAWLDTKKEEQNKSHPISAKLDVL
2420 2430 2440 2450 2460 2470
2750 2760 2770 2780 2790 2800
pF1KE0 QSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKNHWEELSK
.: ......:.:.:. .: :: .::::.:::.. : :: .:: :: .:..:. ..:
CCDS47 ESLIKDHKDFSKTLTAQSHMYEKTIAEGENLLLKTQ-GSEKAALQLQLNTIKTNWDTFNK
2480 2490 2500 2510 2520
2810 2820 2830 2840 2850 2860
pF1KE0 KTADRQSRLKDCMQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSLLRSKAML
.. .:...::. ..:: ::. .:: : :::. :. .. :.. :::.. :.:. . :..
CCDS47 QVKERENKLKESLEKALKYKEQVETLWPWIDKCQNNLEEIKFCLDPAEGENSIAKLKSLQ
2530 2540 2550 2560 2570 2580
2870 2880 2890 2900 2910 2920
pF1KE0 NEVEKRRSLLEILNSAADILINSSEADEDGIRDEKAGINQNMDAVTEELQAKTGSLEEMT
.:.... ...:.::..:. :.. : :.. . ::. .. :..: :::.:..: ::.::
CCDS47 KEMDQHFGMVELLNNTANSLLSVCEIDKEVVTDENKSLIQKVDMVTEQLHSKKFCLENMT
2590 2600 2610 2620 2630 2640
2930 2940 2950 2960 2970 2980
pF1KE0 QRLREFQESFKNIEKKVEGAKHQLEIFDALGSQACSNKNLEKLRAQQEVLQALEPQVDYL
:...:::: :. ..... ::.::.: :.::::: ::: : :..::. ::::. :::
CCDS47 QKFKEFQEVSKESKRQLQCAKEQLDIHDSLGSQAYSNKYLTMLQTQQKSLQALKHQVDLA
2650 2660 2670 2680 2690 2700
2990 3000 3010 3020 3030 3040
pF1KE0 RNFTQGLVEDAPDGSDASQLLHQAEVAQQEFLEVKQRVNSGCVMMENKLEGIGQFHCRVR
. ..: :: .: :.. .:..: :.:. :: ..:.:. : ..:.::.:::.:. .:
CCDS47 KRLAQDLVVEASDSKGTSDVLLQVETIAQEHSTLSQQVDEKCSFLETKLQGIGHFQNTIR
2710 2720 2730 2740 2750 2760
3050 3060 3070 3080 3090 3100
pF1KE0 EMFSQLADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKIHVLKLDIEASEAECRHMLE-
:::::.:..:::::.:. .:::...::.: : .. ::.:...: . . .. :. ::
CCDS47 EMFSQFAEFDDELDSMAPVGRDAETLQKQKETIKAFLKKLEALMASNDNANKTCKMMLAT
2770 2780 2790 2800 2810 2820
3110 3120 3130 3140 3150 3160
pF1KE0 EEGTLDLLGLKRELEALNKQCGKLTERGKARQEQLELTLGRVEDFYRKLKGLNDATTAAE
:: . ::.:.::.::::.:::.:: .:..::.::.: :. :.:.:: ::: .. ::
CCDS47 EETSPDLVGIKRDLEALSKQCNKLLDRAQAREEQVEGTIKRLEEFYSKLKEFSILLQKAE
2830 2840 2850 2860 2870 2880
3170 3180 3190 3200 3210 3220
pF1KE0 EAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMKLQQVNGLGQGLIQSAGKDCDVQG
: : : :: :.: ::::: ::.::::...::: : :.:: :::::::::.:. ..::
CCDS47 EHEESQGPVGMETETINQQLNMFKVFQKEEIEPLQGKQQDVNWLGQGLIQSAAKSTSTQG
2890 2900 2910 2920 2930 2940
3230 3240 3250 3260 3270 3280
pF1KE0 LEHDMEEINARWNTLNKKVAQRIAQLQEALLHCGKFQDALEPLLSWLADTEELIANQKPP
::::....::::.::::::::: :::::::::::.:::::: ::::..:::::.::::::
CCDS47 LEHDLDDVNARWKTLNKKVAQRAAQLQEALLHCGRFQDALESLLSWMVDTEELVANQKPP
2950 2960 2970 2980 2990 3000
3290 3300 3310 3320 3330 3340
pF1KE0 SAEYKVVKAQIQEQKLLQRLLDDRKATVDMLQAEGGRIAQSAELADREKITGQLESLESR
:::.:::::::::::::::::::::.::.... :: .:: .:: ::. :: :: :.::
CCDS47 SAEFKVVKAQIQEQKLLQRLLDDRKSTVEVIKREGEKIATTAEPADKVKILKQLSLLDSR
3010 3020 3030 3040 3050 3060
3350 3360 3370 3380 3390 3400
pF1KE0 WTELLSKAAARQKQLEDILVLAKQFHETAEPISDFLSVTEKKLANSEPVGTQTAKIQQQI
: ::.:: .:..::: : :.:.::::: ::....:.. ::.:.: ::.:::..:...::
CCDS47 WEALLNKAETRNRQLEGISVVAQQFHETLEPLNEWLTTIEKRLVNCEPIGTQASKLEEQI
3070 3080 3090 3100 3110 3120
3410
pF1KE0 IRHKALNEEIVN------------------------------------------------
.::::...:.:
CCDS47 AQHKALEDDIINHNKHLHQAVSIGQSLKVLSSREDKDMVQSKLDFSQVWYIEIQEKSHSR
3130 3140 3150 3160 3170 3180
pF1KE0 ------------------------------------------------------------
CCDS47 SELLQQALCNAKIFGEDEVELMNWLNEVHDKLSKLSVQDYSTEGLWKQQSELRVLQEDIL
3190 3200 3210 3220 3230 3240
3420 3430 3440 3450 3460 3470
pF1KE0 -RKKNVDQAIKNGQALLKQTTGEEVLLIQEKLDGIKTRYADITVTSSKALRTLEQARQLA
::.:::::. :: :::::::.:::.::.::..::.:: ::: :. . .::::: :::
CCDS47 LRKQNVDQALLNGLELLKQTTGDEVLIIQDKLEAIKARYKDITKLSTDVAKTLEQALQLA
3250 3260 3270 3280 3290 3300
3480 3490 3500 3510 3520 3530
pF1KE0 TKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVMEHRLVLDTVNE
...::.::: :: .:: :: . : ::. : :.: ::::::. ... .::..::
CCDS47 RRLHSTHEELCTWLDKVEVELLSYETQVLKGEEASQAQMRPKELKKEAKNNKALLDSLNE
3310 3320 3330 3340 3350 3360
3540 3550 3560 3570 3580 3590
pF1KE0 VSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQQYEQAADAEL
:: ::::::::::::::.:.:.. ::.:.:::::: :.:.:::::: ::::..:::::::
CCDS47 VSSALLELVPWRAREGLEKMVAEDNERYRLVSDTITQKVEEIDAAILRSQQFDQAADAEL
3370 3380 3390 3400 3410 3420
3600 3610 3620 3630 3640 3650
pF1KE0 AWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSIDIIRHKDSMDELFSHRSEIFGTCGE
.:..::..:::.:: ::::::::.:::::::.:...:.:::: .:.: . .:. .:.:
CCDS47 SWITETEKKLMSLGDIRLEQDQTSAQLQVQKTFTMEILRHKDIIDDLVKSGHKIMTACSE
3430 3440 3450 3460 3470 3480
3660 3670 3680 3690 3700 3710
pF1KE0 EQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWETYEELSPWIEETRALIA
:.: ...: ......:..: .::::: .::::: :::::::::::: ::. ::...:.
CCDS47 EEKQSMKKKLDKVLKNYDTICQINSERYLQLERAQSLVNQFWETYEELWPWLTETQSIIS
3490 3500 3510 3520 3530 3540
3720 3730 3740 3750 3760 3770
pF1KE0 QLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQLKELNPEEGEMVEEKYQK
:::.::...: ::::::: ::::: ::::::::::. : :::: ::.: :: ..:::
CCDS47 QLPAPALEYETLRQQQEEHRQLRELIAEHKPHIDKMNKTGPQLLELSPGEGFSIQEKYVA
3550 3560 3570 3580 3590 3600
3780 3790 3800 3810 3820 3830
pF1KE0 AENMYAQIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLETLENLSSRLRMPPLIPAEV
:...:.::::.:..::.:::::.::::: :::::. .::.:: . :::.:: : :::
CCDS47 ADTLYSQIKEDVKKRAVALDEAISQSTQ---FHDKIDQILESLERIVERLRQPPSISAEV
3610 3620 3630 3640 3650 3660
3840 3850 3860 3870 3880 3890
pF1KE0 DKIRECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGADKDLAAKEIQDKLDQMVFF
.::.: ::.::...:..::::: .:.::.::::.:.:: :.:::..:: .:::::::::.
CCDS47 EKIKEQISENKNVSVDMEKLQPLYETLKQRGEEMIARSGGTDKDISAKAVQDKLDQMVFI
3670 3680 3690 3700 3710 3720
3900 3910 3920 3930 3940 3950
pF1KE0 WEDIKARAEEREIKFLDVLELAEKFWYDMAALLTTIKDTQDIVHDLESPGIDPSIIKQQV
::.:.. .:::: :.:::.::::::: : .:..:::::::...:::.::::::..:::
CCDS47 WENIHTLVEEREAKLLDVMELAEKFWCDHMSLIVTIKDTQDFIRDLEDPGIDPSVVKQQQ
3730 3740 3750 3760 3770 3780
3960 3970 3980 3990 4000 4010
pF1KE0 EAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKSIDEMNNAWENLNKTWKER
::::::.:: :::.:::... ::..:: :::: .:: :.:::::.:.::..:::.::.:
CCDS47 EAAETIREEIDGLQEELDIVINLGSELIAACGEPDKPIVKKSIDELNSAWDSLNKAWKDR
3790 3800 3810 3820 3830 3840
4020 4030 4040 4050 4060 4070
pF1KE0 LEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDLNTVKDQLNEMKEFKVEVY
..:::.:::::::::: :::.:::.: . :: .: :.::::.:::.:..:.:.:: :.:
CCDS47 IDKLEEAMQAAVQYQDGLQAVFDWVDIAGGKLASMSPIGTDLETVKQQIEELKQFKSEAY
3850 3860 3870 3880 3890 3900
4080 4090 4100 4110 4120 4130
pF1KE0 QQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWENLGEKIAHRQHKLEGALLA
:::::::.::::.::.:::.:.:.:. ...:: ::: .:..: :.: .:::::::::::
CCDS47 QQQIEMERLNHQAELLLKKVTEESDKHTVQDPLMELKLIWDSLEERIINRQHKLEGALLA
3910 3920 3930 3940 3950 3960
4140 4150 4160 4170 4180 4190
pF1KE0 LGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKHHVLKNDVLAHQATVETVN
::::::::.::..:::::: ::. :.:..::::.::.::::::::.:::::::.:::.::
CCDS47 LGQFQHALDELLAWLTHTEGLLSEQKPVGGDPKAIEIELAKHHVLQNDVLAHQSTVEAVN
3970 3980 3990 4000 4010 4020
4200 4210 4220 4230 4240 4250
pF1KE0 KAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQLQSTLQQAQGFHSEIEDF
::::.:.:::::..::.:...::..:: :..::.:::.:.:::...:.::.:::.::::.
CCDS47 KAGNDLIESSAGEEASNLQNKLEVLNQRWQNVLEKTEQRKQQLDGALRQAKGFHGEIEDL
4030 4040 4050 4060 4070 4080
4260 4270 4280 4290 4300 4310
pF1KE0 LLELTRMESQLSASKPTGGLPETAREQLDTHMELYSQLKAKEETYNQLLDKGRLMLLSRD
:: : .: :::: :::::::.:::..:::. . ..::::::..:..::. :: .:
CCDS47 QQWLTDTERHLLASKPLGGLPETAKEQLNVHMEVCAAFEAKEETYKSLMQKGQQML-ARC
4090 4100 4110 4120 4130 4140
4320 4330 4340 4350 4360 4370
pF1KE0 DSGSGSKTEQSVALLEQKWHVVSSKMEERKSKLEEALNLATEFQNSLQEFINWLTLAEQS
... .. .:.. :..::. : .:..:::.::::::::: ::.::::.:::::: :::.
CCDS47 PKSAETNIDQDINNLKEKWESVETKLNERKTKLEEALNLAMEFHNSLQDFINWLTQAEQT
4150 4160 4170 4180 4190 4200
4380 4390 4400 4410 4420 4430
pF1KE0 LNIASPPSLILNTVLSQIEEHKVFANEVNAHRDQIIELDQTGNQLKFLSQKQDVVLIKNL
::.:: :::::.::: ::.::::::::::.::.::::::.::..::..::::::::::::
CCDS47 LNVASRPSLILDTVLFQIDEHKVFANEVNSHREQIIELDKTGTHLKYFSQKQDVVLIKNL
4210 4220 4230 4240 4250 4260
4440 4450 4460 4470 4480 4490
pF1KE0 LVSVQSRWEKVVQRSIERGRSLDDARKRAKQFHEAWKKLIDWLEDAESHLDSELEISNDP
:.:::::::::::: .::::::::::::::::::::.::..:::..:. :::::::.:::
CCDS47 LISVQSRWEKVVQRLVERGRSLDDARKRAKQFHEAWSKLMEWLEESEKSLDSELEIANDP
4270 4280 4290 4300 4310 4320
4500 4510 4520 4530 4540 4550
pF1KE0 DKIKLQLSKHKEFQKTLGGKQPVYDTTIRTGRALKEKTLLPEDSQKLDNFLGEVRDKWDT
:::: ::..::::::.::.:. ::::: ::::.::::: : .:. :::..:.:.::::::
CCDS47 DKIKTQLAQHKEFQKSLGAKHSVYDTTNRTGRSLKEKTSLADDNLKLDDMLSELRDKWDT
4330 4340 4350 4360 4370 4380
4560 4570 4580 4590 4600 4610
pF1KE0 VCGKSVERQHKLEEALLFSGQFMDALQALVDWLYKVEPQLAEDQPVHGDLDLVMNLMDAH
.::::::::.:::::::::::: ::::::.::::.::::::::::::::.::::::.: :
CCDS47 ICGKSVERQNKLEEALLFSGQFTDALQALIDWLYRVEPQLAEDQPVHGDIDLVMNLIDNH
4390 4400 4410 4420 4430 4440
4620 4630 4640 4650 4660 4670
pF1KE0 KVFQKELGKRTGTVQVLKRSGRELIENSRDDTTWVKGQLQELSTRWDTVCKLSVSKQSRL
:.:::::::::..::.::::.:::::.::::..::: :.:::::::.::: ::.:::.::
CCDS47 KAFQKELGKRTSSVQALKRSARELIEGSRDDSSWVKVQMQELSTRWETVCALSISKQTRL
4450 4460 4470 4480 4490 4500
4680 4690 4700 4710 4720 4730
pF1KE0 EQALKQAEVFRDTVHMLLEWLSEAEQTLRFRGALPDDTEALQSLIDTHKEFMKKVEEKRV
: ::.::: :...:: :::::.::::::::.:.:::: .::..::: :::::::.::::.
CCDS47 EAALRQAEEFHSVVHALLEWLAEAEQTLRFHGVLPDDEDALRTLIDQHKEFMKKLEEKRA
4510 4520 4530 4540 4550 4560
4740 4750 4760 4770 4780 4790
pF1KE0 DVNSAVAMGEVILAVCHPDCITTIKHWITIIRARFEEVLTWAKQHQQRLETALSELVANA
..:.:..::...::.:::: :::::::::::::::::::.::::::::: .::. :.:.
CCDS47 ELNKATTMGDTVLAICHPDSITTIKHWITIIRARFEEVLAWAKQHQQRLASALAGLIAKQ
4570 4580 4590 4600 4610 4620
4800 4810 4820 4830 4840 4850
pF1KE0 ELLEELLAWIQWAETTLIQRDQEPIPQNIDRVKALIAEHQTFMEEMTRKQPDVDRVTKTY
:::: ::::.::::::: ..:.: :::.:..:::::::::::::::::::::::.:::::
CCDS47 ELLEALLAWLQWAETTLTDKDKEVIPQEIEEVKALIAEHQTFMEEMTRKQPDVDKVTKTY
4630 4640 4650 4660 4670 4680
4860 4870 4880 4890 4900 4910
pF1KE0 KRKNIEPT----HAPFIEKSRSGGRKSLSQPTPPPMPILSQSEAKNPRINQLSARWQQVW
::. .:. : : ..:.:.: :: . . : .: :.::::.: : ..:::::
CCDS47 KRRAADPSSLQSHIPVLDKGRAG-RKRFPASSLYPSGSQTQIETKNPRVNLLVSKWQQVW
4690 4700 4710 4720 4730 4740
4920 4930 4940 4950 4960 4970
pF1KE0 LLALERQRKLNDALDRLEELKEFANFDFDVWRKKYMRWMNHKKSRVMDFFRRIDKDQDGK
::::::.:::::::::::::.::::::::.::::::::::::::::::::::::::::::
CCDS47 LLALERRRKLNDALDRLEELREFANFDFDIWRKKYMRWMNHKKSRVMDFFRRIDKDQDGK
4750 4760 4770 4780 4790 4800
4980 4990 5000 5010 5020 5030
pF1KE0 ITRQEFIDGILASKFPTTKLEMTAVADIFDRDGDGYIDYYEFVAALHPNKDAYRPTTDAD
:::::::::::.:::::..:::.::::::::::::::::::::::::::::::.: ::::
CCDS47 ITRQEFIDGILSSKFPTSRLEMSAVADIFDRDGDGYIDYYEFVAALHPNKDAYKPITDAD
4810 4820 4830 4840 4850 4860
5040 5050 5060 5070 5080
pF1KE0 KIEDEVTRQVAQCKCAKRFQVEQIGENKYRF------GDSQQLRLVRILRSTVMVRVGGG
:::::::::::.:::::::::::::.::::: :::::::::::::::::::::::
CCDS47 KIEDEVTRQVAKCKCAKRFQVEQIGDNKYRFFLGNQFGDSQQLRLVRILRSTVMVRVGGG
4870 4880 4890 4900 4910 4920
5090 5100 5110 5120 5130 5140
pF1KE0 WMALDEFLVKNDPCRARGRTNIELREKFILPEGASQGMTPFRSRGRRSKPSSRAASPTRS
::::::::::::::::.::::.:::::::: .::::::. :: :::::.::::.:::.::
CCDS47 WMALDEFLVKNDPCRAKGRTNMELREKFILADGASQGMAAFRPRGRRSRPSSRGASPNRS
4930 4940 4950 4960 4970 4980
5150 5160 5170
pF1KE0 SSSASQSNHSCTSMPSSPAT-----------------------------------PASGT
.: .::. .. . :. ::: :. ..
CCDS47 TSVSSQAAQAAS--PQVPATTTPKILHPLTRNYGKPWLTNSKMSTPCKAAECSDFPVPSA
4990 5000 5010 5020 5030 5040
5180 5190 5200 5210 5220 5230
pF1KE0 KVIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGAKTNRADPKKSASRPGSRAGSR
. : .::::. : . :.. .:. :. . :.. ..:. :: ::. :::::::::.
CCDS47 EGTPIQGSKLR--LPGYLSGKGFHSGEDSGLITTAAARVRTQFADSKKTPSRPGSRAGSK
5050 5060 5070 5080 5090 5100
5240 5250 5260 5270 5280
pF1KE0 AGSRASSRRGSDASDFDLLETQSACSDTS---ESSAAGGQGNSRRGLNKPSKIPTMSKKT
:::::::::::::::::. : ::.:::. .. ...:: . ::::::: ..:.
CCDS47 AGSRASSRRGSDASDFDISEIQSVCSDVETVPQTHRPTPRAGSRPSTAKPSKIPTPQRKS
5110 5120 5130 5140 5150 5160
5290 5300
pF1KE0 TTASPRTPGPKR
CCDS47 PASKLDKSSKR
5170
>>CCDS75474.1 DST gene_id:667|Hs108|chr6 (5537 aa)
initn: 12197 init1: 2772 opt: 8379 Z-score: 4551.8 bits: 858.6 E(32554): 0
Smith-Waterman score: 18457; 53.1% identity (79.5% similar) in 5388 aa overlap (167-5288:164-5526)
140 150 160 170 180 190
pF1KE0 QNVQIALDFLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIYISGESGDMSA
:::::::::::::::::::...::: ::::
CCDS75 QNVQIALDYLKRRQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIHVTGESEDMSA
140 150 160 170 180 190
200 210 220 230 240 250
pF1KE0 KEKLLLWTQKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLE
::.::::::..: ::.::.: ::..:: :::.:::.::.:::::.::. : .::: :::
CCDS75 KERLLLWTQQATEGYAGIRCENFTTCWRDGKLFNAIIHKYRPDLIDMNTVAVQSNLANLE
200 210 220 230 240 250
260 270 280 290 300 310
pF1KE0 QAFEVAERLGVTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRW
.:: :::..:: :::: ::::: :::::::::::::.::::::::::::::.:..:. .:
CCDS75 HAFYVAEKIGVIRLLDPEDVDVSSPDEKSVITYVSSLYDAFPKVPEGGEGIGANDVEVKW
260 270 280 290 300 310
320 330 340 350 360 370
pF1KE0 QEYQSRVDSLIPWIKQHTILMSDKTFPQNPVELKALYNQYIHFKETEILAKEREKGRIEE
:::. :. :: ::..:. ::..:::.::::::::::::..:::::: :: ::..:..
CCDS75 IEYQNMVNYLIQWIRHHVTTMSERTFPNNPVELKALYNQYLQFKETEIPPKETEKSKIKR
320 330 340 350 360 370
380 390 400 410 420 430
pF1KE0 LYKLLEVWIEFGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKI
::::::.::::::::: :::::::.:.::::::: ::::::.::: :::::.: ::::..
CCDS75 LYKLLEIWIEFGRIKLLQGYHPNDIEKEWGKLIIAMLEREKALRPEVERLEMLQQIANRV
380 390 400 410 420 430
440 450 460 470 480 490
pF1KE0 QNGALNCEEKLTLAKNTLQADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRD
: .. ::.:: :: :.::.:. .:::: : :... :: :::.:.:: .:.::: :
CCDS75 QRDSVICEDKLILAGNALQSDSKRLESGVQFQNEAEIAGYILECENLLRQHVIDVQILID
440 450 460 470 480 490
500 510 520 530
pF1KE0 ENYYQLEELAFRVMRLQDELVTLRLECTNLYRKGHFTSLE-------------------L
.::: ..:. :: .:.::...:: ::...: ::.. . :
CCDS75 GKYYQADQLVQRVAKLRDEIMALRNECSSVYSKGRILTTEQTKLMISGITQSLNSGFAQT
500 510 520 530 540 550
540 550 560
pF1KE0 VPPSTLT------TTHLKAEPLTKATHSSSTS----------------------------
. :: . : : . .:.. :. ::
CCDS75 LHPSLTSGLTQSLTPSLTSSSMTSGLSSGMTSRLTPSVTPAYTPGFPSGLVPNFSSGVEP
560 570 580 590 600 610
570 580 590 600 610
pF1KE0 ---------WFRKPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPS
.:::. .. :. . .:.: :..:: .::.::.:::..:.:.:::.::::
CCDS75 NSLQTLKLMQIRKPLLKSSLLDQNLTEEEINMKFVQDLLNWVDEMQVQLDRTEWGSDLPS
620 630 640 650 660 670
620 630 640 650 660 670
pF1KE0 VELQLETQQHIHTSVEELGSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSF
:: .::.....: ..::. ::.:::.. : .:. .. .::: : .::.:: :: .::
CCDS75 VESHLENHKNVHRAIEEFESSLKEAKISEIQMTAPLKLTYAEKLHRLESQYAKLLNTSRN
680 690 700 710 720 730
680 690 700 710 720 730
pF1KE0 RMRHLQSLHKFVSRATAELIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQD
. :::..::.:::::: ::::::::::::.:::::. :.::. :..: .:: ::..:..
CCDS75 QERHLDTLHNFVSRATNELIWLNEKEEEEVAYDWSERNTNIARKKDYHAELMRELDQKEE
740 750 760 770 780 790
740 750 760 770 780 790
pF1KE0 VFRSLQDTAELLSLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSD
..:.:. :: : ::::::. :.::: ::.:.: .:. ::: :::::.:::::::.::.:
CCDS75 NIKSVQEIAEQLLLENHPARLTIEAYRAAMQTQWSWILQLCQCVEQHIKENTAYFEFFND
800 810 820 830 840 850
800 810 820 830 840 850
pF1KE0 ARELESFLRNLQDSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKT
:.: ..::::.:.:.::::::...:. .::::.:.::.:::.:.: ::..:.:.:..::
CCDS75 AKEATDYLRNLKDAIQRKYSCDRSSSIHKLEDLVQESMEEKEELLQYKSTIANLMGKAKT
860 870 880 890 900 910
860 870 880 890 900 910
pF1KE0 IVQLKPRSPDHVLKNTISVKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAM
:.:::::. : ::..: .::.:::::::::: :.::::: .::.:.:::::::::::::
CCDS75 IIQLKPRNSDCPLKTSIPIKAICDYRQIEITIYKDDECVLANNSHRAKWKVISPTGNEAM
920 930 940 950 960 970
920 930 940 950 960 970
pF1KE0 VPSVCFLIPPPNKDAIEMASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWN
:::::: .:::::.:...:.:.::.::.:..:::. :.: ::..::.:: ...: ... :
CCDS75 VPSVCFTVPPPNKEAVDLANRIEQQYQNVLTLWHESHINMKSVVSWHYLINEIDRIRASN
980 990 1000 1010 1020 1030
980 990 1000 1010 1020 1030
pF1KE0 LEKLRSSAPGECHQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMK
. .... ::: .:...:::...::::.::..: .:: .: .::.::..:: .:.:.:
CCDS75 VASIKTMLPGEHQQVLSNLQSRFEDFLEDSQESQVFSGSDITQLEKEVNVCKQYYQELLK
1040 1050 1060 1070 1080 1090
1040 1050 1060 1070 1080 1090
pF1KE0 SMENEDKEETVAKMYISELKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQ
: : :..::.: ..::::..:::::::. :.:....:. . .:: .....::.::
CCDS75 SAEREEQEESVYNLYISEVRNIRLRLENCEDRLIRQIR----TPLERDDLHESVFRITEQ
1100 1110 1120 1130 1140
1100 1110 1120 1130 1140 1150
pF1KE0 EHTQEDLQQLRSDLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLN
:. ...:..:..:: ... ::. :. :. .::::::::::::.....:..::..:..:..
CCDS75 EKLKKELERLKDDLGTITNKCEEFFSQAAASSSVPTLRSELNVVLQNMNQVYSMSSTYID
1150 1160 1170 1180 1190 1200
1160 1170 1180 1190 1200 1210
pF1KE0 KLKTVDVIVRSIQDAELLVKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVF
:::::...... : :: ::: :: :: .::.:.:: . .: :::..: :.: .: .::
CCDS75 KLKTVNLVLKNTQAAEALVKLYETKLCEEEAVIADKNNIENLISTLKQWRSEVDEKRQVF
1210 1220 1230 1240 1250 1260
1220 1230 1240 1250 1260 1270
pF1KE0 SVLDEEIAKAKVVAEQMSRLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQ
.:..:. :::.....: . ::.::.. ..::..:: :::. : .:.. : .::.:
CCDS75 HALEDELQKAKAISDEMFKTYKERDLDFDWHKEKADQLVERWQNVHVQIDNRLRDLEGIG
1270 1280 1290 1300 1310 1320
1280 1290 1300 1310 1320 1330
pF1KE0 EVLGDYRACHGTLIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLD
. : :: . : ::... . :. .. .: :.:..:. ::.:: : .::: .:.:.:
CCDS75 KSLKYYRDTYHPLDDWIQQVETTQRKIQENQPENSKTLATQLNQQKMLVSEIEMKQSKMD
1330 1340 1350 1360 1370 1380
1340 1350 1360 1370 1380 1390
pF1KE0 QCQKFSQQYSTIVKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTA
.:::...:::. ::::::: :::.:.:.:::::: ::::: ::.: : ::::::::::::
CCDS75 ECQKYAEQYSATVKDYELQTMTYRAMVDSQQKSPVKRRRMQSSADLIIQEFMDLRTRYTA
1390 1400 1410 1420 1430 1440
1400 1410 1420 1430 1440 1450
pF1KE0 LVTLTTQHVKYISDALRRLEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSET
:::: ::..:. .:.:.::::::: .::::.:::::.::: :::..... . ...
CCDS75 LVTLMTQYIKFAGDSLKRLEEEEKSLEEEKKEHVEKAKELQKWVSNISKTLKDAEKAGKP
1450 1460 1470 1480 1490 1500
1460 1470 1480 1490 1500 1510
pF1KE0 KESTDIEKAILEQQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNAL
: .:.. :::..:::::.:::..: :.:::::: :....:.... .:...:
CCDS75 PFS--------KQKISSEEISTKKEQLSEALQTIQLFLAKHGDKMTDEERNELEKQVKTL
1510 1520 1530 1540 1550 1560
1520 1530 1540 1550 1560 1570
pF1KE0 NKAYHDLCDGSANQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQ
...:. : . : .:::. :.. ..:.: . ..:. ...:. .:. . :.: : :::
CCDS75 QESYNLLFSESLKQLQESQTSGDVKVEEKIVAERQQEYKEKLQGICDLLTQTENRLIGHQ
1570 1580 1590 1600 1610 1620
1580 1590 1600 1610 1620 1630
pF1KE0 GRTTQQDLSA-LQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALR
: .. :.: :: ..:: :.:. : ..: :::. :.:..:: ::: .. . ..
CCDS75 EAFMIGDGTVELKKYQSKQEELQKDMQGSAQALAEVVKNTENFLKENGEKLSQEDKALIE
1630 1640 1650 1660 1670 1680
1640 1650 1660 1670 1680 1690
pF1KE0 EKLHQAKEQYEALQEETRVAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVT
.::..:: . : :. ... ..:::...::.:...:::: :.:.: :.: ::. ::::..
CCDS75 QKLNEAKIKCEQLNLKAEQSKKELDKVVTTAIKEETEKVAAVKQLEESKTKIENLLDWLS
1690 1700 1710 1720 1730 1740
1700 1710 1720 1730
pF1KE0 SVGSSGGQLLTNLPGMEQLSGASLEKGA---------------LDT-TDGYMGVNQAPEK
.: ... . :. . . .:. ...: :.: .:: .:..: :.
CCDS75 NVDKDSERAGTKHKQVIEQNGTHFQEGDGKSAIGEEDEVNGNLLETDVDGQVGTTQ--EN
1750 1760 1770 1780 1790
1740 1750 1760 1770 1780 1790
pF1KE0 LDKQCEMMKARHQELLSQQQNFILATQSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYS
:..: . .::.:....::.: :.::::::..:...:. :.:::.. ::... ::: .:
CCDS75 LNQQYQKVKAQHEKIISQHQAVIIATQSAQVLLEKQGQYLSPEEKEKLQKNMKELKVHYE
1800 1810 1820 1830 1840 1850
1800 1810 1820 1830 1840 1850
pF1KE0 TSLAQSEAELKQVQTLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKR
:.::.:: ..: ...::.::.:: :. ::: ::..::.::::.. :... . : . :::
CCDS75 TALAESEKKMKLTHSLQEELEKFDADYTEFEHWLQQSEQELENLEAGADDINGLMTKLKR
1860 1870 1880 1890 1900 1910
1860 1870 1880 1890 1900 1910
pF1KE0 QGSFSEDVISHKGDLRFVTISGQKVLDMENSFKE---GK-EPSEIGNLVKDKLKDATERY
: ::::::::::::::..::::..::. .: .. :: . : :. :: ::.:.
CCDS75 QKSFSEDVISHKGDLRYITISGNRVLEAAKSCSKRDGGKVDTSATHREVQRKLDHATDRF
1920 1930 1940 1950 1960 1970
1920 1930 1940 1950 1960 1970
pF1KE0 TALHSKCTRLGSHLNMLLGQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQ
.:.:::. ::..:. :. .:....... .: : .:::::.. : ::. .: :: ::.:
CCDS75 RSLYSKCNVLGNNLKDLVDKYQHYEDASCGLLAGLQACEATASKHLSEPIAVDPKNLQRQ
1980 1990 2000 2010 2020 2030
1980 1990 2000 2010 2020 2030
pF1KE0 LATTKQLQEELAEHQVPVEKLQKVARDIMEIEGEPAPDHRHVQETTDSILSHFQSLSYSL
: :: :: ... .:: ::::.:.:. ... .: : . .:.: :.:......:: :.
CCDS75 LEETKALQGQISSQQVAVEKLKKTAEVLLDARGSLLPAKNDIQKTLDDIVGRYEDLSKSV
2040 2050 2060 2070 2080 2090
2040 2050 2060 2070 2080 2090
pF1KE0 AERSSLLQKAIAQSQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQ
::. :: ....: :::..:. .:. .:.::..:. . :.: ..:. .. :. :.:
CCDS75 NERNEKLQITLTRSLSVQDGLDEMLDWMGNVESSLKEQGQVPLNSTALQDIISKNIMLEQ
2100 2110 2120 2130 2140 2150
2100 2110 2120 2130 2140 2150
pF1KE0 DIARQKSSLEATREMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLL
::: ..::..: : : .::::.: .::. ::.:. ..: :: . ...: .....:
CCDS75 DIAGRQSSINAMNEKVKKFMETTDPSTASSLQAKMKDLSARFSEASHKHKETLAKMEELK
2160 2170 2180 2190 2200 2210
2160 2170 2180 2190 2200 2210
pF1KE0 PQAEMFEHLSGKLQQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEH
..:.::.:: ::: :.:.:.. :. . : .:.:.. : .:: . :. .....:..:.
CCDS75 TKVELFENLSEKLQTFLETKTQALTEVDVPGKDVTELSQYMQESTSEFLEHKKHLEVLHS
2220 2230 2240 2250 2260 2270
2220 2230 2240 2250 2260 2270
pF1KE0 LVTELSSCGFALDLCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQ
:. :.:: :. : ....:: : : :.. :.::... ..::::::: :. ::....
CCDS75 LLKEISSHGLPSDKALVLEKTNNLSKKFKEMEDTIKEKKEAVTSCQEQLDAFQVLVKSLK
2280 2290 2300 2310 2320 2330
2280 2290 2300 2310 2320 2330
pF1KE0 KWLKETEGSIPPTETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEI
.:.::: ..: .. :..:..: :..: :.: . :. : ....: .: :: ::: .
CCDS75 SWIKETTKKVPIVQPSFGAEDLGKSLEDTKKLQEKWSLKTPEIQKVNNSGISLCNLISAV
2340 2350 2360 2370 2380 2390
2340 2350 2360
pF1KE0 TAP--------------DSQGKTD----------LTEIQCDMSDVNLKYEKLGGVLHERQ
:.: ...: . :: :. ::.:.. :: :: .:...
CCDS75 TTPAKAIAAVKSGGAVLNGEGTATNTEEFWANKGLTSIKKDMTDISHGYEDLGLLLKDKI
2400 2410 2420 2430 2440 2450
2370 2380 2390 2400 2410 2420
pF1KE0 ESLQAILNRMEEVHKEANSVLQWLESKEEVLKSMDAMSSPTKTETVKAQAESNKAFLAEL
:.. :........:.....:::.. ... . . .:: ::.::.:.:.::.: :::
CCDS75 AELNTKLSKLQKAQEESSAMMQWLQKMNKTATKWQQTPAPTDTEAVKTQVEQNKSFEAEL
2460 2470 2480 2490 2500 2510
2430 2440 2450 2460 2470 2480
pF1KE0 EQNSPKIQKVKEALAGLLVTYPNSQEAENWKKIQEELNSRWERATEVTVARQRQLEESAS
.:: :.:..:. :. :: :.. :: ::.. :..:.:.. ...:. ::..::::..
CCDS75 KQNVNKVQELKDKLTELLEENPDTPEAPRWKQMLTEIDSKWQELNQLTIDRQQKLEESSN
2520 2530 2540 2550 2560 2570
2490 2500 2510 2520 2530 2540
pF1KE0 HLACFQAAESQLRPWLMEKELMMGVLGPLSIDPNMLNAQKQQVQFMLKEFEARRQQHEQL
.:. ::..:.::. ::.:::::..:::::::::::::.:.::::..:.:: .:. :.:::
CCDS75 NLTQFQTVEAQLKQWLVEKELMVSVLGPLSIDPNMLNTQRQQVQILLQEFATRKPQYEQL
2580 2590 2600 2610 2620 2630
2550 2560 2570 2580 2590 2600
pF1KE0 NEAAQGILTGPG-DVSLSTSQVQKELQSINQKWVELTDKLNSRSSQIDQAIVKSTQYQEL
. :.::::. :: : :: . :...: ...::: :: .:..: . :::::::::::: :
CCDS75 TAAGQGILSRPGEDPSLR-GIVKEQLAAVTQKWDSLTGQLSDRCDWIDQAIVKSTQYQSL
2640 2650 2660 2670 2680 2690
2610 2620 2630 2640 2650 2660
pF1KE0 LQDLSEKVRAVGQRLSVQSAISTQPEAVKQQLEETSEIRSDLEQLDHEVKEAQTLCDELS
:..::.:. . ..:: . :.::.:.:..:::: .........: ...: ::.::..::
CCDS75 LRSLSDKLSDLDNKLSSSLAVSTHPDAMNQQLETAQKMKQEIQQEKKQIKVAQALCEDLS
2700 2710 2720 2730 2740 2750
2670 2680 2690 2700 2710 2720
pF1KE0 VLIGEQYLKDELKKRLETVALPLQGLEDLAADRINRLQAALASTQQFQQMFDELRTWLDD
.:. :.::: ::...:: . .. .:. : .....::.: ::..::::: ....:::
CCDS75 ALVKEEYLKAELSRQLEGILKSFKDVEQKAENHVQHLQSACASSHQFQQMSRDFQAWLDT
2760 2770 2780 2790 2800 2810
2730 2740 2750 2760 2770 2780
pF1KE0 KQSQQAKNCPISAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKR
:. .: :. ::::::. :.: ......:.:.:. .: :: .::::.:::.. : ::
CCDS75 KKEEQNKSHPISAKLDVLESLIKDHKDFSKTLTAQSHMYEKTIAEGENLLLKTQ-GSEKA
2820 2830 2840 2850 2860 2870
2790 2800 2810 2820 2830 2840
pF1KE0 TLQNQLVELKNHWEELSKKTADRQSRLKDCMQKAQKYQWHVEDLVPWIEDCKAKMSELRV
.:: :: .:..:. ..:.. .:...::. ..:: ::. .:: : :::. :. .. :..
CCDS75 ALQLQLNTIKTNWDTFNKQVKERENKLKESLEKALKYKEQVETLWPWIDKCQNNLEEIKF
2880 2890 2900 2910 2920 2930
2850 2860 2870 2880 2890 2900
pF1KE0 TLDPVQLESSLLRSKAMLNEVEKRRSLLEILNSAADILINSSEADEDGIRDEKAGINQNM
:::.. :.:. . :.. .:.... ...:.::..:. :.. : :.. . ::. .. :..
CCDS75 CLDPAEGENSIAKLKSLQKEMDQHFGMVELLNNTANSLLSVCEIDKEVVTDENKSLIQKV
2940 2950 2960 2970 2980 2990
2910 2920 2930 2940 2950 2960
pF1KE0 DAVTEELQAKTGSLEEMTQRLREFQESFKNIEKKVEGAKHQLEIFDALGSQACSNKNLEK
: :::.:..: ::.:::...:::: :. ..... ::.::.: :.::::: ::: :
CCDS75 DMVTEQLHSKKFCLENMTQKFKEFQEVSKESKRQLQCAKEQLDIHDSLGSQAYSNKYLTM
3000 3010 3020 3030 3040 3050
2970 2980 2990 3000 3010 3020
pF1KE0 LRAQQEVLQALEPQVDYLRNFTQGLVEDAPDGSDASQLLHQAEVAQQEFLEVKQRVNSGC
:..::. ::::. ::: . ..: :: .: :.. .:..: :.:. :: ..:.:. :
CCDS75 LQTQQKSLQALKHQVDLAKRLAQDLVVEASDSKGTSDVLLQVETIAQEHSTLSQQVDEKC
3060 3070 3080 3090 3100 3110
3030 3040 3050 3060 3070 3080
pF1KE0 VMMENKLEGIGQFHCRVREMFSQLADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKIHV
..:.::.:::.:. .::::::.:..:::::.:. .:::...::.: : .. ::.:...
CCDS75 SFLETKLQGIGHFQNTIREMFSQFAEFDDELDSMAPVGRDAETLQKQKETIKAFLKKLEA
3120 3130 3140 3150 3160 3170
3090 3100 3110 3120 3130 3140
pF1KE0 LKLDIEASEAECRHMLE-EEGTLDLLGLKRELEALNKQCGKLTERGKARQEQLELTLGRV
: . . .. :. :: :: . ::.:.::.::::.:::.:: .:..::.::.: :. :.
CCDS75 LMASNDNANKTCKMMLATEETSPDLVGIKRDLEALSKQCNKLLDRAQAREEQVEGTIKRL
3180 3190 3200 3210 3220 3230
3150 3160 3170 3180 3190 3200
pF1KE0 EDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMKLQQVN
:.:: ::: .. ::: : : :: :.: ::::: ::.::::...::: : :.::
CCDS75 EEFYSKLKEFSILLQKAEEHEESQGPVGMETETINQQLNMFKVFQKEEIEPLQGKQQDVN
3240 3250 3260 3270 3280 3290
3210 3220 3230 3240 3250 3260
pF1KE0 GLGQGLIQSAGKDCDVQGLEHDMEEINARWNTLNKKVAQRIAQLQEALLHCGKFQDALEP
:::::::::.:. ..::::::....::::.::::::::: :::::::::::.::::::
CCDS75 WLGQGLIQSAAKSTSTQGLEHDLDDVNARWKTLNKKVAQRAAQLQEALLHCGRFQDALES
3300 3310 3320 3330 3340 3350
3270 3280 3290 3300 3310 3320
pF1KE0 LLSWLADTEELIANQKPPSAEYKVVKAQIQEQKLLQRLLDDRKATVDMLQAEGGRIAQSA
::::..:::::.:::::::::.:::::::::::::::::::::.::.... :: .:: .:
CCDS75 LLSWMVDTEELVANQKPPSAEFKVVKAQIQEQKLLQRLLDDRKSTVEVIKREGEKIATTA
3360 3370 3380 3390 3400 3410
3330 3340 3350 3360 3370 3380
pF1KE0 ELADREKITGQLESLESRWTELLSKAAARQKQLEDILVLAKQFHETAEPISDFLSVTEKK
: ::. :: :: :.::: ::.:: .:..::: : :.:.::::: ::....:.. ::.
CCDS75 EPADKVKILKQLSLLDSRWEALLNKAETRNRQLEGISVVAQQFHETLEPLNEWLTTIEKR
3420 3430 3440 3450 3460 3470
3390 3400 3410
pF1KE0 LANSEPVGTQTAKIQQQIIRHKALNEEIVN------------------------------
:.: ::.:::..:...:: .::::...:.:
CCDS75 LVNCEPIGTQASKLEEQIAQHKALEDDIINHNKHLHQAVSIGQSLKVLSSREDKDMVQSK
3480 3490 3500 3510 3520 3530
pF1KE0 ------------------------------------------------------------
CCDS75 LDFSQVWYIEIQEKSHSRSELLQQALCNAKIFGEDEVELMNWLNEVHDKLSKLSVQDYST
3540 3550 3560 3570 3580 3590
3420 3430 3440 3450
pF1KE0 -------------------RKKNVDQAIKNGQALLKQTTGEEVLLIQEKLDGIKTRYADI
::.:::::. :: :::::::.:::.::.::..::.:: ::
CCDS75 EGLWKQQSELRVLQEDILLRKQNVDQALLNGLELLKQTTGDEVLIIQDKLEAIKARYKDI
3600 3610 3620 3630 3640 3650
3460 3470 3480 3490 3500 3510
pF1KE0 TVTSSKALRTLEQARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQK
: :. . .::::: ::: ...::.::: :: .:: :: . : ::. : :.: :
CCDS75 TKLSTDVAKTLEQALQLARRLHSTHEELCTWLDKVEVELLSYETQVLKGEEASQAQMRPK
3660 3670 3680 3690 3700 3710
3520 3530 3540 3550 3560 3570
pF1KE0 ELKKEVMEHRLVLDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEI
:::::. ... .::..:::: ::::::::::::::.:.:.. ::.:.:::::: :.:.::
CCDS75 ELKKEAKNNKALLDSLNEVSSALLELVPWRAREGLEKMVAEDNERYRLVSDTITQKVEEI
3720 3730 3740 3750 3760 3770
3580 3590 3600 3610 3620 3630
pF1KE0 DAAIQRSQQYEQAADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSIDIIRHKD
:::: ::::..:::::::.:..::..:::.:: ::::::::.:::::::.:...:.::::
CCDS75 DAAILRSQQFDQAADAELSWITETEKKLMSLGDIRLEQDQTSAQLQVQKTFTMEILRHKD
3780 3790 3800 3810 3820 3830
3640 3650 3660 3670 3680 3690
pF1KE0 SMDELFSHRSEIFGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFW
.:.: . .:. .:.::.: ...: ......:..: .::::: .::::: ::::::
CCDS75 IIDDLVKSGHKIMTACSEEEKQSMKKKLDKVLKNYDTICQINSERYLQLERAQSLVNQFW
3840 3850 3860 3870 3880 3890
3700 3710 3720 3730 3740 3750
pF1KE0 ETYEELSPWIEETRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQ
:::::: ::. ::...:.:::.::...: ::::::: ::::: ::::::::::. : :::
CCDS75 ETYEELWPWLTETQSIISQLPAPALEYETLRQQQEEHRQLRELIAEHKPHIDKMNKTGPQ
3900 3910 3920 3930 3940 3950
3760 3770 3780 3790 3800 3810
pF1KE0 LKELNPEEGEMVEEKYQKAENMYAQIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLET
: ::.: :: ..::: :...:.::::.:..::.:::::.::::: :::::. .::.
CCDS75 LLELSPGEGFSIQEKYVAADTLYSQIKEDVKKRAVALDEAISQSTQ---FHDKIDQILES
3960 3970 3980 3990 4000 4010
3820 3830 3840 3850 3860 3870
pF1KE0 LENLSSRLRMPPLIPAEVDKIRECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGAD
:: . :::.:: : :::.::.: ::.::...:..::::: .:.::.::::.:.:: :.:
CCDS75 LERIVERLRQPPSISAEVEKIKEQISENKNVSVDMEKLQPLYETLKQRGEEMIARSGGTD
4020 4030 4040 4050 4060 4070
3880 3890 3900 3910 3920 3930
pF1KE0 KDLAAKEIQDKLDQMVFFWEDIKARAEEREIKFLDVLELAEKFWYDMAALLTTIKDTQDI
::..:: .:::::::::.::.:.. .:::: :.:::.::::::: : .:..:::::::.
CCDS75 KDISAKAVQDKLDQMVFIWENIHTLVEEREAKLLDVMELAEKFWCDHMSLIVTIKDTQDF
4080 4090 4100 4110 4120 4130
3940 3950 3960 3970 3980 3990
pF1KE0 VHDLESPGIDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKS
..:::.::::::..::: ::::::.:: :::.:::... ::..:: :::: .:: :.::
CCDS75 IRDLEDPGIDPSVVKQQQEAAETIREEIDGLQEELDIVINLGSELIAACGEPDKPIVKKS
4140 4150 4160 4170 4180 4190
4000 4010 4020 4030 4040 4050
pF1KE0 IDEMNNAWENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDL
:::.:.::..:::.::.:..:::.:::::::::: :::.:::.: . :: .: :.::::
CCDS75 IDELNSAWDSLNKAWKDRIDKLEEAMQAAVQYQDGLQAVFDWVDIAGGKLASMSPIGTDL
4200 4210 4220 4230 4240 4250
4060 4070 4080 4090 4100 4110
pF1KE0 NTVKDQLNEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWEN
.:::.:..:.:.:: :.::::::::.::::.::.:::.:.:.:. ...:: ::: .:..
CCDS75 ETVKQQIEELKQFKSEAYQQQIEMERLNHQAELLLKKVTEESDKHTVQDPLMELKLIWDS
4260 4270 4280 4290 4300 4310
4120 4130 4140 4150 4160 4170
pF1KE0 LGEKIAHRQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKH
: :.: .:::::::::::::::::::.::..:::::: ::. :.:..::::.::.:::::
CCDS75 LEERIINRQHKLEGALLALGQFQHALDELLAWLTHTEGLLSEQKPVGGDPKAIEIELAKH
4320 4330 4340 4350 4360 4370
4180 4190 4200 4210 4220 4230
pF1KE0 HVLKNDVLAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQ
:::.:::::::.:::.::::::.:.:::::..::.:...::..:: :..::.:::.:.::
CCDS75 HVLQNDVLAHQSTVEAVNKAGNDLIESSAGEEASNLQNKLEVLNQRWQNVLEKTEQRKQQ
4380 4390 4400 4410 4420 4430
4240 4250 4260 4270 4280 4290
pF1KE0 LQSTLQQAQGFHSEIEDFLLELTRMESQLSASKPTGGLPETAREQLDTHMELYSQLKAKE
:...:.::.:::.::::. :: : .: :::: :::::::.:::..:::. . ..:::
CCDS75 LDGALRQAKGFHGEIEDLQQWLTDTERHLLASKPLGGLPETAKEQLNVHMEVCAAFEAKE
4440 4450 4460 4470 4480 4490
4300 4310 4320 4330 4340 4350
pF1KE0 ETYNQLLDKGRLMLLSRDDSGSGSKTEQSVALLEQKWHVVSSKMEERKSKLEEALNLATE
:::..:..::. :: .: ... .. .:.. :..::. : .:..:::.::::::::: :
CCDS75 ETYKSLMQKGQQML-ARCPKSAETNIDQDINNLKEKWESVETKLNERKTKLEEALNLAME
4500 4510 4520 4530 4540 4550
4360 4370 4380 4390 4400 4410
pF1KE0 FQNSLQEFINWLTLAEQSLNIASPPSLILNTVLSQIEEHKVFANEVNAHRDQIIELDQTG
:.::::.:::::: :::.::.:: :::::.::: ::.::::::::::.::.::::::.::
CCDS75 FHNSLQDFINWLTQAEQTLNVASRPSLILDTVLFQIDEHKVFANEVNSHREQIIELDKTG
4560 4570 4580 4590 4600 4610
4420 4430 4440 4450 4460 4470
pF1KE0 NQLKFLSQKQDVVLIKNLLVSVQSRWEKVVQRSIERGRSLDDARKRAKQFHEAWKKLIDW
..::..:::::::::::::.:::::::::::: .::::::::::::::::::::.::..:
CCDS75 THLKYFSQKQDVVLIKNLLISVQSRWEKVVQRLVERGRSLDDARKRAKQFHEAWSKLMEW
4620 4630 4640 4650 4660 4670
4480 4490 4500 4510 4520 4530
pF1KE0 LEDAESHLDSELEISNDPDKIKLQLSKHKEFQKTLGGKQPVYDTTIRTGRALKEKTLLPE
::..:. :::::::.::::::: ::..::::::.::.:. ::::: ::::.::::: : .
CCDS75 LEESEKSLDSELEIANDPDKIKTQLAQHKEFQKSLGAKHSVYDTTNRTGRSLKEKTSLAD
4680 4690 4700 4710 4720 4730
4540 4550 4560 4570 4580 4590
pF1KE0 DSQKLDNFLGEVRDKWDTVCGKSVERQHKLEEALLFSGQFMDALQALVDWLYKVEPQLAE
:. :::..:.:.::::::.::::::::.:::::::::::: ::::::.::::.:::::::
CCDS75 DNLKLDDMLSELRDKWDTICGKSVERQNKLEEALLFSGQFTDALQALIDWLYRVEPQLAE
4740 4750 4760 4770 4780 4790
4600 4610 4620 4630 4640 4650
pF1KE0 DQPVHGDLDLVMNLMDAHKVFQKELGKRTGTVQVLKRSGRELIENSRDDTTWVKGQLQEL
:::::::.::::::.: ::.:::::::::..::.::::.:::::.::::..::: :.:::
CCDS75 DQPVHGDIDLVMNLIDNHKAFQKELGKRTSSVQALKRSARELIEGSRDDSSWVKVQMQEL
4800 4810 4820 4830 4840 4850
4660 4670 4680 4690 4700 4710
pF1KE0 STRWDTVCKLSVSKQSRLEQALKQAEVFRDTVHMLLEWLSEAEQTLRFRGALPDDTEALQ
::::.::: ::.:::.::: ::.::: :...:: :::::.::::::::.:.:::: .::.
CCDS75 STRWETVCALSISKQTRLEAALRQAEEFHSVVHALLEWLAEAEQTLRFHGVLPDDEDALR
4860 4870 4880 4890 4900 4910
4720 4730 4740 4750 4760 4770
pF1KE0 SLIDTHKEFMKKVEEKRVDVNSAVAMGEVILAVCHPDCITTIKHWITIIRARFEEVLTWA
.::: :::::::.::::...:.:..::...::.:::: :::::::::::::::::::.::
CCDS75 TLIDQHKEFMKKLEEKRAELNKATTMGDTVLAICHPDSITTIKHWITIIRARFEEVLAWA
4920 4930 4940 4950 4960 4970
4780 4790 4800 4810 4820 4830
pF1KE0 KQHQQRLETALSELVANAELLEELLAWIQWAETTLIQRDQEPIPQNIDRVKALIAEHQTF
::::::: .::. :.:. :::: ::::.::::::: ..:.: :::.:..:::::::::::
CCDS75 KQHQQRLASALAGLIAKQELLEALLAWLQWAETTLTDKDKEVIPQEIEEVKALIAEHQTF
4980 4990 5000 5010 5020 5030
4840 4850 4860 4870 4880 4890
pF1KE0 MEEMTRKQPDVDRVTKTYKRKNIEPT----HAPFIEKSRSGGRKSLSQPTPPPMPILSQS
::::::::::::.:::::::. .:. : : ..:.:.: :: . . : .:
CCDS75 MEEMTRKQPDVDKVTKTYKRRAADPSSLQSHIPVLDKGRAG-RKRFPASSLYPSGSQTQI
5040 5050 5060 5070 5080 5090
4900 4910 4920 4930 4940 4950
pF1KE0 EAKNPRINQLSARWQQVWLLALERQRKLNDALDRLEELKEFANFDFDVWRKKYMRWMNHK
:.::::.: : ..:::::::::::.:::::::::::::.::::::::.::::::::::::
CCDS75 ETKNPRVNLLVSKWQQVWLLALERRRKLNDALDRLEELREFANFDFDIWRKKYMRWMNHK
5100 5110 5120 5130 5140 5150
4960 4970 4980 4990 5000 5010
pF1KE0 KSRVMDFFRRIDKDQDGKITRQEFIDGILASKFPTTKLEMTAVADIFDRDGDGYIDYYEF
:::::::::::::::::::::::::::::.:::::..:::.:::::::::::::::::::
CCDS75 KSRVMDFFRRIDKDQDGKITRQEFIDGILSSKFPTSRLEMSAVADIFDRDGDGYIDYYEF
5160 5170 5180 5190 5200 5210
5020 5030 5040 5050 5060
pF1KE0 VAALHPNKDAYRPTTDADKIEDEVTRQVAQCKCAKRFQVEQIGENKYRF------GDSQQ
:::::::::::.: :::::::::::::::.:::::::::::::.::::: :::::
CCDS75 VAALHPNKDAYKPITDADKIEDEVTRQVAKCKCAKRFQVEQIGDNKYRFFLGNQFGDSQQ
5220 5230 5240 5250 5260 5270
5070 5080 5090 5100 5110 5120
pF1KE0 LRLVRILRSTVMVRVGGGWMALDEFLVKNDPCRARGRTNIELREKFILPEGASQGMTPFR
::::::::::::::::::::::::::::::::::.::::.:::::::: .::::::. ::
CCDS75 LRLVRILRSTVMVRVGGGWMALDEFLVKNDPCRAKGRTNMELREKFILADGASQGMAAFR
5280 5290 5300 5310 5320 5330
5130 5140 5150 5160
pF1KE0 SRGRRSKPSSRAASPTRSSSSASQSNHSCTSMPSSPAT----------------------
:::::.::::.:::.::.: .::. .. . :. :::
CCDS75 PRGRRSRPSSRGASPNRSTSVSSQAAQAAS--PQVPATTTPKILHPLTRNYGKPWLTNSK
5340 5350 5360 5370 5380 5390
5170 5180 5190 5200 5210
pF1KE0 -------------PASGTKVIPSSGSKLKRPTPTFHSSRTSLAGDTSNSSSPASTGAKTN
:. ... : .::::. : . :.. .:. :. . :.. ..:.
CCDS75 MSTPCKAAECSDFPVPSAEGTPIQGSKLR--LPGYLSGKGFHSGEDSGLITTAAARVRTQ
5400 5410 5420 5430 5440
5220 5230 5240 5250 5260 5270
pF1KE0 RADPKKSASRPGSRAGSRAGSRASSRRGSDASDFDLLETQSACSDTS---ESSAAGGQGN
:: ::. :::::::::.:::::::::::::::::. : ::.:::. .. ...
CCDS75 FADSKKTPSRPGSRAGSKAGSRASSRRGSDASDFDISEIQSVCSDVETVPQTHRPTPRAG
5450 5460 5470 5480 5490 5500
5280 5290 5300
pF1KE0 SRRGLNKPSKIPTMSKKTTTASPRTPGPKR
:: . ::::::: ..:.
CCDS75 SRPSTAKPSKIPTPQRKSPASKLDKSSKR
5510 5520 5530
>--
initn: 687 init1: 687 opt: 801 Z-score: 441.8 bits: 98.1 E(32554): 2.7e-18
Smith-Waterman score: 801; 75.4% identity (86.2% similar) in 167 aa overlap (1-166:1-163)
10 20 30 40 50
pF1KE0 MSSSDEETLSERSCRSERSCRSERSYRSERSGSLSPCPPGDTLPWNLPLHEQKKRKSQD-
:::.. : : : . :... :..::: :: : ::::::::: ::..::: :
CCDS75 MSSGNA---SYRCSMSSSADFSDEDDFSQKSGSASPAP-GDTLPWNLPKHERSKRKIQGG
10 20 30 40 50
60 70 80 90 100 110
pF1KE0 SVLDPAERAVVRVADERDRVQKKTFTKWVNKHLMKVRKHINDLYEDLRDGHNLISLLEVL
::::::::::.:.:::::.:::::::::.:.::::::::.::::::::::::::::::::
CCDS75 SVLDPAERAVLRIADERDKVQKKTFTKWINQHLMKVRKHVNDLYEDLRDGHNLISLLEVL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE0 SGIKLPREKGRMRFHRLQNVQIALDFLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILH
:: :::::::::::::::::::::.::.::::::::::::::::::
CCDS75 SGDTLPREKGRMRFHRLQNVQIALDYLKRRQVKLVNIRNDDITDGNPKLTLGLIWTIILH
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE0 FQISDIYISGESGDMSAKEKLLLWTQKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPD
CCDS75 FQISDIHVTGESEDMSAKERLLLWTQQATEGYAGIRCENFTTCWRDGKLFNAIIHKYRPD
180 190 200 210 220 230
>>CCDS4959.1 DST gene_id:667|Hs108|chr6 (2649 aa)
initn: 3155 init1: 2045 opt: 3289 Z-score: 1795.5 bits: 347.5 E(32554): 1.1e-93
Smith-Waterman score: 3620; 35.2% identity (66.5% similar) in 2017 aa overlap (425-2348:56-1983)
400 410 420 430 440 450
pF1KE0 GYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEKLTLAKNTL
:::.: ::::..: .. ::.:: :: :.:
CCDS49 DSNENLLLVHCGPTLINSCISFGSESFDGHRLEMLQQIANRVQRDSVICEDKLILAGNAL
30 40 50 60 70 80
460 470 480 490 500 510
pF1KE0 QADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELAFRVMRLQD
:.:. .:::: : :... :: :::.:.:: .:.::: : .::: ..:. :: .:.:
CCDS49 QSDSKRLESGVQFQNEAEIAGYILECENLLRQHVIDVQILIDGKYYQADQLVQRVAKLRD
90 100 110 120 130 140
520 530 540
pF1KE0 ELVTLRLECTNLYRKGHFTSLE-------------------LVPPSTLT------TTHLK
:...:: ::...: ::.. . : . :: . : :
CCDS49 EIMALRNECSSVYSKGRILTTEQTKLMISGITQSLNSGFAQTLHPSLTSGLTQSLTPSLT
150 160 170 180 190 200
550 560 570
pF1KE0 AEPLTKATHSSSTS-------------------------------------WFRKPMTRA
. .:.. :. :: .:::. ..
CCDS49 SSSMTSGLSSGMTSRLTPSVTPAYTPGFPSGLVPNFSSGVEPNSLQTLKLMQIRKPLLKS
210 220 230 240 250 260
580 590 600 610 620 630
pF1KE0 ELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIHTSVEEL
:. . .:.: :..:: .::.::.:::..:.:.:::.:::::: .::.....: ..::.
CCDS49 SLLDQNLTEEEINMKFVQDLLNWVDEMQVQLDRTEWGSDLPSVESHLENHKNVHRAIEEF
270 280 290 300 310 320
640 650 660 670 680 690
pF1KE0 GSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFVSRATAE
::.:::.. : .:. .. .::: : .::.:: :: .:: . :::..::.:::::: :
CCDS49 ESSLKEAKISEIQMTAPLKLTYAEKLHRLESQYAKLLNTSRNQERHLDTLHNFVSRATNE
330 340 350 360 370 380
700 710 720 730 740 750
pF1KE0 LIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELLSLENHP
:::::::::::.:::::. :.::. :..: .:: ::..:.. ..:.:. :: : :::::
CCDS49 LIWLNEKEEEEVAYDWSERNTNIARKKDYHAELMRELDQKEENIKSVQEIAEQLLLENHP
390 400 410 420 430 440
760 770 780 790 800 810
pF1KE0 AKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQDSIKRK
:. :.::: ::.:.: .:. ::: :::::.:::::::.::.::.: ..::::.:.:.::
CCDS49 ARLTIEAYRAAMQTQWSWILQLCQCVEQHIKENTAYFEFFNDAKEATDYLRNLKDAIQRK
450 460 470 480 490 500
820 830 840 850 860 870
pF1KE0 YSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHVLKNTIS
::::...:. .::::.:.::.:::.:.: ::..:.:.:..:::.:::::. : ::..:
CCDS49 YSCDRSSSIHKLEDLVQESMEEKEELLQYKSTIANLMGKAKTIIQLKPRNSDCPLKTSIP
510 520 530 540 550 560
880 890 900 910 920 930
pF1KE0 VKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPNKDAIEM
.::.:::::::::: :.::::: .::.:.::::::::::::::::::: .:::::.:...
CCDS49 IKAICDYRQIEITIYKDDECVLANNSHRAKWKVISPTGNEAMVPSVCFTVPPPNKEAVDL
570 580 590 600 610 620
940 950 960 970 980 990
pF1KE0 ASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGECHQIMKN
:.:.::.::.:..:::. :.: ::..::.:: ...: ... :. .... ::: .:...:
CCDS49 ANRIEQQYQNVLTLWHESHINMKSVVSWHYLINEIDRIRASNVASIKTMLPGEHQQVLSN
630 640 650 660 670 680
1000 1010 1020 1030 1040 1050
pF1KE0 LQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVAKMYISE
::...::::.::..: .:: .: .::.::..:: .:.:.:: : :..::.: ..::::
CCDS49 LQSRFEDFLEDSQESQVFSGSDITQLEKEVNVCKQYYQELLKSAEREEQEESVYNLYISE
690 700 710 720 730 740
1060 1070 1080 1090 1100 1110
pF1KE0 LKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRSDLDAVS
..:::::::. :.:....:.. .:: .....::.:::. ...:..:..:: ...
CCDS49 VRNIRLRLENCEDRLIRQIRT----PLERDDLHESVFRITEQEKLKKELERLKDDLGTIT
750 760 770 780 790 800
1120 1130 1140 1150 1160 1170
pF1KE0 MKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSIQDAELL
::. :. :. .::::::::::::.....:..::..:..:..:::::...... : :: :
CCDS49 NKCEEFFSQAAASSSVPTLRSELNVVLQNMNQVYSMSSTYIDKLKTVNLVLKNTQAAEAL
810 820 830 840 850 860
1180 1190 1200 1210 1220 1230
pF1KE0 VKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMS
:: :: :: .::.:.:: . .: :::..: :.: .: .:: .:..:. :::.....:
CCDS49 VKLYETKLCEEEAVIADKNNIENLISTLKQWRSEVDEKRQVFHALEDELQKAKAISDEMF
870 880 890 900 910 920
1240 1250 1260 1270 1280 1290
pF1KE0 RLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGTLIKWIE
. ::.::.. ..::..:: :::. : .:.. : .::.: . : :: . : ::.
CCDS49 KTYKERDLDFDWHKEKADQLVERWQNVHVQIDNRLRDLEGIGKSLKYYRDTYHPLDDWIQ
930 940 950 960 970 980
1300 1310 1320 1330 1340 1350
pF1KE0 ETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTIVKDYEL
.. . :. .. .: :.:..:. ::.:: : .::: .:.:.:.:::...:::. ::::::
CCDS49 QVETTQRKIQENQPENSKTLATQLNQQKMLVSEIEMKQSKMDECQKYAEQYSATVKDYEL
990 1000 1010 1020 1030 1040
1360 1370 1380 1390 1400 1410
pF1KE0 QLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYISDALRR
: :::.:.:.:::::: ::::: ::.: : :::::::::::::::: ::..:. .:.:.:
CCDS49 QTMTYRAMVDSQQKSPVKRRRMQSSADLIIQEFMDLRTRYTALVTLMTQYIKFAGDSLKR
1050 1060 1070 1080 1090 1100
1420 1430 1440 1450 1460 1470
pF1KE0 LEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQ--GKATSSETKESTDIEKAILEQQVL
::::: .: .:: : .:. .:.. :: . : . ....: ... .
CCDS49 LEEEEIKRCKETSEHGAYSDLLQRQKATVLENSKLTGKISELE-RMVAELKK---QKSRV
1110 1120 1130 1140 1150
1480 1490 1500 1510 1520
pF1KE0 SEELTTKKEQVSEAIKTSQIFLAKHG-HKL-SEKEKKQISEQLNALNKAYHDLCDGSANQ
::: .: . . .. .: . . .:. .:.: :: ..:... . ... .
CCDS49 EEELPKVREAAENELRKQQRNVEDISLQKIRAESEAKQYRRELETIVREK----EAAERE
1160 1170 1180 1190 1200 1210
1530 1540 1550 1560 1570 1580
pF1KE0 LQQLQSQLAHQTEQKTLQKQQNTCH--QQLEDLCSWVGQAERALAGHQGRTTQQDLSALQ
:.... ::. ..: : ..: . .:::. ..:.: : : .::: .
CCDS49 LERVR-QLTIEAEAKRAAVEENLLNFRNQLEENTF----TRRTLEDHLKR---KDLSLND
1220 1230 1240 1250 1260
1590 1600 1610 1620 1630 1640
pF1KE0 KNQSDLKDLQDDIQNRATSFATVVKDIEGFMEEN---QTKLSPRELTALREKLHQAKEQY
.:. : :..... . . ..: :. ::.. : ... ..: .. .:...
CCDS49 LEQQKNK-LMEELRRKRDNEEELLKLIKQ-MEKDLAFQKQVAEKQLKEKQKIELEARRKI
1270 1280 1290 1300 1310 1320
1650 1660 1670 1680 1690
pF1KE0 EALQEETR--------VAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSV
.: : ..: .:::. :::: .:.:: .:: :...: : :..
CCDS49 TEIQYTCRENALPVCPITQATSCRAVTG-LQQEHDKQKA-EEL---KQQVDEL----TAA
1330 1340 1350 1360 1370
1700 1710 1720 1730 1740 1750
pF1KE0 GSSGGQLLTNLPGMEQLSGASLEKGALDTTDGYMGVNQAPEKLDKQCEMMKARHQELLSQ
. .. : . .: .:.. .::: :.. . .:::. . .. . :: .
CCDS49 NRKAEQDMREL--TYELNALQLEK-----TSSEEKARLLKDKLDETNNTLRCLKLELERK
1380 1390 1400 1410 1420
1760 1770 1780 1790 1800 1810
pF1KE0 QQNFILATQSAQAFLDQHGHNLTPEEQQMLQQK-LGELKEQYSTSLAQSEAELKQVQTLQ
.: .:. . . : ... :. : . . : ..:..:. : . . : . ::
CCDS49 DQAEKGYSQQLRELGRQLNQTTGKAEEAMQEASDLKKIKRNYQLELESLNHEKGK---LQ
1430 1440 1450 1460 1470 1480
1820 1830 1840 1850 1860 1870
pF1KE0 DELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDV-ISHKGDLR
:.... . : :. ... ....... . . : : ... ..:. ::. :.
CCDS49 REVDRITRAHAVAEKNIQHLNSQIHSF-RDEKELERLQICQRKSDHLKEQFEKSHEQLLQ
1490 1500 1510 1520 1530 1540
1880 1890 1900 1910 1920 1930
pF1KE0 FVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLLGQ
.:...: . ...... .: : .: . ::. .:. : ... :.: :.
CCDS49 --NIKAEK--ENNDKIQRLNEELEKSNECAEMLKQKVEELTRQNNE-TKL-----MMQRI
1550 1560 1570 1580 1590
1940 1950 1960 1970 1980 1990
pF1KE0 YHQFQNSADSLQAWMQACEA-NVEKL-LSDTVASDPGVLQEQLATTKQLQEELAEHQVPV
. .: . :. .: ::: ... ..: . : :..: : ...:... .
CCDS49 QAESENIVLEKQTIQQRCEALKIQADGFKDQLRSTNEHLHKQTKTEQDFQRKIKCLE---
1600 1610 1620 1630 1640 1650
2000 2010 2020 2030 2040 2050
pF1KE0 EKLQKVARDIMEIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSSLLQKAIAQSQSVQ
: : : . :.. . .. .:.: . . :. : :. ::. :. .::
CCDS49 EDLAKSQNLVSEFKQKCDQQNIIIQNTKKEVRNLNAELNASKEEKRRGEQKVQLQQAQVQ
1660 1670 1680 1690 1700 1710
2060 2070 2080 2090 2100 2110
pF1KE0 ESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATREMVTR
: : . . .:...:. : . : . . .... .. :.: : :. . .
CCDS49 E----LNNRLKKVQDELHLKTIEE------QMTHRKMVLFQEESGKFKQSAEEFRKKMEK
1720 1730 1740 1750 1760
2120 2130 2140 2150 2160 2170
pF1KE0 FMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKLQQFME
.::. .. .. .. . :.. . :::...... . : .... : : .:::. :
CCDS49 LMESK-----VITENDISGI--RLDFVSLQQENSRAQENAKLCETNIKE-LERQLQQYRE
1770 1780 1790 1800 1810
2180 2190 2200 2210 2220 2230
pF1KE0 NKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEH-LVTELSSCGFALDLCQH
. . .:.. .. .:. :. :.:. :. :......:.. . ... : : :
CCDS49 Q----MQQGQH--MEANHY-QKCQKLEDELIAQKREVENLKQKMDQQIKEHEHQLVLLQC
1820 1830 1840 1850 1860
2240 2250 2260 2270 2280
pF1KE0 QDRVQNLRKDFT---ELQKTVKEREKDASSCQEQLDEFRKLVRT-FQKWLKETEGSIPPT
. . .. :: : ... :::: .... ... ... :. . .: .: . :
CCDS49 EIQKKSTAKDCTFKPDFEMTVKECQHSGELSSRNTGHLHPTPRSPLLRWTQEPQ----PL
1870 1880 1890 1900 1910 1920
2290 2300 2310 2320 2330 2340
pF1KE0 ETSMSAKELEK-----QIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAPDSQGK
: . . . .:. :.. . :. :. : .. :: : ..:: ...
CCDS49 EEKWQHRVVEQIPKEVQFQPPGAPLEKEKSQQCYSEYFS--QTSTE---LQITFDETNPI
1930 1940 1950 1960 1970
2350 2360 2370 2380 2390 2400
pF1KE0 TDLTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEANSVLQWLESKEEVLK
: :.::.
CCDS49 TRLSEIEKIRDQALNNSRPPVRYQDNACEMELVKVLTPLEIAKNKQYDMHTEVTTLKQEK
1980 1990 2000 2010 2020 2030
>>CCDS47936.1 PLEC gene_id:5339|Hs108|chr8 (4515 aa)
initn: 3779 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4725; 29.0% identity (59.1% similar) in 4244 aa overlap (72-4199:4-3962)
50 60 70 80 90 100
pF1KE0 TLPWNLPLHEQKKRKSQDSVLDPAERAVVRVADERDRVQKKTFTKWVNKHLMKVRKHIND
: :::::::::::::::::::.:...::.:
CCDS47 MKIVPDERDRVQKKTFTKWVNKHLIKAQRHISD
10 20 30
110 120 130 140 150 160
pF1KE0 LYEDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQIALDFLKQRQVKLVNIRNDDI
:::::::::::::::::::: .:::::::::::.:::::::::.:..:::::::::::::
CCDS47 LYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALDYLRHRQVKLVNIRNDDI
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE0 TDGNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLLLWTQKVTAGYTGIKCTNFSS
.::::::::::::::::::::::: .::.: ::.::::::::.:... :: :..: ::.:
CCDS47 ADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWSQRMVEGYQGLRCDNFTS
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE0 CWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEVAER-LGVTRLLDAEDVDVPS
: ::..:::.:::..: :.::..: :.: :::.::: :::: :::::::: ::::::.
CCDS47 SWRDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSVAERDLGVTRLLDPEDVDVPQ
160 170 180 190 200 210
290 300 310 320 330 340
pF1KE0 PDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQSRVDSLIPWIKQHTILMSDK
:::::.::::::.:::.:.::. .:. :.:.. :::::. : :. :...:: . ..
CCDS47 PDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELVLLLLQWMRHHTAAFEER
220 230 240 250 260 270
350 360 370 380 390 400
pF1KE0 TFPQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKLLEVWIEFGRIKLPQGYHPND
::.. :.. :..:...::: :. ::: .:.: . .:. :: .. :..:.: :::: :
CCDS47 RFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEGAVQAGQLKVPPGYHPLD
280 290 300 310 320 330
410 420 430 440 450 460
pF1KE0 VEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEKLTLAKNTLQADAAH
::.::::: . .:::::.:: :::: : .:..:.: : :::.:. : ::.:.
CCDS47 VEKEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEAGLCEEQLNQADALLQSDVRL
340 350 360 370 380 390
470 480 490 500 510 520
pF1KE0 LESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELAFRVMRLQDELVTLR
: .:. : ..: ... ...:: : :.: :.: . : :.. ::.::...::..:
CCDS47 LAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHPQGEQMYRRVYRLHERLVAIR
400 410 420 430 440 450
530 540 550 560 570 580
pF1KE0 LECTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSSSTSWFRKPMTRAELVAISSS
: :: :. : : :.... . : :.: ::
CCDS47 TE-YNLRLKAGV-----------------AAPATQVAQVTLQSVQRRP----EL------
460 470 480
590 600 610 620 630 640
pF1KE0 EDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIHTSVEELGSSVKEAR
....::.. .::.:::: : ... :::: :::::: :: ... .: :.::. .....::
CCDS47 -EDSTLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLGSHRGLHQSIEEFRAKIERAR
490 500 510 520 530 540
650 660 670 680 690 700
pF1KE0 LYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFVSRATAELIWLNEKE
::..: . .: . ::.:. :: :: ..:. :.: :.:::.::. :: ::.::::::
CCDS47 SDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLHSFVAAATKELMWLNEKE
550 560 570 580 590 600
710 720 730 740 750 760
pF1KE0 EEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELLSLENHPAKQTVEAY
:::...:::: :.:..::.. .: : ::: :. .. ::.... : :.:::. :::..
CCDS47 EEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAGDRLLREDHPARPTVESF
610 620 630 640 650 660
770 780 790 800 810 820
pF1KE0 SAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQDSIKRKYSCDHNTS
.::.:.: .:: ::: :.: :.:::.::::::::.:: :. :..::....::::::....
CCDS47 QAALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEGQLQKLQEALRRKYSCDRSAT
670 680 690 700 710 720
830 840 850 860 870 880
pF1KE0 LSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHVLKNTISVKAVCDYR
..::::::::..:::::: . :. ...:. :.:..:::::: : : ... . . :::::.
CCDS47 VTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHPAHPMRGRLPLLAVCDYK
730 740 750 760 770 780
890 900 910 920 930 940
pF1KE0 QIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPNKDAIEMASRVEQSY
:.:.:. :.::: : .: ..:::.: .:.:: :::::::.::::..: : ..:.: ..
CCDS47 QVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVPPPNQEAQEAVTRLEAQH
790 800 810 820 830 840
950 960 970 980 990 1000
pF1KE0 QKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGECHQIMKNLQAHYEDF
: ...:::::::. :::..:. ::.:..:...:.: .:. : : .: ...:. ::. :
CCDS47 QALVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKPEEQRQALHSLELHYQAF
850 860 870 880 890 900
1010 1020 1030 1040 1050 1060
pF1KE0 LQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVAKMYISELKNIRLRL
:.::.:. :. ::: :.: .:. ..:.:..:.:. .::. . :::::.:::.:
CCDS47 LRDSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGAQEESRCQRCISELKDIRLQL
910 920 930 940 950 960
1070 1080 1090 1100 1110 1120
pF1KE0 EEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRSDLDAVSMKCDSFLH
: : :.:.:.. : :.. .. : :::::...: ... : . . .: . .. :
CCDS47 EACETRTVHRLR-LP---LDKEPARECAQRIAEQQKAQAEVEGLGKGVARLSAEAEKVLA
970 980 990 1000 1010 1020
1130 1140 1150 1160 1170 1180
pF1KE0 QSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSIQDAELLVKGYEIKL
: ..:::::::.: . :...: .::..::.::::.....:. : :: .....: .:
CCDS47 LPEPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVIRGTQGAEEVLRAHEEQL
1030 1040 1050 1060 1070 1080
1190 1200 1210 1220 1230 1240
pF1KE0 SQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMSRLTPERNL
.. ..: : : ::: ..:.. .... .. .:..: .:. :. :.:.... ::..
CCDS47 KEAQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDELRGAQEVGERLQQRHGERDV
1090 1100 1110 1120 1130 1140
1250 1260 1270 1280 1290 1300
pF1KE0 DLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGTLIKWIEETTAQQEM
..::..:. .:: :::. :.:: ..:: :::.. . : :: : :.... .::.
CCDS47 EVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRESADPLGAWLQDARRRQEQ
1150 1160 1170 1180 1190 1200
1310 1320 1330 1340 1350 1360
pF1KE0 MKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTIVKDYELQLMTYKAF
.. ::... ::: :. ::. ::::. :...::.:..:: . .:::::::.::::
CCDS47 IQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQYINAIKDYELQLVTYKAQ
1210 1220 1230 1240 1250 1260
1370 1380 1390 1400 1410 1420
pF1KE0 VESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYISDALRRLEEEEKVV
.: ::.:. .. :.:... ::..::::.:. :.:::.:..:.::..:::.::::...
CCDS47 LEPVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTSQYIKFISETLRRMEEEERLA
1270 1280 1290 1300 1310
1430 1440 1450 1460 1470 1480
pF1KE0 EEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKAILEQQVLSEELTTKKEQ
:... :. :.. :. ..: .. : . ...: ... : : :: ..::.. ..:
CCDS47 EQQRAEERERLAEV---EAALEKQRQLAEAHAQAKAQAEREAKEL-QQRMQEEVVRREEA
1320 1330 1340 1350 1360 1370
1490 1500 1510 1520 1530 1540
pF1KE0 VSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCDGSANQLQQLQSQLAHQT
. .: ...:..:.:.:. : .. . . : . :.. :...
CCDS47 AVDA----------------QQQKRSIQEELQQLRQSSE-----AEIQAKARQAEAAERS
1380 1390 1400 1410
1550 1560 1570 1580 1590
pF1KE0 EQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ---QDLSALQKNQSDLKDLQD
. . .... . . ::: : :: : . ..:. . : .: .. . ...::
CCDS47 RLR-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEAEAQKRQAQEEAERLRRQVQD
1420 1430 1440 1450 1460 1470
1600 1610 1620 1630 1640 1650
pF1KE0 DIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAKEQYEALQEETRVAQKEL
. : . . . ... ... : . : : : ::.: ::.: : :. : :.
CCDS47 ESQRKRQAEVELASRVKAEAEAAREK--QRALQALEELRLQAEEA------ERRLRQAEV
1480 1490 1500 1510 1520
1660 1670 1680 1690 1700 1710
pF1KE0 EEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGGQLLTNLPGMEQLSGASL
:.: . :: . .: :: ..:. .: . . .:: .: :... :.:
CCDS47 ERARQVQVALETAQRSAEAEL-QSKR---------ASFAEKTAQLERSLQ-EEHVAVAQL
1530 1540 1550 1560 1570
1720 1730 1740 1750 1760
pF1KE0 ----EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARHQ-ELLSQQQNFILAT---QS
:. : . ... . ..: ..:. : : .. : : : ..::... : :.
CCDS47 REEAERRAQQQAEAERAREEAERELERWQLKANEALRLRLQAEEVAQQKSLAQAEAEKQK
1580 1590 1600 1610 1620 1630
1770 1780 1790 1800 1810 1820
pF1KE0 AQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELKQVQTLQDELQKFLQDHK
.: . . .. ::: . :..:.: . . . .::.. :. : . ..:: .. . .
CCDS47 EEAEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTAQ--QRLAAEQELIRLRAETE
1640 1650 1660 1670 1680 1690
1830 1840 1850 1860 1870 1880
pF1KE0 EFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISHKGDLRFVTISGQKVLDM
. :. . :.:: ... :. . ::: . .. . ..... . : .. .
CCDS47 QGEQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAELAKVRAEMEVLLASKARAEE-
1700 1710 1720 1730 1740
1890 1900 1910 1920 1930 1940
pF1KE0 ENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLLGQYHQFQNSADSLQ
:.. :: . :..:. . :. : . .:: . :.. . : . .
CCDS47 -----ESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA-----LAEEAKRQRQLAEED
1750 1760 1770 1780 1790
1950 1960 1970 1980 1990 2000
pF1KE0 AWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQVPVEKLQKVARDIM---
: : :: :..:.. .:. . . . . :.:. ::. :.:...:.:
CCDS47 AARQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEAEN----ERLRRLAEDEAFQR
1800 1810 1820 1830 1840
2010 2020 2030 2040 2050 2060
pF1KE0 -EIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LLQKAIAQSQSVQESLESLLQS
..: . : . ..: :..... : : ::.. :.. .. : ..:.: . .: :
CCDS47 RRLEEQAAQHKADIEER----LAQLRKASDSELERQKGLVEDTLRQRRQVEEEILALKAS
1850 1860 1870 1880 1890 1900
2070 2080 2090 2100 2110 2120
pF1KE0 IGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATREMVTRFMETADSTT
. :. :: : : :. ... ..... :::.:.
CCDS47 F---EKAAAGKAELELELGRIRSNAEDTLR-----SKEQAELEAARQ----------RQL
1910 1920 1930 1940
2130 2140 2150 2160 2170 2180
pF1KE0 AAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKLQQFMENKSRMLASG
:: . . :. .: .. ..: . : : ..: .:. .:. :. .
CCDS47 AAEEERRRREAEERVQKSLAAEEEAARQRKAALEEVE-------RLKAKVEEARRLRERA
1950 1960 1970 1980 1990
2190 2200 2210 2220 2230 2240
pF1KE0 NQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGFALDLCQHQDRVQNLRKD
.: . .. :. . :. :.. . . .... ::.. : :.:. ...:: .
CCDS47 EQESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQT-----LQQEQSVLDQLRGE
2000 2010 2020 2030 2040 2050
2250 2260 2270 2280 2290 2300
pF1KE0 FTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSIPPTETSMSAKELEKQIE
.....: :. . ... . :. :. .. ::.. : ... . . :
CCDS47 AEAARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA-----EEQAQARAQAQAAAE
2060 2070 2080 2090 2100
2310 2320 2330 2340 2350
pF1KE0 HLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQGKTDLTEIQCDMSDVNLKYE
.:.. .. :.. . .:. . . . :: : . .... ... . :. :
CCDS47 KLRKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQTLRQKAQVEQELTTLRLQLE
2110 2120 2130 2140 2150 2160
2360 2370 2380 2390 2400 2410
pF1KE0 KLGGVLHERQESLQAILNRMEEVHKEANSVLQWLES---KEEVLKSMDAMSSPTKTETVK
. . .: :: . . :. .. ..: . : : . : :... : . .
CCDS47 ETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQMEELSKLKARIEAENRALIL
2170 2180 2190 2200 2210 2220
2420 2430 2440 2450 2460 2470
pF1KE0 AQAESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEAENWKKIQEELNSRWERATEV
. .... :: : .. :...: : : : :. .::: ... :: .. . .:
CCDS47 RDKDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEAARLRQLAEEDLAQQRALAEK
2230 2240 2250 2260 2270
2480 2490 2500 2510 2520 2530
pF1KE0 TVARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLGPLSIDPNMLNAQ-KQQVQFM
. .. : . :..: ::..: ..::: . :. : ... : ...: .
CCDS47 MLKEKMQAVQEATRLK----AEAELLQ--QQKELAQEQARRLQEDKEQMAQQLAEETQGF
2280 2290 2300 2310 2320 2330
2540 2550 2560 2570 2580 2590
pF1KE0 LKEFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQSINQKWVELTDKLNSR--SS
. .::.::.. ... :. . ...: . ...... : . .. :. .::. ..
CCDS47 QRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQRFRKQAEEIGEKLHRTELAT
2340 2350 2360 2370 2380 2390
2600 2610 2620 2630 2640 2650
pF1KE0 QIDQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQPEAVKQQLEETSEIRSDLEQ
: ..:.. . :. .: .:..: . .: .. . : :: ::. . ::
CCDS47 QEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQQEAKLLQLKSEEMQTVQQEQ
2400 2410 2420 2430 2440 2450
2660 2670 2680 2690
pF1KE0 LDHEVKEAQT--LCDELSVLIGEQYLKDELKKRLET-----VALPLQGLED-------LA
: .:.. : : .. :.: :.....: : .:: :: : :. .
CCDS47 LLQETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQDEVAKAQQLREEQQRQQQQME
2460 2470 2480 2490 2500 2510
2700 2710 2720 2730 2740 2750
pF1KE0 ADRINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAKNCP--ISAKLERLQSQLQEN
.: .:: :.. ... :. .: .: .. :. :: .. .. . .::. :::
CCDS47 QER-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRRQQEELLAEENQRLREQLQLL
2520 2530 2540 2550 2560
2760 2770 2780 2790 2800 2810
pF1KE0 EEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKNHWEELSKKTADRQS
:: ... :: : ..: . ..: :.. .: .. .. : .:.. .
CCDS47 EEQHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAAEAEPEHSFDGLRRKVS--AQ
2570 2580 2590 2600 2610 2620
2820 2830 2840 2850 2860 2870
pF1KE0 RLKDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSLLRSKAMLNEVEKR
::.. . .:.. : .. . : :. ..: :. . ..:: :: ...
CCDS47 RLQEAGILSAEELQRLAQGHTT--VDELARREDVRHYLQGRSSIAGLLL-KATNEKLSVY
2630 2640 2650 2660 2670 2680
2880 2890 2900 2910 2920
pF1KE0 RSLLEILNS--AADILINSSEADE---DGIRDEKAGINQNMD--AVTEELQAKTGSLEEM
.: . : : .: ::.... :. : .:... .:. . .: ::. : : :.
CCDS47 AALQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVNEAVKEGVVGPELHHKLLSAERA
2690 2700 2710 2720 2730 2740
2930 2940 2950 2960 2970 2980
pF1KE0 TQRLREFQES-----FKNIEKKVEGAKHQLEIFDALGSQACSNKNLEKLRAQQEVLQALE
. .. . :. ..: . .: .....: : .. .. ..... .
CCDS47 VTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---QIATGGVIDPVHSHR-----VP
2750 2760 2770 2780 2790
2990 3000 3010 3020 3030
pF1KE0 PQVDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-EFLEVKQRV----NSG-CVM-ME
.: : :. : . . . : :: .. . . .. .. .:.. .: ..: :.. .
CCDS47 VDVAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQLLERCVEDPETGLCLLPLT
2800 2810 2820 2830 2840 2850
3040 3050 3060 3070 3080
pF1KE0 NKLEGIGQF---HCRVREMFSQL---ADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKI
.: :.. ..:..: . : . .: . .: :. : .: ..
CCDS47 DKAAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVTIWEIINSEYFTAEQRRDLLRQF
2860 2870 2880 2890 2900 2910
3090 3100 3110 3120 3130 3140
pF1KE0 HVLKLDIEASEAECRHMLEEE---GTLDLLGLKRELEALNKQCGKLTERGKARQEQLELT
.. .. .: ..::. : : . ::. . : . ... .: .:
CCDS47 RTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAELLESRVIDR------ELYQQ
2920 2930 2940 2950 2960
3150 3160 3170 3180 3190 3200
pF1KE0 LGRVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMK-
: : : :... . .. :. . .. . ..:. .: .:.:. .. ..:. . : .:
CCDS47 LQRGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQKLSIYNALKKDLL-PSDMAV
2970 2980 2990 3000 3010 3020
3210 3220 3230 3240 3250
pF1KE0 --LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINARWNTLNKKVA-QRIAQLQEALL
:. : :. . ... : .... . :.. . . .: :. : ...
CCDS47 ALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHEKLLSAEKAVTGYRDPYTGQSVS
3030 3040 3050 3060 3070 3080
3260 3270 3280 3290 3300 3310
pF1KE0 HCGKFQDALEP------LLSWLADTEELIANQKPPSAEYKVVKAQIQEQKLLQRLLDDRK
.. .: : ::. .: .. .: . :. :. .. .: :. .
CCDS47 LFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDVACARGCLDEETSRALSAPR
3090 3100 3110 3120 3130 3140
3320 3330 3340 3350 3360
pF1KE0 ATVDMLQAEG-GRIAQSAELADREKITGQLESLESRWTELLSKAA-ARQKQLEDILVLAK
: . . . :. : .:: .: . :: .: : ::: :::..: . : .
CCDS47 ADAKAYSDPSTGEPATYGELQQRCR-PDQLTGL--SLLPLSEKAARARQEELYSELQARE
3150 3160 3170 3180 3190 3200
3370 3380 3390 3400 3410 3420
pF1KE0 QFHETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQQQIIRHKALNEEIVNRKKNVDQ
:..: :.. : .:: .: .:: ::. .:...: .. . : .:..
CCDS47 TFEKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQRQELLR------QFRTGKVTVEK
3210 3220 3230 3240 3250
3430 3440 3450 3460 3470 3480
pF1KE0 AIKNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADITVTSSKALRTLEQARQLATKFQS
.:: :. : ::: : ::.:. :... . .: .: . : .:: ..
CCDS47 VIK---ILI--TIVEEVETLRQERLSFSGLRAPVPASELLASGVL-SRAQFEQLKDG-KT
3260 3270 3280 3290 3300
3490 3500 3510 3520 3530 3540
pF1KE0 TYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVMEHRLVLDTVNEVSRAL
: ..:. : :. : :: . : . ..: :.:.. :. :. . :
CCDS47 TVKDLSE-LGSVRTLLQGSGCLAG----IYLEDTKEKVSIYEAMRRGLLRATTAAL---L
3310 3320 3330 3340 3350
3550 3560 3570 3580 3590 3600
pF1KE0 LELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQQYEQAADAELAWVAE
:: .: :. ::. . .: : ... :.. . .:: .:: : .
CCDS47 LEA---QAATGF--LVDPVRNQRLYVHEAV-------KAGVVGPELHEQLLSAEKA--VT
3360 3370 3380 3390 3400
3610 3620 3630 3640 3650
pF1KE0 TKRKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHKDSMDELFSHRSEI-----FGTC
: .. . : : : . . . :... . : .: . ::: . :
CCDS47 GYRDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGIIDPVHSHRVPVDVAYQRGYF
3410 3420 3430 3440 3450 3460
3660 3670 3680 3690 3700 3710
pF1KE0 GEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWETYEELSPWIEETRAL
.::.. :: . ... .. . : ::: :.. :: .: : .:
CCDS47 SEEMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC---VEDP-ETGLRLLPLKGAEKAE
3470 3480 3490 3500 3510
3720 3730 3740 3750 3760 3770
pF1KE0 IAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQLKELNPEEGEMVEEKY
... . . .:. :. :: . . . : .: .. . ..: :::
CCDS47 VVET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEV--MQSDLIPEE--------
3520 3530 3540 3550 3560
3780 3790 3800 3810 3820 3830
pF1KE0 QKAENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLETLENLSSRLRMPPLIP
:.:. : : . ...: . . . ..:.: . . : . . . :: :.
CCDS47 QRAQLMADFQAGRVTKERMIIIIIEIIEKTEIIR-----QQGLASYDYVRRRLTAEDLFE
3570 3580 3590 3600 3610 3620
3840 3850 3860 3870 3880 3890
pF1KE0 AEVDKIR--ECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGADKDLAAKEIQDKLD
:.. ... . . .. . : . . .. : : :. . :. : . :
CCDS47 ARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGVYLPGSRQTLS---IYQALK
3630 3640 3650 3660 3670
3900 3910 3920 3930 3940
pF1KE0 QMVFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAALLTTI-KDTQDIVHDLESP--G
. .. : . : . .:: .. .:.. : :. . . .: . . : :
CCDS47 KGLLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAVRKGLVGPELHDRLLSAERAVTG
3680 3690 3700 3710 3720 3730
3950 3960 3970 3980 3990 4000
pF1KE0 IDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKSID-EMNNA
.: . ...:.: .: : :.: :.: : : :.. . :.
CCDS47 YRDPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL--ATGGIVDPRLGFHLPLEVAYQ
3740 3750 3760 3770 3780 3790
4010 4020 4030 4040 4050 4060
pF1KE0 WENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDLNTVKDQL
::: ...: . . ... :. . . . : .. : :: . :
CCDS47 RGYLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL----LRRCRRDD-GTGQLLL--PL
3800 3810 3820 3830 3840
4070 4080 4090 4100 4110 4120
pF1KE0 NEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWENLGEKIAH
.. ... . ..:: :: ::. ... ::. .:: :: .... .::
CCDS47 SDARKLTFRGLRKQITME------ELVRSQVMDEATALQLREGLTSIEEVTKNL------
3850 3860 3870 3880 3890
4130 4140 4150 4160 4170 4180
pF1KE0 RQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKHHVLKNDV
:. :::. : : : .: .: .. . :: .. ...:.. : .:. . .
CCDS47 -QKFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRPGTA-FELLEAQAATGYVI-DPI
3900 3910 3920 3930 3940
4190 4200 4210 4220 4230 4240
pF1KE0 LAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQLQSTLQQ
. . ::: . . :
CCDS47 KGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGKLISLFQAMKKGLILKDHGI
3950 3960 3970 3980 3990 4000
>>CCDS43771.1 PLEC gene_id:5339|Hs108|chr8 (4525 aa)
initn: 3776 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4728; 29.0% identity (59.1% similar) in 4259 aa overlap (62-4199:1-3972)
40 50 60 70 80
pF1KE0 GSLSPCPPGDTLPWNLPLHEQKKRKSQDSVLDPA---ERAVVRVADERDRVQKKTFTKWV
.::. . . . :::::::::::::::
CCDS43 MDPSRAIQNEISSLKDERDRVQKKTFTKWV
10 20 30
90 100 110 120 130 140
pF1KE0 NKHLMKVRKHINDLYEDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQIALDFLKQ
::::.:...::.::::::::::::::::::::: .:::::::::::.:::::::::.:..
CCDS43 NKHLIKAQRHISDLYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALDYLRH
40 50 60 70 80 90
150 160 170 180 190 200
pF1KE0 RQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLLLWTQKVT
:::::::::::::.::::::::::::::::::::::: .::.: ::.::::::::.:...
CCDS43 RQVKLVNIRNDDIADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWSQRMV
100 110 120 130 140 150
210 220 230 240 250 260
pF1KE0 AGYTGIKCTNFSSCWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEVAER-LGV
:: :..: ::.: : ::..:::.:::..: :.::..: :.: :::.::: :::: :::
CCDS43 EGYQGLRCDNFTSSWRDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSVAERDLGV
160 170 180 190 200 210
270 280 290 300 310 320
pF1KE0 TRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQSRVDSLI
::::: ::::::.:::::.::::::.:::.:.::. .:. :.:.. :::::. : :.
CCDS43 TRLLDPEDVDVPQPDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELVLLLL
220 230 240 250 260 270
330 340 350 360 370 380
pF1KE0 PWIKQHTILMSDKTFPQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKLLEVWIEF
:...:: . .. ::.. :.. :..:...::: :. ::: .:.: . .:. :: ..
CCDS43 QWMRHHTAAFEERRFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEGAVQA
280 290 300 310 320 330
390 400 410 420 430 440
pF1KE0 GRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEKL
:..:.: :::: :::.::::: . .:::::.:: :::: : .:..:.: : :::.:
CCDS43 GQLKVPPGYHPLDVEKEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEAGLCEEQL
340 350 360 370 380 390
450 460 470 480 490 500
pF1KE0 TLAKNTLQADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELAF
. : ::.:. : .:. : ..: ... ...:: : :.: :.: . : :..
CCDS43 NQADALLQSDVRLLAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHPQGEQMYR
400 410 420 430 440 450
510 520 530 540 550 560
pF1KE0 RVMRLQDELVTLRLECTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSSSTSWFRK
::.::...::..: : :: :. : : :.... . : :.
CCDS43 RVYRLHERLVAIRTE-YNLRLKAGV-----------------AAPATQVAQVTLQSVQRR
460 470 480 490
570 580 590 600 610 620
pF1KE0 PMTRAELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIHT
: :: ....::.. .::.:::: : ... :::: :::::: :: ... .:
CCDS43 P----EL-------EDSTLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLGSHRGLHQ
500 510 520 530 540
630 640 650 660 670 680
pF1KE0 SVEELGSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFVS
:.::. .....:: ::..: . .: . ::.:. :: :: ..:. :.: :.:::.::.
CCDS43 SIEEFRAKIERARSDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLHSFVA
550 560 570 580 590 600
690 700 710 720 730 740
pF1KE0 RATAELIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELLS
:: ::.:::::::::...:::: :.:..::.. .: : ::: :. .. ::.... :
CCDS43 AATKELMWLNEKEEEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAGDRLL
610 620 630 640 650 660
750 760 770 780 790 800
pF1KE0 LENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQD
:.:::. :::...::.:.: .:: ::: :.: :.:::.::::::::.:: :. :..::.
CCDS43 REDHPARPTVESFQAALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEGQLQKLQE
670 680 690 700 710 720
810 820 830 840 850 860
pF1KE0 SIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHVL
...::::::......::::::::..:::::: . :. ...:. :.:..:::::: : : .
CCDS43 ALRRKYSCDRSATVTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHPAHPM
730 740 750 760 770 780
870 880 890 900 910 920
pF1KE0 KNTISVKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPNK
.. . . :::::.:.:.:. :.::: : .: ..:::.: .:.:: :::::::.::::.
CCDS43 RGRLPLLAVCDYKQVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVPPPNQ
790 800 810 820 830 840
930 940 950 960 970 980
pF1KE0 DAIEMASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGECH
.: : ..:.: ..: ...:::::::. :::..:. ::.:..:...:.: .:. : : .
CCDS43 EAQEAVTRLEAQHQALVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKPEEQR
850 860 870 880 890 900
990 1000 1010 1020 1030 1040
pF1KE0 QIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVAK
: ...:. ::. ::.::.:. :. ::: :.: .:. ..:.:..:.:. .::. .
CCDS43 QALHSLELHYQAFLRDSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGAQEESRCQ
910 920 930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KE0 MYISELKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRSD
:::::.:::.:: : :.:.:.. : :.. .. : :::::...: ... : .
CCDS43 RCISELKDIRLQLEACETRTVHRLR-LP---LDKEPARECAQRIAEQQKAQAEVEGLGKG
970 980 990 1000 1010
1110 1120 1130 1140 1150 1160
pF1KE0 LDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSIQ
. .: . .. : : ..:::::::.: . :...: .::..::.::::.....:. :
CCDS43 VARLSAEAEKVLALPEPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVIRGTQ
1020 1030 1040 1050 1060 1070
1170 1180 1190 1200 1210 1220
pF1KE0 DAELLVKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKVV
:: .....: .:.. ..: : : ::: ..:.. .... .. .:..: .:. :. :
CCDS43 GAEEVLRAHEEQLKEAQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDELRGAQEV
1080 1090 1100 1110 1120 1130
1230 1240 1250 1260 1270 1280
pF1KE0 AEQMSRLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGTL
.:.... ::....::..:. .:: :::. :.:: ..:: :::.. . : :: :
CCDS43 GERLQQRHGERDVEVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRESADPL
1140 1150 1160 1170 1180 1190
1290 1300 1310 1320 1330 1340
pF1KE0 IKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTIV
:.... .::... ::... ::: :. ::. ::::. :...::.:..:: . .
CCDS43 GAWLQDARRRQEQIQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQYINAI
1200 1210 1220 1230 1240 1250
1350 1360 1370 1380 1390 1400
pF1KE0 KDYELQLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYIS
:::::::.:::: .: ::.:. .. :.:... ::..::::.:. :.:::.:..:.::
CCDS43 KDYELQLVTYKAQLEPVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTSQYIKFIS
1260 1270 1280 1290 1300 1310
1410 1420 1430 1440 1450 1460
pF1KE0 DALRRLEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKAILEQ
..:::.::::...:... :. :.. :. ..: .. : . ...: ... : : :
CCDS43 ETLRRMEEEERLAEQQRAEERERLAEV---EAALEKQRQLAEAHAQAKAQAEREAKEL-Q
1320 1330 1340 1350 1360 1370
1470 1480 1490 1500 1510 1520
pF1KE0 QVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCDGSAN
: ..::.. ..: . .: ...:..:.:.:. : .. . .
CCDS43 QRMQEEVVRREEAAVDA----------------QQQKRSIQEELQQLRQSSE-----AEI
1380 1390 1400 1410
1530 1540 1550 1560 1570 1580
pF1KE0 QLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ---QDLSA
: . :.. :.... . .... . . ::: : :: : . ..:. . : .:
CCDS43 QAKARQAEAAERSRLR-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEAEAQKRQA
1420 1430 1440 1450 1460 1470
1590 1600 1610 1620 1630 1640
pF1KE0 LQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAKEQYE
.. . ...::. : . . . ... ... : . : : : ::.: ::.:
CCDS43 QEEAERLRRQVQDESQRKRQAEVELASRVKAEAEAAREK--QRALQALEELRLQAEEA--
1480 1490 1500 1510 1520
1650 1660 1670 1680 1690 1700
pF1KE0 ALQEETRVAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGGQLLT
: :. : :.:.: . :: . .: :: ..:. .: . . .::
CCDS43 ----ERRLRQAEVERARQVQVALETAQRSAEAEL-QSKR---------ASFAEKTAQLER
1530 1540 1550 1560 1570
1710 1720 1730 1740 1750
pF1KE0 NLPGMEQLSGASL----EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARHQ-ELLSQ
.: :... :.: :. : . ... . ..: ..:. : : .. : : : ..:
CCDS43 SLQ-EEHVAVAQLREEAERRAQQQAEAERAREEAERELERWQLKANEALRLRLQAEEVAQ
1580 1590 1600 1610 1620 1630
1760 1770 1780 1790 1800 1810
pF1KE0 QQNFILAT---QSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELKQVQT
:... : :. .: . . .. ::: . :..:.: . . . .::.. :. : .
CCDS43 QKSLAQAEAEKQKEEAEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTAQ--QRLA
1640 1650 1660 1670 1680
1820 1830 1840 1850 1860 1870
pF1KE0 LQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISHKGDL
..:: .. . .. :. . :.:: ... :. . ::: . .. . ....
CCDS43 AEQELIRLRAETEQGEQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAELAKVRAEM
1690 1700 1710 1720 1730 1740
1880 1890 1900 1910 1920 1930
pF1KE0 RFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLLG
. . : . . .:.. :: . :..:. . :. : . .:: . :.
CCDS43 EVLLASKAR------AEEESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA-----LA
1750 1760 1770 1780
1940 1950 1960 1970 1980 1990
pF1KE0 QYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQVPVE
. . : . .: : :: :..:.. .:. . . . . :.:. ::. :
CCDS43 EEAKRQRQLAEEDAARQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEAEN----E
1790 1800 1810 1820 1830 1840
2000 2010 2020 2030 2040
pF1KE0 KLQKVARDIM----EIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LLQKAIAQS
.:...:.: ..: . : . ..: :..... : : ::.. :.. .. :
CCDS43 RLRRLAEDEAFQRRRLEEQAAQHKADIEER----LAQLRKASDSELERQKGLVEDTLRQR
1850 1860 1870 1880 1890
2050 2060 2070 2080 2090 2100
pF1KE0 QSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATRE
..:.: . .: :. :. :: : : :. ... ..... :::.:.
CCDS43 RQVEEEILALKASF---EKAAAGKAELELELGRIRSNAEDTLR-----SKEQAELEAARQ
1900 1910 1920 1930 1940 1950
2110 2120 2130 2140 2150 2160
pF1KE0 MVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKLQ
:: . . :. .: .. ..: . : : ..: .:.
CCDS43 ----------RQLAAEEERRRREAEERVQKSLAAEEEAARQRKAALEEVE-------RLK
1960 1970 1980 1990
2170 2180 2190 2200 2210 2220
pF1KE0 QFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGFALDL
.:. :. ..: . .. :. . :. :.. . . .... ::.. :
CCDS43 AKVEEARRLRERAEQESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQT-----L
2000 2010 2020 2030 2040
2230 2240 2250 2260 2270 2280
pF1KE0 CQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSIPPTE
:.:. ...:: . .....: :. . ... . :. :. .. ::.. :
CCDS43 QQEQSVLDQLRGEAEAARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA-----EE
2050 2060 2070 2080 2090 2100
2290 2300 2310 2320 2330 2340
pF1KE0 TSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQGKTDLTE
... . . :.:.. .. :.. . .:. . . . :: : . ..
CCDS43 QAQARAQAQAAAEKLRKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQTLRQKAQ
2110 2120 2130 2140 2150 2160
2350 2360 2370 2380 2390 2400
pF1KE0 IQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEANSVLQWLES---KEEVLKSM
.. ... . :. :. . .: :: . . :. .. ..: . : : . : :...
CCDS43 VEQELTTLRLQLEETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQMEELSKL
2170 2180 2190 2200 2210 2220
2410 2420 2430 2440 2450 2460
pF1KE0 DAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEAENWKKIQ
: . . . .... :: : .. :...: : : : :. .::: ...
CCDS43 KARIEAENRALILRDKDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEAARLRQLA
2230 2240 2250 2260 2270
2470 2480 2490 2500 2510 2520
pF1KE0 EELNSRWERATEVTVARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLGPLSIDPN
:: .. . .: . .. : . :..: ::..: ..::: . :. : .
CCDS43 EEDLAQQRALAEKMLKEKMQAVQEATRLK----AEAEL--LQQQKELAQEQARRLQEDKE
2280 2290 2300 2310 2320
2530 2540 2550 2560 2570 2580
pF1KE0 MLNAQ-KQQVQFMLKEFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQSINQKWV
.. : ...: . . .::.::.. ... :. . ...: . ...... : . ..
CCDS43 QMAQQLAEETQGFQRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQRFRKQAE
2330 2340 2350 2360 2370 2380
2590 2600 2610 2620 2630
pF1KE0 ELTDKLNSR--SSQIDQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQPEAVKQQ
:. .::. ..: ..:.. . :. .: .:..: . .: .. . : :: :
CCDS43 EIGEKLHRTELATQEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQQEAKLLQ
2390 2400 2410 2420 2430 2440
2640 2650 2660 2670 2680 2690
pF1KE0 LEETSEIRSDLEQLDHEVKEAQT--LCDELSVLIGEQYLKDELKKRLET-----VALPLQ
:. . ::: .:.. : : .. :.: :.....: : .:: :: :
CCDS43 LKSEEMQTVQQEQLLQETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQDEVAKAQQ
2450 2460 2470 2480 2490 2500
2700 2710 2720 2730 2740
pF1KE0 GLED-------LAADRINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAKNCP--IS
:. . .: .:: :.. ... :. .: .: .. :. :: .. ..
CCDS43 LREEQQRQQQQMEQER-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRRQQEELLA
2510 2520 2530 2540 2550 2560
2750 2760 2770 2780 2790 2800
pF1KE0 AKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKNH
. .::. ::: :: ... :: : ..: . ..: :.. .: ..
CCDS43 EENQRLREQLQLLEEQHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAAEAEPEHS
2570 2580 2590 2600 2610 2620
2810 2820 2830 2840 2850
pF1KE0 WEELSKKTADRQSRLKDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSL
.. : .:.. .::.. . .:.. : .. . : :. ..: : : .::.
CCDS43 FDGLRRKVS--AQRLQEAGILSAEELQRLAQGHTT--VDELARREDVRHYL---QGRSSI
2630 2640 2650 2660 2670
2860 2870 2880 2890 2900 2910
pF1KE0 --LRSKAMLNEVEKRRSLLEILNS--AADILINSSEADE---DGIRDEKAGINQNMD--A
: :: ... .: . : : .: ::.... :. : .:... .:. . .
CCDS43 AGLLLKATNEKLSVYAALQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVNEAVKEGV
2680 2690 2700 2710 2720 2730
2920 2930 2940 2950 2960
pF1KE0 VTEELQAKTGSLEEMTQRLREFQES-----FKNIEKKVEGAKHQLEIFDALGSQACSNKN
: ::. : : :. . .. . :. ..: . .: .....: : ..
CCDS43 VGPELHHKLLSAERAVTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---QIATGGV
2740 2750 2760 2770 2780 2790
2970 2980 2990 3000 3010 3020
pF1KE0 LEKLRAQQEVLQALEPQVDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-EFLEVKQR
.. ..... . .: : :. : . . . : :: .. . . .. .. .:.. .:
CCDS43 IDPVHSHR-----VPVDVAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQLLER
2800 2810 2820 2830 2840
3030 3040 3050 3060 3070
pF1KE0 V----NSG-CVM-MENKLEGIGQF---HCRVREMFSQL---ADLDDELDGMGAIGRDTDS
..: :.. . .: :.. ..:..: . : . .: . .:
CCDS43 CVEDPETGLCLLPLTDKAAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVTIWEIINS
2850 2860 2870 2880 2890 2900
3080 3090 3100 3110 3120
pF1KE0 LQSQIEDVRLFLNKIHVLKLDIEASEAECRHMLEEE---GTLDLLGLKRELEALNKQCGK
:. : .: .... .. .: ..::. : : . ::. . : . ..
CCDS43 EYFTAEQRRDLLRQFRTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAELLESR
2910 2920 2930 2940 2950 2960
3130 3140 3150 3160 3170 3180
pF1KE0 LTERGKARQEQLELTLGRVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQLADF
. .: .: : : : :... . .. :. . .. . ..:. .: .:.:. .
CCDS43 VIDR------ELYQQLQRGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQKLSIY
2970 2980 2990 3000 3010
3190 3200 3210 3220 3230 3240
pF1KE0 KMFQKEQVDPLQMK---LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINARWNTLNK
. ..:. . : .: :. : :. . ... : .... . :.. . . .:
CCDS43 NALKKDLL-PSDMAVALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHEKLLSAEK
3020 3030 3040 3050 3060 3070
3250 3260 3270 3280 3290
pF1KE0 KVA-QRIAQLQEALLHCGKFQDALEP------LLSWLADTEELIANQKPPSAEYKVVKAQ
:. : ... .. .: : ::. .: .. .: . :. :.
CCDS43 AVTGYRDPYTGQSVSLFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDVACAR
3080 3090 3100 3110 3120 3130
3300 3310 3320 3330 3340 3350
pF1KE0 IQEQKLLQRLLDDRKATVDMLQAEG-GRIAQSAELADREKITGQLESLESRWTELLSKAA
.. .: :. .: . . . :. : .:: .: . :: .: : :::
CCDS43 GCLDEETSRALSAPRADAKAYSDPSTGEPATYGELQQRCR-PDQLTGLS--LLPLSEKAA
3140 3150 3160 3170 3180 3190
3360 3370 3380 3390 3400
pF1KE0 -ARQKQLEDILVLAKQFHETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQQQIIRHK
:::..: . : . :..: :.. : .:: .: .:: ::. .:...:
CCDS43 RARQEELYSELQARETFEKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQRQELLR--
3200 3210 3220 3230 3240 3250
3410 3420 3430 3440 3450 3460
pF1KE0 ALNEEIVNRKKNVDQAIKNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADITVTSSKAL
.. . : .:...:: :. : ::: : ::.:. :... . .: .:
CCDS43 ----QFRTGKVTVEKVIK---ILI--TIVEEVETLRQERLSFSGLRAPVPASELLASGVL
3260 3270 3280 3290 3300
3470 3480 3490 3500 3510 3520
pF1KE0 RTLEQARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVME
. : .:: ..: ..:. : :. : :: . : : . ..: :.:.
CCDS43 -SRAQFEQLKDG-KTTVKDLSE-LGSVRTLLQGSGCLA--G--IYLEDTKEKVSIYEAMR
3310 3320 3330 3340 3350
3530 3540 3550 3560 3570 3580
pF1KE0 HRLVLDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQ
. :. :. . ::: .: :. ::. . .: : ... :.. .
CCDS43 RGLLRATTAAL---LLEA---QAATGF--LVDPVRNQRLYVHEAV-------KAGVVGPE
3360 3370 3380 3390
3590 3600 3610 3620 3630 3640
pF1KE0 QYEQAADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHKDSMDELF
.:: .:: : . : .. . : : : . . . :... . : .: .
CCDS43 LHEQLLSAEKA--VTGYRDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGIIDPVH
3400 3410 3420 3430 3440 3450
3650 3660 3670 3680 3690
pF1KE0 SHRSEI-----FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWE
::: . : .::.. :: . ... .. . : ::: :.. :
CCDS43 SHRVPVDVAYQRGYFSEEMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC---VEDP-E
3460 3470 3480 3490 3500 3510
3700 3710 3720 3730 3740 3750
pF1KE0 TYEELSPWIEETRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQL
: .: : .: ... . . .:. :. :: . . . : .: .. .
CCDS43 TGLRLLPLKGAEKAEVVET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEV--MQ
3520 3530 3540 3550 3560 3570
3760 3770 3780 3790 3800 3810
pF1KE0 KELNPEEGEMVEEKYQKAENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLET
..: ::: :.:. : : . ...: . . . ..:.: . . : .
CCDS43 SDLIPEE--------QRAQLMADFQAGRVTKERMIIIIIEIIEKTEIIR-----QQGLAS
3580 3590 3600 3610
3820 3830 3840 3850 3860 3870
pF1KE0 LENLSSRLRMPPLIPAEVDKIR--ECISDNKSATVELEKLQPSFEALKRRGEELIGRSQG
. . :: :. :.. ... . . .. . : . . .. : : :
CCDS43 YDYVRRRLTAEDLFEARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGVYLPG
3620 3630 3640 3650 3660 3670
3880 3890 3900 3910 3920 3930
pF1KE0 ADKDLAAKEIQDKLDQMVFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAALLTTI-K
. . :. : . : . .. : . : . .:: .. .:.. : :. .
CCDS43 SRQTLS---IYQALKKGLLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAVRKGLVGP
3680 3690 3700 3710 3720 3730
3940 3950 3960 3970 3980 3990
pF1KE0 DTQDIVHDLESP--GIDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETE
. .: . . : : .: . ...:.: .: : :.: :.: : :
CCDS43 ELHDRLLSAERAVTGYRDPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL--ATGGIV
3740 3750 3760 3770 3780
4000 4010 4020 4030 4040 4050
pF1KE0 KPEVRKSID-EMNNAWENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCT
:.. . :. ::: ...: . . ... :. . . . : .. :
CCDS43 DPRLGFHLPLEVAYQRGYLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL----LRRCR
3790 3800 3810 3820 3830 3840
4060 4070 4080 4090 4100 4110
pF1KE0 MPPVGTDLNTVKDQLNEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLT
:: . . :.. ... . ..:: :: ::. ... ::. .:: ::
CCDS43 RDD-GT--GQLLLPLSDARKLTFRGLRKQITME------ELVRSQVMDEATALQLREGLT
3850 3860 3870 3880 3890
4120 4130 4140 4150 4160 4170
pF1KE0 ELKHLWENLGEKIAHRQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKV
.... .:: :. :::. : : : .: .: .. . :: .. ..
CCDS43 SIEEVTKNL-------QKFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRPGTA-FEL
3900 3910 3920 3930 3940
4180 4190 4200 4210 4220 4230
pF1KE0 IEVELAKHHVLKNDVLAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQ
.:.. : .:. . . . . ::: . . :
CCDS43 LEAQAATGYVI-DPIKGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGKLISL
3950 3960 3970 3980 3990 4000
>>CCDS43770.1 PLEC gene_id:5339|Hs108|chr8 (4533 aa)
initn: 3776 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4723; 29.1% identity (59.1% similar) in 4260 aa overlap (58-4199:9-3980)
30 40 50 60 70 80
pF1KE0 SERSGSLSPCPPGDTLPWNLPLHEQKKRKSQDSVLDPAERAVVRVADERDRVQKKTFTKW
:: . . :.. . ::::::::::::::
CCDS43 MAGPLPDEQDFI-QAYEEVREKYKDERDRVQKKTFTKW
10 20 30
90 100 110 120 130 140
pF1KE0 VNKHLMKVRKHINDLYEDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQIALDFLK
:::::.:...::.::::::::::::::::::::: .:::::::::::.:::::::::.:.
CCDS43 VNKHLIKAQRHISDLYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALDYLR
40 50 60 70 80 90
150 160 170 180 190 200
pF1KE0 QRQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLLLWTQKV
.:::::::::::::.::::::::::::::::::::::: .::.: ::.::::::::.:..
CCDS43 HRQVKLVNIRNDDIADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWSQRM
100 110 120 130 140 150
210 220 230 240 250 260
pF1KE0 TAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEVAER-LG
. :: :..: ::.: : ::..:::.:::..: :.::..: :.: :::.::: :::: ::
CCDS43 VEGYQGLRCDNFTSSWRDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSVAERDLG
160 170 180 190 200 210
270 280 290 300 310 320
pF1KE0 VTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQSRVDSL
:::::: ::::::.:::::.::::::.:::.:.::. .:. :.:.. :::::. : :
CCDS43 VTRLLDPEDVDVPQPDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELVLLL
220 230 240 250 260 270
330 340 350 360 370 380
pF1KE0 IPWIKQHTILMSDKTFPQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKLLEVWIE
. :...:: . .. ::.. :.. :..:...::: :. ::: .:.: . .:. :: ..
CCDS43 LQWMRHHTAAFEERRFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEGAVQ
280 290 300 310 320 330
390 400 410 420 430 440
pF1KE0 FGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEK
:..:.: :::: :::.::::: . .:::::.:: :::: : .:..:.: : :::.
CCDS43 AGQLKVPPGYHPLDVEKEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEAGLCEEQ
340 350 360 370 380 390
450 460 470 480 490 500
pF1KE0 LTLAKNTLQADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELA
:. : ::.:. : .:. : ..: ... ...:: : :.: :.: . : :..
CCDS43 LNQADALLQSDVRLLAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHPQGEQMY
400 410 420 430 440 450
510 520 530 540 550 560
pF1KE0 FRVMRLQDELVTLRLECTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSSSTSWFR
::.::...::..: : :: :. : : :.... . : :
CCDS43 RRVYRLHERLVAIRTE-YNLRLKAGV-----------------AAPATQVAQVTLQSVQR
460 470 480 490
570 580 590 600 610 620
pF1KE0 KPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIH
.: :: :: ..::.. .::.:::: : ... :::: :::::: :: ... .:
CCDS43 RP----EL------ED-STLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLGSHRGLH
500 510 520 530 540
630 640 650 660 670 680
pF1KE0 TSVEELGSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFV
:.::. .....:: ::..: . .: . ::.:. :: :: ..:. :.: :.:::.::
CCDS43 QSIEEFRAKIERARSDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLHSFV
550 560 570 580 590 600
690 700 710 720 730 740
pF1KE0 SRATAELIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELL
. :: ::.:::::::::...:::: :.:..::.. .: : ::: :. .. ::.... :
CCDS43 AAATKELMWLNEKEEEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAGDRL
610 620 630 640 650 660
750 760 770 780 790 800
pF1KE0 SLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQ
:.:::. :::...::.:.: .:: ::: :.: :.:::.::::::::.:: :. :..::
CCDS43 LREDHPARPTVESFQAALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEGQLQKLQ
670 680 690 700 710 720
810 820 830 840 850 860
pF1KE0 DSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHV
....::::::......::::::::..:::::: . :. ...:. :.:..:::::: : :
CCDS43 EALRRKYSCDRSATVTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHPAHP
730 740 750 760 770 780
870 880 890 900 910 920
pF1KE0 LKNTISVKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPN
... . . :::::.:.:.:. :.::: : .: ..:::.: .:.:: :::::::.::::
CCDS43 MRGRLPLLAVCDYKQVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVPPPN
790 800 810 820 830 840
930 940 950 960 970 980
pF1KE0 KDAIEMASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGEC
..: : ..:.: ..: ...:::::::. :::..:. ::.:..:...:.: .:. : :
CCDS43 QEAQEAVTRLEAQHQALVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKPEEQ
850 860 870 880 890 900
990 1000 1010 1020 1030 1040
pF1KE0 HQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVA
.: ...:. ::. ::.::.:. :. ::: :.: .:. ..:.:..:.:. .::.
CCDS43 RQALHSLELHYQAFLRDSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGAQEESRC
910 920 930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KE0 KMYISELKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRS
. :::::.:::.:: : :.:.:.. : :.. .. : :::::...: ... : .
CCDS43 QRCISELKDIRLQLEACETRTVHRLR-LP---LDKEPARECAQRIAEQQKAQAEVEGLGK
970 980 990 1000 1010 1020
1110 1120 1130 1140 1150 1160
pF1KE0 DLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSI
. .: . .. : : ..:::::::.: . :...: .::..::.::::.....:.
CCDS43 GVARLSAEAEKVLALPEPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVIRGT
1030 1040 1050 1060 1070 1080
1170 1180 1190 1200 1210 1220
pF1KE0 QDAELLVKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKV
: :: .....: .:.. ..: : : ::: ..:.. .... .. .:..: .:. :.
CCDS43 QGAEEVLRAHEEQLKEAQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDELRGAQE
1090 1100 1110 1120 1130 1140
1230 1240 1250 1260 1270 1280
pF1KE0 VAEQMSRLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGT
:.:.... ::....::..:. .:: :::. :.:: ..:: :::.. . : ::
CCDS43 VGERLQQRHGERDVEVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRESADP
1150 1160 1170 1180 1190 1200
1290 1300 1310 1320 1330 1340
pF1KE0 LIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTI
: :.... .::... ::... ::: :. ::. ::::. :...::.:..:: .
CCDS43 LGAWLQDARRRQEQIQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQYINA
1210 1220 1230 1240 1250 1260
1350 1360 1370 1380 1390 1400
pF1KE0 VKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYI
.:::::::.:::: .: ::.:. .. :.:... ::..::::.:. :.:::.:..:.:
CCDS43 IKDYELQLVTYKAQLEPVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTSQYIKFI
1270 1280 1290 1300 1310 1320
1410 1420 1430 1440 1450 1460
pF1KE0 SDALRRLEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKAILE
:..:::.::::...:... :. :.. :. ..: .. : . ...: ... : :
CCDS43 SETLRRMEEEERLAEQQRAEERERLAEVE---AALEKQRQLAEAHAQAKAQAEREAKEL-
1330 1340 1350 1360 1370
1470 1480 1490 1500 1510 1520
pF1KE0 QQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCDGSA
:: ..::.. ..: . .: ...:..:.:.:. : .. . .
CCDS43 QQRMQEEVVRREEAAVDA----------------QQQKRSIQEELQQLRQSSE-----AE
1380 1390 1400 1410
1530 1540 1550 1560 1570 1580
pF1KE0 NQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ---QDLS
: . :.. :.... . .... . . ::: : :: : . ..:. . : .
CCDS43 IQAKARQAEAAERSRLR-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEAEAQKRQ
1420 1430 1440 1450 1460 1470
1590 1600 1610 1620 1630 1640
pF1KE0 ALQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAKEQY
: .. . ...::. : . . . ... ... : . : : : ::.: ::.:
CCDS43 AQEEAERLRRQVQDESQRKRQAEVELASRVKAEAEAAREK--QRALQALEELRLQAEEA-
1480 1490 1500 1510 1520 1530
1650 1660 1670 1680 1690 1700
pF1KE0 EALQEETRVAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGGQLL
: :. : :.:.: . :: . .: :: ..:. .: . . .::
CCDS43 -----ERRLRQAEVERARQVQVALETAQRSAEAEL-QSKR---------ASFAEKTAQLE
1540 1550 1560 1570
1710 1720 1730 1740 1750
pF1KE0 TNLPGMEQLSGASL----EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARHQ-ELLS
.: :... :.: :. : . ... . ..: ..:. : : .. : : : ..
CCDS43 RSLQ-EEHVAVAQLREEAERRAQQQAEAERAREEAERELERWQLKANEALRLRLQAEEVA
1580 1590 1600 1610 1620 1630
1760 1770 1780 1790 1800 1810
pF1KE0 QQQNFILAT---QSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELKQVQ
::... : :. .: . . .. ::: . :..:.: . . . .::.. :. :
CCDS43 QQKSLAQAEAEKQKEEAEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTAQ--QRL
1640 1650 1660 1670 1680 1690
1820 1830 1840 1850 1860 1870
pF1KE0 TLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISHKGD
. ..:: .. . .. :. . :.:: ... :. . ::: . .. . ...
CCDS43 AAEQELIRLRAETEQGEQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAELAKVRAE
1700 1710 1720 1730 1740
1880 1890 1900 1910 1920 1930
pF1KE0 LRFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLL
.. . : .. . :.. :: . :..:. . :. : . .:: . :
CCDS43 MEVLLASKARAEE------ESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA-----L
1750 1760 1770 1780 1790
1940 1950 1960 1970 1980 1990
pF1KE0 GQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQVPV
.. . : . .: : :: :..:.. .:. . . . . :.:. ::.
CCDS43 AEEAKRQRQLAEEDAARQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEAEN----
1800 1810 1820 1830 1840
2000 2010 2020 2030 2040
pF1KE0 EKLQKVARDIM----EIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LLQKAIAQ
:.:...:.: ..: . : . ..: :..... : : ::.. :.. .. :
CCDS43 ERLRRLAEDEAFQRRRLEEQAAQHKADIEER----LAQLRKASDSELERQKGLVEDTLRQ
1850 1860 1870 1880 1890 1900
2050 2060 2070 2080 2090 2100
pF1KE0 SQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATR
..:.: . .: :. :. :: : : :. ... ..... :::.:
CCDS43 RRQVEEEILALKASF---EKAAAGKAELELELGRIRSNAEDTLR-----SKEQAELEAAR
1910 1920 1930 1940 1950
2110 2120 2130 2140 2150 2160
pF1KE0 EMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKL
. :: . . :. .: .. ..: . : : ..: .:
CCDS43 Q----------RQLAAEEERRRREAEERVQKSLAAEEEAARQRKAALEEVE-------RL
1960 1970 1980 1990 2000
2170 2180 2190 2200 2210 2220
pF1KE0 QQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGFALD
. .:. :. ..: . .. :. . :. :.. . . .... ::..
CCDS43 KAKVEEARRLRERAEQESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQT-----
2010 2020 2030 2040 2050
2230 2240 2250 2260 2270 2280
pF1KE0 LCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSIPPT
: :.:. ...:: . .....: :. . ... . :. :. .. ::..
CCDS43 LQQEQSVLDQLRGEAEAARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA-----E
2060 2070 2080 2090 2100
2290 2300 2310 2320 2330 2340
pF1KE0 ETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQGKTDLT
: ... . . :.:.. .. :.. . .:. . . . :: : . .
CCDS43 EQAQARAQAQAAAEKLRKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQTLRQKA
2110 2120 2130 2140 2150 2160
2350 2360 2370 2380 2390 2400
pF1KE0 EIQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEANSVLQWLES---KEEVLKS
... ... . :. :. . .: :: . . :. .. ..: . : : . : :..
CCDS43 QVEQELTTLRLQLEETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQMEELSK
2170 2180 2190 2200 2210 2220
2410 2420 2430 2440 2450 2460
pF1KE0 MDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEAENWKKI
. : . . . .... :: : .. :...: : : : :. .::: ...
CCDS43 LKARIEAENRALILRDKDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEAARLRQL
2230 2240 2250 2260 2270 2280
2470 2480 2490 2500 2510 2520
pF1KE0 QEELNSRWERATEVTVARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLGPLSIDP
:: .. . .: . .. : . :..: ::..: ..::: . :. :
CCDS43 AEEDLAQQRALAEKMLKEKMQAVQEATRL----KAEAELLQ--QQKELAQEQARRLQEDK
2290 2300 2310 2320 2330
2530 2540 2550 2560 2570 2580
pF1KE0 NMLNAQ-KQQVQFMLKEFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQSINQKW
... : ...: . . .::.::.. ... :. . ...: . ...... : . ..
CCDS43 EQMAQQLAEETQGFQRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQRFRKQA
2340 2350 2360 2370 2380 2390
2590 2600 2610 2620 2630
pF1KE0 VELTDKLNSR--SSQIDQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQPEAVKQ
:. .::. ..: ..:.. . :. .: .:..: . .: .. . : ::
CCDS43 EEIGEKLHRTELATQEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQQEAKLL
2400 2410 2420 2430 2440 2450
2640 2650 2660 2670 2680 2690
pF1KE0 QLEETSEIRSDLEQLDHEVKEAQT--LCDELSVLIGEQYLKDELKKRLET-----VALPL
::. . ::: .:.. : : .. :.: :.....: : .:: ::
CCDS43 QLKSEEMQTVQQEQLLQETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQDEVAKAQ
2460 2470 2480 2490 2500 2510
2700 2710 2720 2730
pF1KE0 QGLED-------LAADRINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAKNCP--I
: :. . .: .:: :.. ... :. .: .: .. :. :: .. .
CCDS43 QLREEQQRQQQQMEQER-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRRQQEELL
2520 2530 2540 2550 2560 2570
2740 2750 2760 2770 2780 2790
pF1KE0 SAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKN
. . .::. ::: :: ... :: : ..: . ..: :.. .: ..
CCDS43 AEENQRLREQLQLLEEQHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAAEAEPEH
2580 2590 2600 2610 2620 2630
2800 2810 2820 2830 2840 2850
pF1KE0 HWEELSKKTADRQSRLKDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESS
.. : .:.. . ::.. . .:.. : .. . : :. ..: : : .::
CCDS43 SFDGLRRKVSAQ--RLQEAGILSAEELQRLAQGHTT--VDELARREDVRHYL---QGRSS
2640 2650 2660 2670 2680
2860 2870 2880 2890 2900
pF1KE0 L--LRSKAMLNEVEKRRSLLEILNS--AADILINSSEADE---DGIRDEKAGINQNMD--
. : :: ... .: . : : .: ::.... :. : .:... .:. .
CCDS43 IAGLLLKATNEKLSVYAALQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVNEAVKEG
2690 2700 2710 2720 2730 2740
2910 2920 2930 2940 2950 2960
pF1KE0 AVTEELQAKTGSLEEMTQRLREFQES-----FKNIEKKVEGAKHQLEIFDALGSQACSNK
.: ::. : : :. . .. . :. ..: . .: .....: : ..
CCDS43 VVGPELHHKLLSAERAVTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---QIATGG
2750 2760 2770 2780 2790 2800
2970 2980 2990 3000 3010 3020
pF1KE0 NLEKLRAQQEVLQALEPQVDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-EFLEVKQ
.. ..... . .: : :. : . . . : :: .. . . .. .. .:.. .
CCDS43 VIDPVHSHR-----VPVDVAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQLLE
2810 2820 2830 2840 2850
3030 3040 3050 3060 3070
pF1KE0 RV----NSG-CVM-MENKLEGIGQF---HCRVREMFSQL---ADLDDELDGMGAIGRDTD
: ..: :.. . .: :.. ..:..: . : . .: . .
CCDS43 RCVEDPETGLCLLPLTDKAAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVTIWEIIN
2860 2870 2880 2890 2900 2910
3080 3090 3100 3110 3120
pF1KE0 SLQSQIEDVRLFLNKIHVLKLDIEASEAECRHMLEEE---GTLDLLGLKRELEALNKQCG
: :. : .: .... .. .: ..::. : : . ::. . : . .
CCDS43 SEYFTAEQRRDLLRQFRTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAELLES
2920 2930 2940 2950 2960 2970
3130 3140 3150 3160 3170 3180
pF1KE0 KLTERGKARQEQLELTLGRVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQLAD
.. .: .: : : : :... . .. :. . .. . ..:. .: .:.:.
CCDS43 RVIDR------ELYQQLQRGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQKLSI
2980 2990 3000 3010 3020
3190 3200 3210 3220 3230 3240
pF1KE0 FKMFQKEQVDPLQMK---LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINARWNTLN
.. ..:. . : .: :. : :. . ... : .... . :.. . . .
CCDS43 YNALKKDLL-PSDMAVALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHEKLLSAE
3030 3040 3050 3060 3070 3080
3250 3260 3270 3280 3290
pF1KE0 KKVA-QRIAQLQEALLHCGKFQDALEP------LLSWLADTEELIANQKPPSAEYKVVKA
: :. : ... .. .: : ::. .: .. .: . :. :
CCDS43 KAVTGYRDPYTGQSVSLFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDVACA
3090 3100 3110 3120 3130 3140
3300 3310 3320 3330 3340 3350
pF1KE0 QIQEQKLLQRLLDDRKATVDMLQAEG-GRIAQSAELADREKITGQLESLESRWTELLSKA
. .. .: :. .: . . . :. : .:: .: . :: .: : ::
CCDS43 RGCLDEETSRALSAPRADAKAYSDPSTGEPATYGELQQRCR-PDQLTGL--SLLPLSEKA
3150 3160 3170 3180 3190 3200
3360 3370 3380 3390 3400
pF1KE0 A-ARQKQLEDILVLAKQFHETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQQQIIRH
: :::..: . : . :..: :.. : .:: .: .:: ::. .:...:
CCDS43 ARARQEELYSELQARETFEKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQRQELLR-
3210 3220 3230 3240 3250
3410 3420 3430 3440 3450 3460
pF1KE0 KALNEEIVNRKKNVDQAIKNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADITVTSSKA
.. . : .:...:: :. : ::: : ::.:. :... . .: .
CCDS43 -----QFRTGKVTVEKVIK---ILI--TIVEEVETLRQERLSFSGLRAPVPASELLASGV
3260 3270 3280 3290 3300
3470 3480 3490 3500 3510 3520
pF1KE0 LRTLEQARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVM
: . : .:: ..: ..:. : :. : :: . : : . ..: :.:
CCDS43 L-SRAQFEQLKDG-KTTVKDLSE-LGSVRTLLQGSGCLA--G--IYLEDTKEKVSIYEAM
3310 3320 3330 3340 3350 3360
3530 3540 3550 3560 3570 3580
pF1KE0 EHRLVLDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRS
.. :. :. . ::: .: :. ::. . .: : ... :..
CCDS43 RRGLLRATTAAL---LLEA---QAATGF--LVDPVRNQRLYVHEAV-------KAGVVGP
3370 3380 3390 3400
3590 3600 3610 3620 3630 3640
pF1KE0 QQYEQAADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHKDSMDEL
. .:: .:: : . : .. . : : : . . . :... . : .: .
CCDS43 ELHEQLLSAEKA--VTGYRDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGIIDPV
3410 3420 3430 3440 3450 3460
3650 3660 3670 3680 3690
pF1KE0 FSHRSEI-----FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFW
::: . : .::.. :: . ... .. . : ::: :..
CCDS43 HSHRVPVDVAYQRGYFSEEMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC---VEDP-
3470 3480 3490 3500 3510 3520
3700 3710 3720 3730 3740 3750
pF1KE0 ETYEELSPWIEETRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQ
:: .: : .: ... . . .:. :. :: . . . : .: .. .
CCDS43 ETGLRLLPLKGAEKAEVVET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEV--M
3530 3540 3550 3560 3570
3760 3770 3780 3790 3800 3810
pF1KE0 LKELNPEEGEMVEEKYQKAENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLE
..: ::: :.:. : : . ...: . . . ..:.: . . :
CCDS43 QSDLIPEE--------QRAQLMADFQAGRVTKERMIIIIIEIIEKTEIIR-----QQGLA
3580 3590 3600 3610 3620
3820 3830 3840 3850 3860 3870
pF1KE0 TLENLSSRLRMPPLIPAEVDKIR--ECISDNKSATVELEKLQPSFEALKRRGEELIGRSQ
. . . :: :. :.. ... . . .. . : . . .. : :
CCDS43 SYDYVRRRLTAEDLFEARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGVYLP
3630 3640 3650 3660 3670 3680
3880 3890 3900 3910 3920 3930
pF1KE0 GADKDLAAKEIQDKLDQMVFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAALLTTI-
:. . :. : . : . .. : . : . .:: .. .:.. : :. .
CCDS43 GSRQTLS---IYQALKKGLLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAVRKGLVG
3690 3700 3710 3720 3730 3740
3940 3950 3960 3970 3980 3990
pF1KE0 KDTQDIVHDLESP--GIDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGET
. .: . . : : .: . ...:.: .: : :.: :.: : :
CCDS43 PELHDRLLSAERAVTGYRDPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL--ATGGI
3750 3760 3770 3780 3790
4000 4010 4020 4030 4040
pF1KE0 EKPEVRKSID-EMNNAWENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLC
:.. . :. ::: ...: . . ... :. . . . : .. :
CCDS43 VDPRLGFHLPLEVAYQRGYLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL----LRRC
3800 3810 3820 3830 3840 3850
4050 4060 4070 4080 4090 4100
pF1KE0 TMPPVGTDLNTVKDQLNEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPL
:: . . :.. ... . ..:: :: ::. ... ::. .:: :
CCDS43 RRDD-GT--GQLLLPLSDARKLTFRGLRKQITME------ELVRSQVMDEATALQLREGL
3860 3870 3880 3890 3900
4110 4120 4130 4140 4150 4160
pF1KE0 TELKHLWENLGEKIAHRQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPK
: .... .:: :. :::. : : : .: .: .. . :: .. .
CCDS43 TSIEEVTKNL-------QKFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRPGTA-FE
3910 3920 3930 3940 3950
4170 4180 4190 4200 4210 4220
pF1KE0 VIEVELAKHHVLKNDVLAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVL
..:.. : .:. . . . . ::: . . :
CCDS43 LLEAQAATGYVI-DPIKGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGKLIS
3960 3970 3980 3990 4000 4010
>>CCDS43773.1 PLEC gene_id:5339|Hs108|chr8 (4547 aa)
initn: 3775 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4721; 29.1% identity (59.1% similar) in 4242 aa overlap (74-4199:38-3994)
50 60 70 80 90 100
pF1KE0 PWNLPLHEQKKRKSQDSVLDPAERAVVRVADERDRVQKKTFTKWVNKHLMKVRKHINDLY
:::::::::::::::::::.:...::.:::
CCDS43 FPSLVVVGHVVTLAAVWHWRRGRRWAQDEQDERDRVQKKTFTKWVNKHLIKAQRHISDLY
10 20 30 40 50 60
110 120 130 140 150 160
pF1KE0 EDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQIALDFLKQRQVKLVNIRNDDITD
:::::::::::::::::: .:::::::::::.:::::::::.:..:::::::::::::.:
CCDS43 EDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALDYLRHRQVKLVNIRNDDIAD
70 80 90 100 110 120
170 180 190 200 210 220
pF1KE0 GNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLLLWTQKVTAGYTGIKCTNFSSCW
:::::::::::::::::::::: .::.: ::.::::::::.:... :: :..: ::.: :
CCDS43 GNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWSQRMVEGYQGLRCDNFTSSW
130 140 150 160 170 180
230 240 250 260 270 280
pF1KE0 SDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEVAER-LGVTRLLDAEDVDVPSPD
::..:::.:::..: :.::..: :.: :::.::: :::: :::::::: ::::::.::
CCDS43 RDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSVAERDLGVTRLLDPEDVDVPQPD
190 200 210 220 230 240
290 300 310 320 330 340
pF1KE0 EKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQSRVDSLIPWIKQHTILMSDKTF
:::.::::::.:::.:.::. .:. :.:.. :::::. : :. :...:: . .. :
CCDS43 EKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELVLLLLQWMRHHTAAFEERRF
250 260 270 280 290 300
350 360 370 380 390 400
pF1KE0 PQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKLLEVWIEFGRIKLPQGYHPNDVE
:.. :.. :..:...::: :. ::: .:.: . .:. :: .. :..:.: :::: :::
CCDS43 PSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEGAVQAGQLKVPPGYHPLDVE
310 320 330 340 350 360
410 420 430 440 450 460
pF1KE0 EEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNCEEKLTLAKNTLQADAAHLE
.::::: . .:::::.:: :::: : .:..:.: : :::.:. : ::.:. :
CCDS43 KEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEAGLCEEQLNQADALLQSDVRLLA
370 380 390 400 410 420
470 480 490 500 510 520
pF1KE0 SGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLEELAFRVMRLQDELVTLRLE
.:. : ..: ... ...:: : :.: :.: . : :.. ::.::...::..: :
CCDS43 AGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHPQGEQMYRRVYRLHERLVAIRTE
430 440 450 460 470 480
530 540 550 560 570 580
pF1KE0 CTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSSSTSWFRKPMTRAELVAISSSED
:: :. : : :.... . : :.: :: ::
CCDS43 -YNLRLKAGV-----------------AAPATQVAQVTLQSVQRRP----EL------ED
490 500 510
590 600 610 620 630 640
pF1KE0 EGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQHIHTSVEELGSSVKEARLY
..::.. .::.:::: : ... :::: :::::: :: ... .: :.::. .....::
CCDS43 -STLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLGSHRGLHQSIEEFRAKIERARSD
520 530 540 550 560 570
650 660 670 680 690 700
pF1KE0 EGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLHKFVSRATAELIWLNEKEEE
::..: . .: . ::.:. :: :: ..:. :.: :.:::.::. :: ::.::::::::
CCDS43 EGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLHSFVAAATKELMWLNEKEEE
580 590 600 610 620 630
710 720 730 740 750 760
pF1KE0 ELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTAELLSLENHPAKQTVEAYSA
:...:::: :.:..::.. .: : ::: :. .. ::.... : :.:::. :::...:
CCDS43 EVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAGDRLLREDHPARPTVESFQA
640 650 660 670 680 690
770 780 790 800 810 820
pF1KE0 AVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLRNLQDSIKRKYSCDHNTSLS
:.:.: .:: ::: :.: :.:::.::::::::.:: :. :..::....::::::......
CCDS43 ALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEGQLQKLQEALRRKYSCDRSATVT
700 710 720 730 740 750
830 840 850 860 870 880
pF1KE0 RLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSPDHVLKNTISVKAVCDYRQI
::::::::..:::::: . :. ...:. :.:..:::::: : : ... . . :::::.:.
CCDS43 RLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHPAHPMRGRLPLLAVCDYKQV
760 770 780 790 800 810
890 900 910 920 930 940
pF1KE0 EITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIPPPNKDAIEMASRVEQSYQK
:.:. :.::: : .: ..:::.: .:.:: :::::::.::::..: : ..:.: ..:
CCDS43 EVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVPPPNQEAQEAVTRLEAQHQA
820 830 840 850 860 870
950 960 970 980 990 1000
pF1KE0 VMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAPGECHQIMKNLQAHYEDFLQ
...:::::::. :::..:. ::.:..:...:.: .:. : : .: ...:. ::. ::.
CCDS43 LVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKPEEQRQALHSLELHYQAFLR
880 890 900 910 920 930
1010 1020 1030 1040 1050 1060
pF1KE0 DSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEETVAKMYISELKNIRLRLEE
::.:. :. ::: :.: .:. ..:.:..:.:. .::. . :::::.:::.::
CCDS43 DSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGAQEESRCQRCISELKDIRLQLEA
940 950 960 970 980 990
1070 1080 1090 1100 1110 1120
pF1KE0 YEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQLRSDLDAVSMKCDSFLHQS
: :.:.:.. : :.. .. : :::::...: ... : . . .: . .. :
CCDS43 CETRTVHRLR-LP---LDKEPARECAQRIAEQQKAQAEVEGLGKGVARLSAEAEKVLALP
1000 1010 1020 1030 1040 1050
1130 1140 1150 1160 1170 1180
pF1KE0 PSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIVRSIQDAELLVKGYEIKLSQ
: ..:::::::.: . :...: .::..::.::::.....:. : :: .....: .:..
CCDS43 EPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVIRGTQGAEEVLRAHEEQLKE
1060 1070 1080 1090 1100 1110
1190 1200 1210 1220 1230 1240
pF1KE0 EEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAKAKVVAEQMSRLTPERNLDL
..: : : ::: ..:.. .... .. .:..: .:. :. :.:.... ::....
CCDS43 AQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDELRGAQEVGERLQQRHGERDVEV
1120 1130 1140 1150 1160 1170
1250 1260 1270 1280 1290 1300
pF1KE0 ERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRACHGTLIKWIEETTAQQEMMK
::..:. .:: :::. :.:: ..:: :::.. . : :: : :.... .::...
CCDS43 ERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRESADPLGAWLQDARRRQEQIQ
1180 1190 1200 1210 1220 1230
1310 1320 1330 1340 1350 1360
pF1KE0 PGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQYSTIVKDYELQLMTYKAFVE
::... ::: :. ::. ::::. :...::.:..:: . .:::::::.:::: .:
CCDS43 AMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQYINAIKDYELQLVTYKAQLE
1240 1250 1260 1270 1280 1290
1370 1380 1390 1400 1410 1420
pF1KE0 SQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHVKYISDALRRLEEEEKVVEE
::.:. .. :.:... ::..::::.:. :.:::.:..:.::..:::.::::...:.
CCDS43 PVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTSQYIKFISETLRRMEEEERLAEQ
1300 1310 1320 1330 1340 1350
1430 1440 1450 1460 1470 1480
pF1KE0 EKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKAILEQQVLSEELTTKKEQVS
.. :. :.. :. ..: .. : . ...: ... : : :: ..::.. ..: .
CCDS43 QRAEERERLAEVE---AALEKQRQLAEAHAQAKAQAEREAKEL-QQRMQEEVVRREEAAV
1360 1370 1380 1390 1400
1490 1500 1510 1520 1530 1540
pF1KE0 EAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCDGSANQLQQLQSQLAHQTEQ
.: ...:..:.:.:. : .. . . : . :.. :....
CCDS43 DA----------------QQQKRSIQEELQQLRQSSE-----AEIQAKARQAEAAERSRL
1410 1420 1430 1440
1550 1560 1570 1580 1590
pF1KE0 KTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ---QDLSALQKNQSDLKDLQDDI
. .... . . ::: : :: : . ..:. . : .: .. . ...::.
CCDS43 R-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEAEAQKRQAQEEAERLRRQVQDES
1450 1460 1470 1480 1490 1500
1600 1610 1620 1630 1640 1650
pF1KE0 QNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAKEQYEALQEETRVAQKELEE
: . . . ... ... : . : : : ::.: ::.: : :. : :.:.
CCDS43 QRKRQAEVELASRVKAEAEAAREK--QRALQALEELRLQAEEA------ERRLRQAEVER
1510 1520 1530 1540 1550
1660 1670 1680 1690 1700 1710
pF1KE0 AVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGGQLLTNLPGMEQLSGASL--
: . :: . .: :: ..:. .: . . .:: .: :... :.:
CCDS43 ARQVQVALETAQRSAEAEL-QSKR---------ASFAEKTAQLERSLQ-EEHVAVAQLRE
1560 1570 1580 1590 1600
1720 1730 1740 1750 1760
pF1KE0 --EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARHQ-ELLSQQQNFILAT---QSAQ
:. : . ... . ..: ..:. : : .. : : : ..::... : :. .
CCDS43 EAERRAQQQAEAERAREEAERELERWQLKANEALRLRLQAEEVAQQKSLAQAEAEKQKEE
1610 1620 1630 1640 1650 1660
1770 1780 1790 1800 1810 1820
pF1KE0 AFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELKQVQTLQDELQKFLQDHKEF
: . . .. ::: . :..:.: . . . .::.. : .: . ..:: .. . ..
CCDS43 AEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTA--QQRLAAEQELIRLRAETEQG
1670 1680 1690 1700 1710 1720
1830 1840 1850 1860 1870 1880
pF1KE0 ESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISHKGDLRFVTISGQKVLDMEN
:. . :.:: ... :. . ::: . .. . ..... . : .. .
CCDS43 EQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAELAKVRAEMEVLLASKARAEE---
1730 1740 1750 1760 1770
1890 1900 1910 1920 1930 1940
pF1KE0 SFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLNMLLGQYHQFQNSADSLQAW
:.. :: . :..:. . :. : . .:: . :.. . : . .:
CCDS43 ---ESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA-----LAEEAKRQRQLAEEDAA
1780 1790 1800 1810 1820
1950 1960 1970 1980 1990 2000
pF1KE0 MQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQVPVEKLQKVARDIM----E
: :: :..:.. .:. . . . . :.:. ::. :.:...:.: .
CCDS43 RQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEAEN----ERLRRLAEDEAFQRRR
1830 1840 1850 1860 1870
2010 2020 2030 2040 2050 2060
pF1KE0 IEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LLQKAIAQSQSVQESLESLLQSIG
.: . : . ..: :..... : : ::.. :.. .. : ..:.: . .: :.
CCDS43 LEEQAAQHKADIEER----LAQLRKASDSELERQKGLVEDTLRQRRQVEEEILALKASF-
1880 1890 1900 1910 1920 1930
2070 2080 2090 2100 2110 2120
pF1KE0 EVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLEATREMVTRFMETADSTTAA
:. :: : : :. ... ..... :::.:. ::
CCDS43 --EKAAAGKAELELELGRIRSNAEDTLR-----SKEQAELEAARQ----------RQLAA
1940 1950 1960 1970
2130 2140 2150 2160 2170 2180
pF1KE0 VLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLSGKLQQFMENKSRMLASGNQ
. . :. .: .. ..: . : : ..: .:. .:. :. ..:
CCDS43 EEERRRREAEERVQKSLAAEEEAARQRKAALEEVE-------RLKAKVEEARRLRERAEQ
1980 1990 2000 2010 2020 2030
2190 2200 2210 2220 2230 2240
pF1KE0 PDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGFALDLCQHQDRVQNLRKDFT
. .. :. . :. :.. . . .... ::.. : :.:. ...:: .
CCDS43 ESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQT-----LQQEQSVLDQLRGEAE
2040 2050 2060 2070 2080
2250 2260 2270 2280 2290 2300
pF1KE0 ELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSIPPTETSMSAKELEKQIEHL
.....: :. . ... . :. :. .. ::.. : ... . . :.:
CCDS43 AARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA-----EEQAQARAQAQAAAEKL
2090 2100 2110 2120 2130
2310 2320 2330 2340 2350 2360
pF1KE0 KSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQGKTDLTEIQCDMSDVNLKYEKL
.. .. :.. . .:. . . . :: : . .... ... . :. :.
CCDS43 RKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQTLRQKAQVEQELTTLRLQLEET
2140 2150 2160 2170 2180 2190
2370 2380 2390 2400 2410
pF1KE0 GGVLHERQESLQAILNRMEEVHKEANSVLQWLES---KEEVLKSMDAMSSPTKTETVKAQ
. .: :: . . :. .. ..: . : : . : :... : . . .
CCDS43 DHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQMEELSKLKARIEAENRALILRD
2200 2210 2220 2230 2240 2250
2420 2430 2440 2450 2460 2470
pF1KE0 AESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEAENWKKIQEELNSRWERATEVTV
.... :: : .. :...: : : : :. .::: ... :: .. . .: .
CCDS43 KDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEAARLRQLAEEDLAQQRALAEKML
2260 2270 2280 2290 2300 2310
2480 2490 2500 2510 2520 2530
pF1KE0 ARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLGPLSIDPNMLNAQ-KQQVQFMLK
.. : . :..: ::..: ..::: . :. : ... : ...: . .
CCDS43 KEKMQAVQEATRLK----AEAELLQ--QQKELAQEQARRLQEDKEQMAQQLAEETQGFQR
2320 2330 2340 2350 2360
2540 2550 2560 2570 2580 2590
pF1KE0 EFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQSINQKWVELTDKLNSR--SSQI
.::.::.. ... :. . ...: . ...... : . .. :. .::. ..:
CCDS43 TLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQRFRKQAEEIGEKLHRTELATQE
2370 2380 2390 2400 2410 2420
2600 2610 2620 2630 2640 2650
pF1KE0 DQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQPEAVKQQLEETSEIRSDLEQLD
..:.. . :. .: .:..: . .: .. . : :: ::. . :::
CCDS43 KVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQQEAKLLQLKSEEMQTVQQEQLL
2430 2440 2450 2460 2470 2480
2660 2670 2680 2690 2700
pF1KE0 HEVKEAQT--LCDELSVLIGEQYLKDELKKRLET-----VALPLQGLED-------LAAD
.:.. : : .. :.: :.....: : .:: :: : :. . .
CCDS43 QETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQDEVAKAQQLREEQQRQQQQMEQE
2490 2500 2510 2520 2530 2540
2710 2720 2730 2740 2750
pF1KE0 RINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAKNCP--ISAKLERLQSQLQENEE
: .:: :.. ... :. .: .: .. :. :: .. .. . .::. ::: ::
CCDS43 R-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRRQQEELLAEENQRLREQLQLLEE
2550 2560 2570 2580 2590 2600
2760 2770 2780 2790 2800 2810
pF1KE0 FQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVELKNHWEELSKKTADRQSRL
... :: : ..: . ..: :.. .: .. .. : .:.. .::
CCDS43 QHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAAEAEPEHSFDGLRRKVS--AQRL
2610 2620 2630 2640 2650
2820 2830 2840 2850 2860 2870
pF1KE0 KDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQLESSLLRSKAMLNEVEKRRS
.. . .:.. : .. . : :. ..: :. . ..:: :: ... .
CCDS43 QEAGILSAEELQRLAQGHTT--VDELARREDVRHYLQGRSSIAGLLL-KATNEKLSVYAA
2660 2670 2680 2690 2700 2710
2880 2890 2900 2910 2920
pF1KE0 LLEILNS--AADILINSSEADE---DGIRDEKAGINQNMD--AVTEELQAKTGSLEEMTQ
: . : : .: ::.... :. : .:... .:. . .: ::. : : :. .
CCDS43 LQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVNEAVKEGVVGPELHHKLLSAERAVT
2720 2730 2740 2750 2760 2770
2930 2940 2950 2960 2970 2980
pF1KE0 RLREFQES-----FKNIEKKVEGAKHQLEIFDALGSQACSNKNLEKLRAQQEVLQALEPQ
.. . :. ..: . .: .....: : .. .. ..... . .
CCDS43 GYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---QIATGGVIDPVHSHR-----VPVD
2780 2790 2800 2810 2820
2990 3000 3010 3020 3030
pF1KE0 VDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-EFLEVKQRV----NSG-CVM-MENK
: : :. : . . . : :: .. . . .. .. .:.. .: ..: :.. . .:
CCDS43 VAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQLLERCVEDPETGLCLLPLTDK
2830 2840 2850 2860 2870 2880
3040 3050 3060 3070 3080
pF1KE0 LEGIGQF---HCRVREMFSQL---ADLDDELDGMGAIGRDTDSLQSQIEDVRLFLNKIHV
:.. ..:..: . : . .: . .: :. : .: ....
CCDS43 AAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVTIWEIINSEYFTAEQRRDLLRQFRT
2890 2900 2910 2920 2930 2940
3090 3100 3110 3120 3130 3140
pF1KE0 LKLDIEASEAECRHMLEEE---GTLDLLGLKRELEALNKQCGKLTERGKARQEQLELTLG
.. .: ..::. : : . ::. . : . ... .: .: :
CCDS43 GRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAELLESRVIDR------ELYQQLQ
2950 2960 2970 2980 2990 3000
3150 3160 3170 3180 3190 3200
pF1KE0 RVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQLADFKMFQKEQVDPLQMK---
: : :... . .. :. . .. . ..:. .: .:.:. .. ..:. . : .:
CCDS43 RGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQKLSIYNALKKDLL-PSDMAVAL
3010 3020 3030 3040 3050
3210 3220 3230 3240 3250
pF1KE0 LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINARWNTLNKKVA-QRIAQLQEALLHC
:. : :. . ... : .... . :.. . . .: :. : ...
CCDS43 LEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHEKLLSAEKAVTGYRDPYTGQSVSLF
3060 3070 3080 3090 3100 3110
3260 3270 3280 3290 3300 3310
pF1KE0 GKFQDALEP------LLSWLADTEELIANQKPPSAEYKVVKAQIQEQKLLQRLLDDRKAT
.. .: : ::. .: .. .: . :. :. .. .: :. .:
CCDS43 QALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDVACARGCLDEETSRALSAPRAD
3120 3130 3140 3150 3160 3170
3320 3330 3340 3350 3360 3370
pF1KE0 VDMLQAEG-GRIAQSAELADREKITGQLESLESRWTELLSKAA-ARQKQLEDILVLAKQF
. . . :. : .:: .: . :: .: : ::: :::..: . : . :
CCDS43 AKAYSDPSTGEPATYGELQQRCR-PDQLTGL--SLLPLSEKAARARQEELYSELQARETF
3180 3190 3200 3210 3220 3230
3380 3390 3400 3410 3420
pF1KE0 HETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQQQIIRHKALNEEIVNRKKNVDQAI
..: :.. : .:: .: .:: ::. .:...: .. . : .:...:
CCDS43 EKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQRQELLR------QFRTGKVTVEKVI
3240 3250 3260 3270 3280
3430 3440 3450 3460 3470 3480
pF1KE0 KNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADITVTSSKALRTLEQARQLATKFQSTY
: :. : ::: : ::.:. :... . .: .: . : .:: ..:
CCDS43 K---ILI--TIVEEVETLRQERLSFSGLRAPVPASELLASGVL-SRAQFEQLKDG-KTTV
3290 3300 3310 3320 3330
3490 3500 3510 3520 3530 3540
pF1KE0 EELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKKEVMEHRLVLDTVNEVSRALLE
..:. : :. : :: . : . ..: :.:.. :. :. . :::
CCDS43 KDLSE-LGSVRTLLQGSGCLAG----IYLEDTKEKVSIYEAMRRGLLRATTAAL---LLE
3340 3350 3360 3370 3380 3390
3550 3560 3570 3580 3590 3600
pF1KE0 LVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAIQRSQQYEQAADAELAWVAETK
.: :. ::. . .: : ... :.. . .:: .:: : .
CCDS43 A---QAATGF--LVDPVRNQRLYVHEAV-------KAGVVGPELHEQLLSAEKA--VTGY
3400 3410 3420 3430
3610 3620 3630 3640 3650
pF1KE0 RKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHKDSMDELFSHRSEI-----FGTCGE
: .. . : : : . . . :... . : .: . ::: . : .:
CCDS43 RDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGIIDPVHSHRVPVDVAYQRGYFSE
3440 3450 3460 3470 3480 3490
3660 3670 3680 3690 3700 3710
pF1KE0 EQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVNQFWETYEELSPWIEETRALIA
:.. :: . ... .. . : ::: :.. :: .: : .: ..
CCDS43 EMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC---VEDP-ETGLRLLPLKGAEKAEVV
3500 3510 3520 3530 3540 3550
3720 3730 3740 3750 3760 3770
pF1KE0 QLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKIGPQLKELNPEEGEMVEEKYQK
. . . .:. :. :: . . . : .: .. . ..: ::: :.
CCDS43 ET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEV--MQSDLIPEE--------QR
3560 3570 3580 3590 3600
3780 3790 3800 3810 3820 3830
pF1KE0 AENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDKIEPMLETLENLSSRLRMPPLIPAE
:. : : . ...: . . . ..:.: . . : . . . :: :. :.
CCDS43 AQLMADFQAGRVTKERMIIIIIEIIEKTEIIR-----QQGLASYDYVRRRLTAEDLFEAR
3610 3620 3630 3640 3650
3840 3850 3860 3870 3880 3890
pF1KE0 VDKIR--ECISDNKSATVELEKLQPSFEALKRRGEELIGRSQGADKDLAAKEIQDKLDQM
. ... . . .. . : . . .. : : :. . :. : . : .
CCDS43 IISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGVYLPGSRQTLS---IYQALKKG
3660 3670 3680 3690 3700 3710
3900 3910 3920 3930 3940
pF1KE0 VFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAALLTTI-KDTQDIVHDLESP--GID
.. : . : . .:: .. .:.. : :. . . .: . . : :
CCDS43 LLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAVRKGLVGPELHDRLLSAERAVTGYR
3720 3730 3740 3750 3760 3770
3950 3960 3970 3980 3990 4000
pF1KE0 PSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFACGETEKPEVRKSID-EMNNAWE
.: . ...:.: .: : :.: :.: : : :.. . :.
CCDS43 DPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL--ATGGIVDPRLGFHLPLEVAYQRG
3780 3790 3800 3810 3820
4010 4020 4030 4040 4050 4060
pF1KE0 NLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVIKLCTMPPVGTDLNTVKDQLNE
::: ...: . . ... :. . . . : .. : :: . :..
CCDS43 YLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL----LRRCRRDD-GTGQLLL--PLSD
3830 3840 3850 3860 3870
4070 4080 4090 4100 4110 4120
pF1KE0 MKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIREPLTELKHLWENLGEKIAHRQ
... . ..:: :: ::. ... ::. .:: :: .... .:: :
CCDS43 ARKLTFRGLRKQITME------ELVRSQVMDEATALQLREGLTSIEEVTKNL-------Q
3880 3890 3900 3910 3920
4130 4140 4150 4160 4170 4180
pF1KE0 HKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISGDPKVIEVELAKHHVLKNDVLA
. :::. : : : .: .: .. . :: .. ...:.. : .:. . . .
CCDS43 KFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRPGTA-FELLEAQAATGYVI-DPIKG
3930 3940 3950 3960 3970 3980
4190 4200 4210 4220 4230 4240
pF1KE0 HQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWESVLQKTEEREQQLQSTLQQAQ
. ::: . . :
CCDS43 LKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGKLISLFQAMKKGLILKDHGIRL
3990 4000 4010 4020 4030 4040
>>CCDS43775.1 PLEC gene_id:5339|Hs108|chr8 (4547 aa)
initn: 3775 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4738; 29.1% identity (59.1% similar) in 4266 aa overlap (52-4199:16-3994)
30 40 50 60 70 80
pF1KE0 SERSYRSERSGSLSPCPPGDTLPWNLPLHEQKKRKSQDSVLDPAERAVVRVADERDRVQK
.:. .:.:.. . :: ::::::::
CCDS43 MSQHQLRVPQPEGLGRKRTSSEDNLYLAVLRASEGKKDERDRVQK
10 20 30 40
90 100 110 120 130 140
pF1KE0 KTFTKWVNKHLMKVRKHINDLYEDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQI
:::::::::::.:...::.::::::::::::::::::::: .:::::::::::.::::::
CCDS43 KTFTKWVNKHLIKAQRHISDLYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQI
50 60 70 80 90 100
150 160 170 180 190 200
pF1KE0 ALDFLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLL
:::.:..:::::::::::::.::::::::::::::::::::::: .::.: ::.::::::
CCDS43 ALDYLRHRQVKLVNIRNDDIADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLL
110 120 130 140 150 160
210 220 230 240 250 260
pF1KE0 LWTQKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEV
::.:... :: :..: ::.: : ::..:::.:::..: :.::..: :.: :::.::: :
CCDS43 LWSQRMVEGYQGLRCDNFTSSWRDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSV
170 180 190 200 210 220
270 280 290 300 310 320
pF1KE0 AER-LGVTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQ
::: :::::::: ::::::.:::::.::::::.:::.:.::. .:. :.:.. :::::.
CCDS43 AERDLGVTRLLDPEDVDVPQPDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYR
230 240 250 260 270 280
330 340 350 360 370 380
pF1KE0 SRVDSLIPWIKQHTILMSDKTFPQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKL
: :. :...:: . .. ::.. :.. :..:...::: :. ::: .:.: . .:.
CCDS43 ELVLLLLQWMRHHTAAFEERRFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQS
290 300 310 320 330 340
390 400 410 420 430 440
pF1KE0 LEVWIEFGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGA
:: .. :..:.: :::: :::.::::: . .:::::.:: :::: : .:..:.: :
CCDS43 LEGAVQAGQLKVPPGYHPLDVEKEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEA
350 360 370 380 390 400
450 460 470 480 490 500
pF1KE0 LNCEEKLTLAKNTLQADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYY
:::.:. : ::.:. : .:. : ..: ... ...:: : :.: :.: .
CCDS43 GLCEEQLNQADALLQSDVRLLAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHP
410 420 430 440 450 460
510 520 530 540 550 560
pF1KE0 QLEELAFRVMRLQDELVTLRLECTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSS
: :.. ::.::...::..: : :: :. : : :.... .
CCDS43 QGEQMYRRVYRLHERLVAIRTE-YNLRLKAGV-----------------AAPATQVAQVT
470 480 490 500
570 580 590 600 610 620
pF1KE0 STSWFRKPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLE
: :.: :: :: ..::.. .::.:::: : ... :::: :::::: ::
CCDS43 LQSVQRRP----EL------ED-STLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLG
510 520 530 540 550
630 640 650 660 670 680
pF1KE0 TQQHIHTSVEELGSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQ
... .: :.::. .....:: ::..: . .: . ::.:. :: :: ..:. :.: :.
CCDS43 SHRGLHQSIEEFRAKIERARSDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLE
560 570 580 590 600 610
690 700 710 720 730 740
pF1KE0 SLHKFVSRATAELIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQ
:::.::. :: ::.:::::::::...:::: :.:..::.. .: : ::: :. .. ::
CCDS43 SLHSFVAAATKELMWLNEKEEEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQ
620 630 640 650 660 670
750 760 770 780 790 800
pF1KE0 DTAELLSLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELES
.... : :.:::. :::...::.:.: .:: ::: :.: :.:::.::::::::.:: :.
CCDS43 NAGDRLLREDHPARPTVESFQAALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEG
680 690 700 710 720 730
810 820 830 840 850 860
pF1KE0 FLRNLQDSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKP
:..::....::::::......::::::::..:::::: . :. ...:. :.:..:::::
CCDS43 QLQKLQEALRRKYSCDRSATVTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKP
740 750 760 770 780 790
870 880 890 900 910 920
pF1KE0 RSPDHVLKNTISVKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCF
: : : ... . . :::::.:.:.:. :.::: : .: ..:::.: .:.:: ::::::
CCDS43 RHPAHPMRGRLPLLAVCDYKQVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCF
800 810 820 830 840 850
930 940 950 960 970 980
pF1KE0 LIPPPNKDAIEMASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRS
:.::::..: : ..:.: ..: ...:::::::. :::..:. ::.:..:...:.: .:.
CCDS43 LVPPPNQEAQEAVTRLEAQHQALVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRT
860 870 880 890 900 910
990 1000 1010 1020 1030 1040
pF1KE0 SAPGECHQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENED
: : .: ...:. ::. ::.::.:. :. ::: :.: .:. ..:.:..:.:.
CCDS43 LKPEEQRQALHSLELHYQAFLRDSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGA
920 930 940 950 960 970
1050 1060 1070 1080 1090 1100
pF1KE0 KEETVAKMYISELKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQED
.::. . :::::.:::.:: : :.:.:.. : :.. .. : :::::...: .
CCDS43 QEESRCQRCISELKDIRLQLEACETRTVHRLR-LP---LDKEPARECAQRIAEQQKAQAE
980 990 1000 1010 1020 1030
1110 1120 1130 1140 1150 1160
pF1KE0 LQQLRSDLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVD
.. : . . .: . .. : : ..:::::::.: . :...: .::..::.::::..
CCDS43 VEGLGKGVARLSAEAEKVLALPEPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTIS
1040 1050 1060 1070 1080 1090
1170 1180 1190 1200 1210 1220
pF1KE0 VIVRSIQDAELLVKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEE
...:. : :: .....: .:.. ..: : : ::: ..:.. .... .. .:..: .:
CCDS43 LVIRGTQGAEEVLRAHEEQLKEAQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDE
1100 1110 1120 1130 1140 1150
1230 1240 1250 1260 1270 1280
pF1KE0 IAKAKVVAEQMSRLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDY
. :. :.:.... ::....::..:. .:: :::. :.:: ..:: :::.. . : :
CCDS43 LRGAQEVGERLQQRHGERDVEVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYY
1160 1170 1180 1190 1200 1210
1290 1300 1310 1320 1330 1340
pF1KE0 RACHGTLIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFS
: : :.... .::... ::... ::: :. ::. ::::. :...::.:.
CCDS43 RESADPLGAWLQDARRRQEQIQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFA
1220 1230 1240 1250 1260 1270
1350 1360 1370 1380 1390 1400
pF1KE0 QQYSTIVKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTT
.:: . .:::::::.:::: .: ::.:. .. :.:... ::..::::.:. :.:::.
CCDS43 KQYINAIKDYELQLVTYKAQLEPVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTS
1280 1290 1300 1310 1320 1330
1410 1420 1430 1440 1450 1460
pF1KE0 QHVKYISDALRRLEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDI
:..:.::..:::.::::...:... :. :.. :. ..: .. : . ...: ...
CCDS43 QYIKFISETLRRMEEEERLAEQQRAEERERLAEVE---AALEKQRQLAEAHAQAKAQAER
1340 1350 1360 1370 1380
1470 1480 1490 1500 1510 1520
pF1KE0 EKAILEQQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHD
: : :: ..::.. ..: . .: ...:..:.:.:. : .. .
CCDS43 EAKEL-QQRMQEEVVRREEAAVDA----------------QQQKRSIQEELQQLRQSSE-
1390 1400 1410 1420 1430
1530 1540 1550 1560 1570
pF1KE0 LCDGSANQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ-
. : . :.. :.... . .... . . ::: : :: : . ..:. .
CCDS43 ----AEIQAKARQAEAAERSRLR-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEA
1440 1450 1460 1470 1480
1580 1590 1600 1610 1620 1630
pF1KE0 --QDLSALQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLH
: .: .. . ...::. : . . . ... ... : . : : : ::.:
CCDS43 EAQKRQAQEEAERLRRQVQDESQRKRQAEVELASRVKAEAEAAREK--QRALQALEELRL
1490 1500 1510 1520 1530 1540
1640 1650 1660 1670 1680 1690
pF1KE0 QAKEQYEALQEETRVAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGS
::.: : :. : :.:.: . :: . .: :: ..:. .: .
CCDS43 QAEEA------ERRLRQAEVERARQVQVALETAQRSAEAEL-QSKR---------ASFAE
1550 1560 1570 1580
1700 1710 1720 1730 1740
pF1KE0 SGGQLLTNLPGMEQLSGASL----EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARH
. .:: .: :... :.: :. : . ... . ..: ..:. : : .. :
CCDS43 KTAQLERSLQ-EEHVAVAQLREEAERRAQQQAEAERAREEAERELERWQLKANEALRLRL
1590 1600 1610 1620 1630 1640
1750 1760 1770 1780 1790 1800
pF1KE0 Q-ELLSQQQNFILAT---QSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEA
: : ..::... : :. .: . . .. ::: . :..:.: . . . .::.. :
CCDS43 QAEEVAQQKSLAQAEAEKQKEEAEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTA
1650 1660 1670 1680 1690 1700
1810 1820 1830 1840 1850 1860
pF1KE0 ELKQVQTLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDV
. : . ..:: .. . .. :. . :.:: ... :. . ::: . ..
CCDS43 Q--QRLAAEQELIRLRAETEQGEQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAEL
1710 1720 1730 1740 1750
1870 1880 1890 1900 1910 1920
pF1KE0 ISHKGDLRFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGS
. ..... . : . . .:.. :: . :..:. . :. : . .:: .
CCDS43 AKVRAEMEVLLASKAR------AEEESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA
1760 1770 1780 1790 1800
1930 1940 1950 1960 1970 1980
pF1KE0 HLNMLLGQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELA
:.. . : . .: : :: :..:.. .:. . . . . :.:. :
CCDS43 -----LAEEAKRQRQLAEEDAARQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEA
1810 1820 1830 1840 1850 1860
1990 2000 2010 2020 2030 2040
pF1KE0 EHQVPVEKLQKVARDIM----EIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LL
:. :.:...:.: ..: . : . ..: :..... : : ::.. :.
CCDS43 EN----ERLRRLAEDEAFQRRRLEEQAAQHKADIEER----LAQLRKASDSELERQKGLV
1870 1880 1890 1900 1910
2050 2060 2070 2080 2090 2100
pF1KE0 QKAIAQSQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKS
. .. : ..:.: . .: :. :. :: : : :. ... .....
CCDS43 EDTLRQRRQVEEEILALKASF---EKAAAGKAELELELGRIRSNAEDTLR-----SKEQA
1920 1930 1940 1950 1960
2110 2120 2130 2140 2150 2160
pF1KE0 SLEATREMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFE
:::.:. :: . . :. .: .. ..: . : : ..:
CCDS43 ELEAARQ----------RQLAAEEERRRREAEERVQKSLAAEEEAARQRKAALEEVE---
1970 1980 1990 2000 2010
2170 2180 2190 2200 2210 2220
pF1KE0 HLSGKLQQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSS
.:. .:. :. ..: . .. :. . :. :.. . . .... ::..
CCDS43 ----RLKAKVEEARRLRERAEQESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQ
2020 2030 2040 2050 2060
2230 2240 2250 2260 2270 2280
pF1KE0 CGFALDLCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETE
: :.:. ...:: . .....: :. . ... . :. :. .. ::..
CCDS43 T-----LQQEQSVLDQLRGEAEAARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA
2070 2080 2090 2100 2110 2120
2290 2300 2310 2320 2330
pF1KE0 GSIPPTETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQ
: ... . . :.:.. .. :.. . .:. . . . :: :
CCDS43 -----EEQAQARAQAQAAAEKLRKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQ
2130 2140 2150 2160 2170
2340 2350 2360 2370 2380 2390
pF1KE0 GKTDLTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEANSVLQWLES---K
. .... ... . :. :. . .: :: . . :. .. ..: . : : .
CCDS43 TLRQKAQVEQELTTLRLQLEETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQ
2180 2190 2200 2210 2220 2230
2400 2410 2420 2430 2440 2450
pF1KE0 EEVLKSMDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEA
: :... : . . . .... :: : .. :...: : : : :. .:::
CCDS43 MEELSKLKARIEAENRALILRDKDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEA
2240 2250 2260 2270 2280 2290
2460 2470 2480 2490 2500 2510
pF1KE0 ENWKKIQEELNSRWERATEVTVARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLG
... :: .. . .: . .. : . :..: ::..: ..::: .
CCDS43 ARLRQLAEEDLAQQRALAEKMLKEKMQAVQEATRLK----AEAEL--LQQQKELAQEQAR
2300 2310 2320 2330 2340
2520 2530 2540 2550 2560 2570
pF1KE0 PLSIDPNMLNAQ-KQQVQFMLKEFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQ
:. : ... : ...: . . .::.::.. ... :. . ...: . ...... :
CCDS43 RLQEDKEQMAQQLAEETQGFQRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQ
2350 2360 2370 2380 2390 2400
2580 2590 2600 2610 2620 2630
pF1KE0 SINQKWVELTDKLNSR--SSQIDQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQ
. .. :. .::. ..: ..:.. . :. .: .:..: . .: .. . :
CCDS43 RFRKQAEEIGEKLHRTELATQEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQ
2410 2420 2430 2440 2450 2460
2640 2650 2660 2670 2680
pF1KE0 PEAVKQQLEETSEIRSDLEQLDHEVKEAQT--LCDELSVLIGEQYLKDELKKRLET----
:: ::. . ::: .:.. : : .. :.: :.....: : .::
CCDS43 QEAKLLQLKSEEMQTVQQEQLLQETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQD
2470 2480 2490 2500 2510 2520
2690 2700 2710 2720 2730
pF1KE0 -VALPLQGLED-------LAADRINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAK
:: : :. . .: .:: :.. ... :. .: .: .. :. :: .
CCDS43 EVAKAQQLREEQQRQQQQMEQER-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRR
2530 2540 2550 2560 2570 2580
2740 2750 2760 2770 2780 2790
pF1KE0 NCP--ISAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQ
. .. . .::. ::: :: ... :: : ..: . ..: :..
CCDS43 QQEELLAEENQRLREQLQLLEEQHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAA
2590 2600 2610 2620 2630
2800 2810 2820 2830 2840 2850
pF1KE0 LVELKNHWEELSKKTADRQSRLKDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDP
.: .. .. : .:.. .::.. . .:.. : .. . : :. ..: :
CCDS43 EAEPEHSFDGLRRKVS--AQRLQEAGILSAEELQRLAQGHTTV--DELARREDVRHYL--
2640 2650 2660 2670 2680 2690
2860 2870 2880 2890 2900
pF1KE0 VQLESSL--LRSKAMLNEVEKRRSLLEILNS--AADILINSSEADE---DGIRDEKAGIN
: .::. : :: ... .: . : : .: ::.... :. : .:... .:
CCDS43 -QGRSSIAGLLLKATNEKLSVYAALQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVN
2700 2710 2720 2730 2740 2750
2910 2920 2930 2940 2950
pF1KE0 QNMD--AVTEELQAKTGSLEEMTQRLREFQES-----FKNIEKKVEGAKHQLEIFDALGS
. . .: ::. : : :. . .. . :. ..: . .: .....:
CCDS43 EAVKEGVVGPELHHKLLSAERAVTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---
2760 2770 2780 2790 2800
2960 2970 2980 2990 3000 3010
pF1KE0 QACSNKNLEKLRAQQEVLQALEPQVDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-E
: .. .. ..... . .: : :. : . . . : :: .. . . .. ..
CCDS43 QIATGGVIDPVHSHR-----VPVDVAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLT
2810 2820 2830 2840 2850 2860
3020 3030 3040 3050 3060
pF1KE0 FLEVKQRV----NSG-CVM-MENKLEGIGQF---HCRVREMFSQL---ADLDDELDGMGA
.:.. .: ..: :.. . .: :.. ..:..: . : . .
CCDS43 YLQLLERCVEDPETGLCLLPLTDKAAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVT
2870 2880 2890 2900 2910 2920
3070 3080 3090 3100 3110 3120
pF1KE0 IGRDTDSLQSQIEDVRLFLNKIHVLKLDIEASEAECRHMLEEE---GTLDLLGLKRELEA
: . .: :. : .: .... .. .: ..::. : : . ::. . :
CCDS43 IWEIINSEYFTAEQRRDLLRQFRTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPA
2930 2940 2950 2960 2970 2980
3130 3140 3150 3160 3170 3180
pF1KE0 LNKQCGKLTERGKARQEQLELTLGRVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEII
. ... .: .: : : : :... . .. :. . .. . ..:. .:
CCDS43 AELLESRVIDR------ELYQQLQRGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEA
2990 3000 3010 3020 3030
3190 3200 3210 3220 3230
pF1KE0 NQQLADFKMFQKEQVDPLQMK---LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINA
.:.:. .. ..:. . : .: :. : :. . ... : .... . :..
CCDS43 GQKLSIYNALKKDLL-PSDMAVALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHE
3040 3050 3060 3070 3080 3090
3240 3250 3260 3270 3280
pF1KE0 RWNTLNKKVA-QRIAQLQEALLHCGKFQDALEP------LLSWLADTEELIANQKPPSAE
. . .: :. : ... .. .: : ::. .: .. .: .
CCDS43 KLLSAEKAVTGYRDPYTGQSVSLFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVP
3100 3110 3120 3130 3140 3150
3290 3300 3310 3320 3330 3340
pF1KE0 YKVVKAQIQEQKLLQRLLDDRKATVDMLQAEG-GRIAQSAELADREKITGQLESLESRWT
:. :. .. .: :. .: . . . :. : .:: .: . :: .:
CCDS43 LDVACARGCLDEETSRALSAPRADAKAYSDPSTGEPATYGELQQRCR-PDQLTGLS--LL
3160 3170 3180 3190 3200 3210
3350 3360 3370 3380 3390 3400
pF1KE0 ELLSKAA-ARQKQLEDILVLAKQFHETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQ
: ::: :::..: . : . :..: :.. : .:: .: .:: ::. .
CCDS43 PLSEKAARARQEELYSELQARETFEKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQR
3220 3230 3240 3250 3260
3410 3420 3430 3440 3450
pF1KE0 QQIIRHKALNEEIVNRKKNVDQAIKNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADIT
:...: .. . : .:...:: :. : ::: : ::.:. :...
CCDS43 QELLR------QFRTGKVTVEKVIK---ILI--TIVEEVETLRQERLSFSGLRAPVPASE
3270 3280 3290 3300 3310
3460 3470 3480 3490 3500 3510
pF1KE0 VTSSKALRTLEQARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKE
. .: .: . : .:: ..: ..:. : :. : :: . : . ..:
CCDS43 LLASGVL-SRAQFEQLKDG-KTTVKDLSE-LGSVRTLLQGSGCLAG----IYLEDTKEKV
3320 3330 3340 3350 3360
3520 3530 3540 3550 3560 3570
pF1KE0 LKKEVMEHRLVLDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEID
:.:.. :. :. . ::: .: :. ::. . .: : ...
CCDS43 SIYEAMRRGLLRATTAAL---LLEA---QAATGF--LVDPVRNQRLYVHEAV-------K
3370 3380 3390 3400 3410
3580 3590 3600 3610 3620 3630
pF1KE0 AAIQRSQQYEQAADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHK
:.. . .:: .:: : .. : .. . : : : . . . :... . :
CCDS43 AGVVGPELHEQLLSAEKAVTG--YRDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATG
3420 3430 3440 3450 3460 3470
3640 3650 3660 3670 3680 3690
pF1KE0 DSMDELFSHRSEI-----FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQV
.: . ::: . : .::.. :: . ... .. . : :::
CCDS43 GIIDPVHSHRVPVDVAYQRGYFSEEMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC--
3480 3490 3500 3510 3520 3530
3700 3710 3720 3730 3740 3750
pF1KE0 LVNQFWETYEELSPWIEETRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKL
:.. :: .: : .: ... . . .:. :. :: . . . : .:
CCDS43 -VEDP-ETGLRLLPLKGAEKAEVVET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSL
3540 3550 3560 3570 3580
3760 3770 3780 3790 3800 3810
pF1KE0 LKIGPQLKELNPEEGEMVEEKYQKAENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDK
.. . ..: ::: :.:. : : . ...: . . . ..:.: .
CCDS43 WEV--MQSDLIPEE--------QRAQLMADFQAGRVTKERMIIIIIEIIEKTEIIR----
3590 3600 3610 3620 3630
3820 3830 3840 3850 3860
pF1KE0 IEPMLETLENLSSRLRMPPLIPAEVDKIR--ECISDNKSATVELEKLQPSFEALKRRGEE
. : . . . :: :. :.. ... . . .. . : . . .. : :
CCDS43 -QQGLASYDYVRRRLTAEDLFEARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSV
3640 3650 3660 3670 3680 3690
3870 3880 3890 3900 3910 3920
pF1KE0 LIGRSQGADKDLAAKEIQDKLDQMVFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAA
:. . :. : . : . .. : . : . .:: .. .:.. : :.
CCDS43 AGVYLPGSRQTLS---IYQALKKGLLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAV
3700 3710 3720 3730 3740
3930 3940 3950 3960 3970 3980
pF1KE0 LLTTI-KDTQDIVHDLESP--GIDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLI
. . .: . . : : .: . ...:.: .: : :.: :.:
CCDS43 RKGLVGPELHDRLLSAERAVTGYRDPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL-
3750 3760 3770 3780 3790 3800
3990 4000 4010 4020 4030 4040
pF1KE0 FACGETEKPEVRKSID-EMNNAWENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDN
: : :.. . :. ::: ...: . . ... :. . . . :
CCDS43 -ATGGIVDPRLGFHLPLEVAYQRGYLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL--
3810 3820 3830 3840 3850 3860
4050 4060 4070 4080 4090 4100
pF1KE0 TVIKLCTMPPVGTDLNTVKDQLNEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRD
.. : :: . . :.. ... . ..:: :: ::. ... ::.
CCDS43 --LRRCRRDD-GT--GQLLLPLSDARKLTFRGLRKQITME------ELVRSQVMDEATAL
3870 3880 3890 3900
4110 4120 4130 4140 4150 4160
pF1KE0 IIREPLTELKHLWENLGEKIAHRQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRP
.:: :: .... .:: :. :::. : : : .: .: .. . ::
CCDS43 QLREGLTSIEEVTKNL-------QKFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRP
3910 3920 3930 3940 3950 3960
4170 4180 4190 4200 4210 4220
pF1KE0 ISGDPKVIEVELAKHHVLKNDVLAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQ
.. ...:.. : .:. . . . . ::: . . :
CCDS43 GTA-FELLEAQAATGYVI-DPIKGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPY
3970 3980 3990 4000 4010
4230 4240 4250 4260 4270 4280
pF1KE0 CWESVLQKTEEREQQLQSTLQQAQGFHSEIEDFLLELTRMESQLSASKPTGGLPETAREQ
CCDS43 SGKLISLFQAMKKGLILKDHGIRLLEAQIATGGIIDPEESHRLPVEVAYKRGLFDEEMNE
4020 4030 4040 4050 4060 4070
>>CCDS43774.1 PLEC gene_id:5339|Hs108|chr8 (4551 aa)
initn: 3775 init1: 1689 opt: 2812 Z-score: 1533.7 bits: 299.9 E(32554): 4.2e-79
Smith-Waterman score: 4727; 29.1% identity (59.0% similar) in 4263 aa overlap (59-4199:23-3998)
30 40 50 60 70 80
pF1KE0 ERSGSLSPCPPGDTLPWNLPLHEQKKRKSQDSVLDPAERAVVR----VADERDRVQKKTF
:. .::.:. . .:::::::::::
CCDS43 MSGAGGAFASPREVLLERPCWLDGGCEPARRGYLYQQLCCVDERDRVQKKTF
10 20 30 40 50
90 100 110 120 130 140
pF1KE0 TKWVNKHLMKVRKHINDLYEDLRDGHNLISLLEVLSGIKLPREKGRMRFHRLQNVQIALD
::::::::.:...::.::::::::::::::::::::: .:::::::::::.:::::::::
CCDS43 TKWVNKHLIKAQRHISDLYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALD
60 70 80 90 100 110
150 160 170 180 190 200
pF1KE0 FLKQRQVKLVNIRNDDITDGNPKLTLGLIWTIILHFQISDIYISGESGDMSAKEKLLLWT
.:..:::::::::::::.::::::::::::::::::::::: .::.: ::.::::::::.
CCDS43 YLRHRQVKLVNIRNDDIADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWS
120 130 140 150 160 170
210 220 230 240 250 260
pF1KE0 QKVTAGYTGIKCTNFSSCWSDGKMFNALIHRYRPDLVDMERVQIQSNRENLEQAFEVAER
:... :: :..: ::.: : ::..:::.:::..: :.::..: :.: :::.::: ::::
CCDS43 QRMVEGYQGLRCDNFTSSWRDGRLFNAIIHRHKPLLIDMNKVYRQTNLENLDQAFSVAER
180 190 200 210 220 230
270 280 290 300 310 320
pF1KE0 -LGVTRLLDAEDVDVPSPDEKSVITYVSSIYDAFPKVPEGGEGISATEVDSRWQEYQSRV
:::::::: ::::::.:::::.::::::.:::.:.::. .:. :.:.. :::::. :
CCDS43 DLGVTRLLDPEDVDVPQPDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELV
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE0 DSLIPWIKQHTILMSDKTFPQNPVELKALYNQYIHFKETEILAKEREKGRIEELYKLLEV
:. :...:: . .. ::.. :.. :..:...::: :. ::: .:.: . .:. ::
CCDS43 LLLLQWMRHHTAAFEERRFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEG
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE0 WIEFGRIKLPQGYHPNDVEEEWGKLIIEMLEREKSLRPAVERLELLLQIANKIQNGALNC
.. :..:.: :::: :::.::::: . .:::::.:: :::: : .:..:.: : :
CCDS43 AVQAGQLKVPPGYHPLDVEKEWGKLHVAILEREKQLRSEFERLECLQRIVTKLQMEAGLC
360 370 380 390 400 410
450 460 470 480 490 500
pF1KE0 EEKLTLAKNTLQADAAHLESGQPVQCESDVIMYIQECEGLIRQLQVDLQILRDENYYQLE
::.:. : ::.:. : .:. : ..: ... ...:: : :.: :.: . : :
CCDS43 EEQLNQADALLQSDVRLLAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRHPQGE
420 430 440 450 460 470
510 520 530 540 550 560
pF1KE0 ELAFRVMRLQDELVTLRLECTNLYRKGHFTSLELVPPSTLTTTHLKAEPLTKATHSSSTS
.. ::.::...::..: : :: :. : : :.... . :
CCDS43 QMYRRVYRLHERLVAIRTE-YNLRLKAGV-----------------AAPATQVAQVTLQS
480 490 500 510
570 580 590 600 610 620
pF1KE0 WFRKPMTRAELVAISSSEDEGNLRFVYELLSWVEEMQMKLERAEWGNDLPSVELQLETQQ
:.: :: :: ..::.. .::.:::: : ... :::: :::::: :: ...
CCDS43 VQRRP----EL------ED-STLRYLQDLLAWVEENQHRVDGAEWGVDLPSVEAQLGSHR
520 530 540 550 560
630 640 650 660 670 680
pF1KE0 HIHTSVEELGSSVKEARLYEGKMSQNFHTSYAETLGKLETQYCKLKETSSFRMRHLQSLH
.: :.::. .....:: ::..: . .: . ::.:. :: :: ..:. :.: :.:::
CCDS43 GLHQSIEEFRAKIERARSDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLH
570 580 590 600 610 620
690 700 710 720 730 740
pF1KE0 KFVSRATAELIWLNEKEEEELAYDWSDNNSNISAKRNYFSELTMELEEKQDVFRSLQDTA
.::. :: ::.:::::::::...:::: :.:..::.. .: : ::: :. .. ::...
CCDS43 SFVAAATKELMWLNEKEEEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAG
630 640 650 660 670 680
750 760 770 780 790 800
pF1KE0 ELLSLENHPAKQTVEAYSAAVQSQLQWMKQLCLCVEQHVKENTAYFQFFSDARELESFLR
. : :.:::. :::...::.:.: .:: ::: :.: :.:::.::::::::.:: :. :.
CCDS43 DRLLREDHPARPTVESFQAALQTQWSWMLQLCCCIEAHLKENAAYFQFFSDVREAEGQLQ
690 700 710 720 730 740
810 820 830 840 850 860
pF1KE0 NLQDSIKRKYSCDHNTSLSRLEDLLQDSMDEKEQLIQSKSSVASLVGRSKTIVQLKPRSP
.::....::::::......::::::::..:::::: . :. ...:. :.:..:::::: :
CCDS43 KLQEALRRKYSCDRSATVTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHP
750 760 770 780 790 800
870 880 890 900 910 920
pF1KE0 DHVLKNTISVKAVCDYRQIEITICKNDECVLEDNSQRTKWKVISPTGNEAMVPSVCFLIP
: ... . . :::::.:.:.:. :.::: : .: ..:::.: .:.:: :::::::.:
CCDS43 AHPMRGRLPLLAVCDYKQVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVP
810 820 830 840 850 860
930 940 950 960 970 980
pF1KE0 PPNKDAIEMASRVEQSYQKVMALWHQLHVNTKSLISWNYLRKDLDLVQTWNLEKLRSSAP
:::..: : ..:.: ..: ...:::::::. :::..:. ::.:..:...:.: .:. :
CCDS43 PPNQEAQEAVTRLEAQHQALVTLWHQLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKP
870 880 890 900 910 920
990 1000 1010 1020 1030 1040
pF1KE0 GECHQIMKNLQAHYEDFLQDSRDSVLFSVADRLRLEEEVEACKARFQHLMKSMENEDKEE
: .: ...:. ::. ::.::.:. :. ::: :.: .:. ..:.:..:.:. .::
CCDS43 EEQRQALHSLELHYQAFLRDSQDAGGFGPEDRLMAEREYGSCSHHYQQLLQSLEQGAQEE
930 940 950 960 970 980
1050 1060 1070 1080 1090 1100
pF1KE0 TVAKMYISELKNIRLRLEEYEQRVVKRIQSLASSRTDRDAWQDNALRIAEQEHTQEDLQQ
. . :::::.:::.:: : :.:.:.. :.. .. : :::::...: ...
CCDS43 SRCQRCISELKDIRLQLEACETRTVHRLR----LPLDKEPARECAQRIAEQQKAQAEVEG
990 1000 1010 1020 1030
1110 1120 1130 1140 1150 1160
pF1KE0 LRSDLDAVSMKCDSFLHQSPSSSSVPTLRSELNLLVEKMDHVYGLSTVYLNKLKTVDVIV
: . . .: . .. : : ..:::::::.: . :...: .::..::.::::.....
CCDS43 LGKGVARLSAEAEKVLALPEPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVI
1040 1050 1060 1070 1080 1090
1170 1180 1190 1200 1210 1220
pF1KE0 RSIQDAELLVKGYEIKLSQEEVVLADLSALEAHWSTLRHWLSDVKDKNSVFSVLDEEIAK
:. : :: .....: .:.. ..: : : ::: ..:.. .... .. .:..: .:.
CCDS43 RGTQGAEEVLRAHEEQLKEAQAVPATLPELEATKASLKKLRAQAEAQQPTFDALRDELRG
1100 1110 1120 1130 1140 1150
1230 1240 1250 1260 1270 1280
pF1KE0 AKVVAEQMSRLTPERNLDLERYQEKGSQLQERWHRVIAQLEIRQSELESIQEVLGDYRAC
:. :.:.... ::....::..:. .:: :::. :.:: ..:: :::.. . : ::
CCDS43 AQEVGERLQQRHGERDVEVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRES
1160 1170 1180 1190 1200 1210
1290 1300 1310 1320 1330 1340
pF1KE0 HGTLIKWIEETTAQQEMMKPGQAEDSRVLSEQLSQQTALFAEIERNQTKLDQCQKFSQQY
: :.... .::... ::... ::: :. ::. ::::. :...::.:..::
CCDS43 ADPLGAWLQDARRRQEQIQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQY
1220 1230 1240 1250 1260 1270
1350 1360 1370 1380 1390 1400
pF1KE0 STIVKDYELQLMTYKAFVESQQKSPGKRRRMLSSSDAITQEFMDLRTRYTALVTLTTQHV
. .:::::::.:::: .: ::.:. .. :.:... ::..::::.:. :.:::.:..
CCDS43 INAIKDYELQLVTYKAQLEPVA-SPAKKPKVQSGSESVIQEYVDLRTHYSELTTLTSQYI
1280 1290 1300 1310 1320 1330
1410 1420 1430 1440 1450 1460
pF1KE0 KYISDALRRLEEEEKVVEEEKQEHVEKVKELLGWVSTLARNTQGKATSSETKESTDIEKA
:.::..:::.::::...:... :. :.. :. ..: .. : . ...: ... :
CCDS43 KFISETLRRMEEEERLAEQQRAEERERLAEVE---AALEKQRQLAEAHAQAKAQAEREAK
1340 1350 1360 1370 1380 1390
1470 1480 1490 1500 1510 1520
pF1KE0 ILEQQVLSEELTTKKEQVSEAIKTSQIFLAKHGHKLSEKEKKQISEQLNALNKAYHDLCD
: :: ..::.. ..: . .: ...:..:.:.:. : .. .
CCDS43 EL-QQRMQEEVVRREEAAVDA----------------QQQKRSIQEELQQLRQSSE----
1400 1410 1420 1430
1530 1540 1550 1560 1570 1580
pF1KE0 GSANQLQQLQSQLAHQTEQKTLQKQQNTCHQQLEDLCSWVGQAERALAGHQGRTTQ---Q
. : . :.. :.... . .... . . ::: : :: : . ..:. . :
CCDS43 -AEIQAKARQAEAAERSRLR-IEEEIRVVRLQLEATERQRGGAEGELQALRARAEEAEAQ
1440 1450 1460 1470 1480 1490
1590 1600 1610 1620 1630 1640
pF1KE0 DLSALQKNQSDLKDLQDDIQNRATSFATVVKDIEGFMEENQTKLSPRELTALREKLHQAK
.: .. . ...::. : . . . ... ... : . : : : ::.: ::.
CCDS43 KRQAQEEAERLRRQVQDESQRKRQAEVELASRVKAEAEAAREK--QRALQALEELRLQAE
1500 1510 1520 1530 1540 1550
1650 1660 1670 1680 1690 1700
pF1KE0 EQYEALQEETRVAQKELEEAVTSALQQETEKSKAAKELAENKKKIDALLDWVTSVGSSGG
: : :. : :.:.: . :: . .: :: ..:. .: . . .
CCDS43 EA------ERRLRQAEVERARQVQVALETAQRSAEAEL-QSKR---------ASFAEKTA
1560 1570 1580 1590
1710 1720 1730 1740 1750
pF1KE0 QLLTNLPGMEQLSGASL----EKGALDTTDGYMGVNQAPEKLD----KQCEMMKARHQ-E
:: .: :... :.: :. : . ... . ..: ..:. : : .. : : :
CCDS43 QLERSLQ-EEHVAVAQLREEAERRAQQQAEAERAREEAERELERWQLKANEALRLRLQAE
1600 1610 1620 1630 1640 1650
1760 1770 1780 1790 1800
pF1KE0 LLSQQQNFILAT---QSAQAFLDQHGHNLTPEEQQMLQQKLGELKEQYSTSLAQSEAELK
..::... : :. .: . . .. ::: . :..:.: . . . .::.. :.
CCDS43 EVAQQKSLAQAEAEKQKEEAEREARRRG-KAEEQAVRQRELAEQELEKQRQLAEGTAQ--
1660 1670 1680 1690 1700 1710
1810 1820 1830 1840 1850 1860
pF1KE0 QVQTLQDELQKFLQDHKEFESWLERSEKELENMHKGGSSPETLPSLLKRQGSFSEDVISH
: . ..:: .. . .. :. . :.:: ... :. . ::: . .. .
CCDS43 QRLAAEQELIRLRAETEQGEQQRQLLEEELARLQR-----EAAAATQKRQ-ELEAELAKV
1720 1730 1740 1750 1760
1870 1880 1890 1900 1910 1920
pF1KE0 KGDLRFVTISGQKVLDMENSFKEGKEPSEIGNLVKDKLKDATERYTALHSKCTRLGSHLN
..... . : .. . :.. :: . :..:. . :. : . .:: .
CCDS43 RAEMEVLLASKARAEE------ESRSTSEKS---KQRLEAEAGRFRELAEEAARLRA---
1770 1780 1790 1800 1810
1930 1940 1950 1960 1970 1980
pF1KE0 MLLGQYHQFQNSADSLQAWMQACEANVEKLLSDTVASDPGVLQEQLATTKQLQEELAEHQ
:.. . : . .: : :: :..:.. .:. . . . . :.:. ::.
CCDS43 --LAEEAKRQRQLAEEDAARQRAEA--ERVLAEKLAAIGEATRLKTEAEIALKEKEAEN-
1820 1830 1840 1850 1860
1990 2000 2010 2020 2030 2040
pF1KE0 VPVEKLQKVARDIM----EIEGEPAPDHRHVQETTDSILSHFQSLSYSLAERSS-LLQKA
:.:...:.: ..: . : . ..: :..... : : ::.. :.. .
CCDS43 ---ERLRRLAEDEAFQRRRLEEQAAQHKADIEER----LAQLRKASDSELERQKGLVEDT
1870 1880 1890 1900 1910 1920
2050 2060 2070 2080 2090 2100
pF1KE0 IAQSQSVQESLESLLQSIGEVEQNLEGKQVSSLSSGVIQEALATNMKLKQDIARQKSSLE
. : ..:.: . .: :. :. :: : : :. ... ..... ::
CCDS43 LRQRRQVEEEILALKASF---EKAAAGKAELELELGRIRSNAEDTLR-----SKEQAELE
1930 1940 1950 1960 1970
2110 2120 2130 2140 2150 2160
pF1KE0 ATREMVTRFMETADSTTAAVLQGKLAEVSQRFEQLCLQQQEKESSLKKLLPQAEMFEHLS
:.:. :: . . :. .: .. ..: . : : ..:
CCDS43 AARQ----------RQLAAEEERRRREAEERVQKSLAAEEEAARQRKAALEEVE------
1980 1990 2000 2010
2170 2180 2190 2200 2210 2220
pF1KE0 GKLQQFMENKSRMLASGNQPDQDITHFFQQIQELNLEMEDQQENLDTLEHLVTELSSCGF
.:. .:. :. ..: . .. :. . :. :.. . . .... ::..
CCDS43 -RLKAKVEEARRLRERAEQESARQLQLAQEAAQKRLQAEEKAHAF-AVQQKEQELQQT--
2020 2030 2040 2050 2060 2070
2230 2240 2250 2260 2270 2280
pF1KE0 ALDLCQHQDRVQNLRKDFTELQKTVKEREKDASSCQEQLDEFRKLVRTFQKWLKETEGSI
: :.:. ...:: . .....: :. . ... . :. :. .. ::..
CCDS43 ---LQQEQSVLDQLRGEAEAARRAAEEAEEARVQAEREAAQSRRQVEEAER-LKQSA---
2080 2090 2100 2110 2120
2290 2300 2310 2320 2330 2340
pF1KE0 PPTETSMSAKELEKQIEHLKSLLDDWASKGTLVEEINCKGTSLENLIMEITAP-DSQGKT
: ... . . :.:.. .. :.. . .:. . . . :: :
CCDS43 --EEQAQARAQAQAAAEKLRKEAEQEAARRAQAEQAALRQKQAADAEMEKHKKFAEQTLR
2130 2140 2150 2160 2170 2180
2350 2360 2370 2380 2390
pF1KE0 DLTEIQCDMSDVNLKYEKLGGVLHERQESLQAILNRMEEVHKEANSVLQWLES---KEEV
. .... ... . :. :. . .: :: . . :. .. ..: . : : . :
CCDS43 QKAQVEQELTTLRLQLEETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSVRVQMEE
2190 2200 2210 2220 2230 2240
2400 2410 2420 2430 2440 2450
pF1KE0 LKSMDAMSSPTKTETVKAQAESNKAFLAELEQNSPKIQKVKEALAGLLVTYPNSQEAENW
:... : . . . .... :: : .. :...: : : : :. .:::
CCDS43 LSKLKARIEAENRALILRDKDNTQRFLQE---EAEKMKQVAEEAARLSVA---AQEAARL
2250 2260 2270 2280 2290
2460 2470 2480 2490 2500 2510
pF1KE0 KKIQEELNSRWERATEVTVARQRQLEESASHLACFQAAESQLRPWLMEKELMMGVLGPLS
... :: .. . .: . .. : . :..: ::..: ..::: . :.
CCDS43 RQLAEEDLAQQRALAEKMLKEKMQAVQEATRL----KAEAELLQ--QQKELAQEQARRLQ
2300 2310 2320 2330 2340 2350
2520 2530 2540 2550 2560 2570
pF1KE0 IDPNMLNAQ-KQQVQFMLKEFEARRQQHEQLNEAAQGILTGPGDVSLSTSQVQKELQSIN
: ... : ...: . . .::.::.. ... :. . ...: . ...... : .
CCDS43 EDKEQMAQQLAEETQGFQRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAEEDAQRFR
2360 2370 2380 2390 2400 2410
2580 2590 2600 2610 2620 2630
pF1KE0 QKWVELTDKLNSR--SSQIDQAIVKSTQYQELLQDL-SEKVRAVGQRLSVQSAISTQPEA
.. :. .::. ..: ..:.. . :. .: .:..: . .: .. . : ::
CCDS43 KQAEEIGEKLHRTELATQEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKE-KLQQEA
2420 2430 2440 2450 2460 2470
2640 2650 2660 2670 2680
pF1KE0 VKQQLEETSEIRSDLEQLDHEVKEAQT--LCDELSVLIGEQYLKDELKKRLET-----VA
::. . ::: .:.. : : .. :.: :.....: : .:: ::
CCDS43 KLLQLKSEEMQTVQQEQLLQETQALQQSFLSEKDSLLQRERFIEQE-KAKLEQLFQDEVA
2480 2490 2500 2510 2520
2690 2700 2710 2720 2730
pF1KE0 LPLQGLED-------LAADRINRLQAALASTQQFQQMFDE-LRTWLDDKQS--QQAKNCP
: :. . .: .:: :.. ... :. .: .: .. :. :: ..
CCDS43 KAQQLREEQQRQQQQMEQER-QRLVASMEEARRRQHEAEEGVRRKQEELQQLEQQRRQQE
2530 2540 2550 2560 2570 2580
2740 2750 2760 2770 2780 2790
pF1KE0 --ISAKLERLQSQLQENEEFQKSLNQHSGSYEVIVAEGESLLLSVPPGEEKRTLQNQLVE
.. . .::. ::: :: ... :: : ..: . ..: :.. .:
CCDS43 ELLAEENQRLREQLQLLEEQHRAALAHS---EEVTASQVAATKTLPNGRDALDGPAAEAE
2590 2600 2610 2620 2630 2640
2800 2810 2820 2830 2840 2850
pF1KE0 LKNHWEELSKKTADRQSRLKDC-MQKAQKYQWHVEDLVPWIEDCKAKMSELRVTLDPVQL
.. .. : .:.. . ::.. . .:.. : .. . : :. ..: : :
CCDS43 PEHSFDGLRRKVSAQ--RLQEAGILSAEELQRLAQGHTT--VDELARREDVRHYL---QG
2650 2660 2670 2680 2690
2860 2870 2880 2890 2900
pF1KE0 ESSL--LRSKAMLNEVEKRRSLLEILNS--AADILINSSEADE---DGIRDEKAGINQNM
.::. : :: ... .: . : : .: ::.... :. : .:... .:. .
CCDS43 RSSIAGLLLKATNEKLSVYAALQRQLLSPGTALILLEAQAASGFLLDPVRNRRLTVNEAV
2700 2710 2720 2730 2740 2750
2910 2920 2930 2940 2950 2960
pF1KE0 D--AVTEELQAKTGSLEEMTQRLREFQES-----FKNIEKKVEGAKHQLEIFDALGSQAC
.: ::. : : :. . .. . :. ..: . .: .....: :
CCDS43 KEGVVGPELHHKLLSAERAVTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEA---QIA
2760 2770 2780 2790 2800 2810
2970 2980 2990 3000 3010
pF1KE0 SNKNLEKLRAQQEVLQALEPQVDYLRN-FTQGLVEDAPDGSDASQLLHQAEVAQQ-EFLE
.. .. ..... . .: : :. : . . . : :: .. . . .. .. .:.
CCDS43 TGGVIDPVHSHR-----VPVDVAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQ
2820 2830 2840 2850 2860 2870
3020 3030 3040 3050 3060
pF1KE0 VKQRV----NSG-CVM-MENKLEGIGQF---HCRVREMFSQL---ADLDDELDGMGAIGR
. .: ..: :.. . .: :.. ..:..: . : . .: .
CCDS43 LLERCVEDPETGLCLLPLTDKAAKGGELVYTDSEARDVFEKATVSAPFGKFQGKTVTIWE
2880 2890 2900 2910 2920 2930
3070 3080 3090 3100 3110 3120
pF1KE0 DTDSLQSQIEDVRLFLNKIHVLKLDIEASEAECRHMLEEE---GTLDLLGLKRELEALNK
.: :. : .: .... .. .: ..::. : : . ::. . : .
CCDS43 IINSEYFTAEQRRDLLRQFRTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAEL
2940 2950 2960 2970 2980 2990
3130 3140 3150 3160 3170 3180
pF1KE0 QCGKLTERGKARQEQLELTLGRVEDFYRKLKGLNDATTAAEEAEALQWVVGTEVEIINQQ
... .: .: : : : :... . .. :. . .. . ..:. .: .:.
CCDS43 LESRVIDR------ELYQQLQRGE---RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQK
3000 3010 3020 3030 3040
3190 3200 3210 3220 3230
pF1KE0 LADFKMFQKEQVDPLQMK---LQQVNGLGQGLIQSAGKDCDV-QGLEHDM--EEINARWN
:. .. ..:. . : .: :. : :. . ... : .... . :.. .
CCDS43 LSIYNALKKDLL-PSDMAVALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPEFHEKLL
3050 3060 3070 3080 3090 3100
3240 3250 3260 3270 3280 3290
pF1KE0 TLNKKVA-QRIAQLQEALLHCGKFQDALEP------LLSWLADTEELIANQKPPSAEYKV
. .: :. : ... .. .: : ::. .: .. .: . :
CCDS43 SAEKAVTGYRDPYTGQSVSLFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDV
3110 3120 3130 3140 3150 3160
3300 3310 3320 3330 3340 3350
pF1KE0 VKAQIQEQKLLQRLLDDRKATVDMLQAEG-GRIAQSAELADREKITGQLESLESRWTELL
. :. .. .: :. .: . . . :. : .:: .: . :: .: :
CCDS43 ACARGCLDEETSRALSAPRADAKAYSDPSTGEPATYGELQQRCR-PDQLTGL--SLLPLS
3170 3180 3190 3200 3210
3360 3370 3380 3390 3400
pF1KE0 SKAA-ARQKQLEDILVLAKQFHETAE--PISDFL--SVTEKKLANSEPVGTQTAKIQQQI
::: :::..: . : . :..: :.. : .:: .: .:: ::. .:..
CCDS43 EKAARARQEELYSELQARETFEKTPVEVPVGGFKGRTVTVWELISSEYF---TAEQRQEL
3220 3230 3240 3250 3260 3270
3410 3420 3430 3440 3450 3460
pF1KE0 IRHKALNEEIVNRKKNVDQAIKNGQALLKQTTGEEV-LLIQEKLD--GIKTRYADITVTS
.: .. . : .:...:: :. : ::: : ::.:. :... . .
CCDS43 LR------QFRTGKVTVEKVIK---ILI--TIVEEVETLRQERLSFSGLRAPVPASELLA
3280 3290 3300 3310 3320
3470 3480 3490 3500 3510 3520
pF1KE0 SKALRTLEQARQLATKFQSTYEELTGWLREVEEELATSGGQSPTGEQIPQFQQRQKELKK
: .: . : .:: ..: ..:. : :. : :: . : : . ..:
CCDS43 SGVL-SRAQFEQLKDG-KTTVKDLSE-LGSVRTLLQGSGCLA--G--IYLEDTKEKVSIY
3330 3340 3350 3360 3370
3530 3540 3550 3560 3570 3580
pF1KE0 EVMEHRLVLDTVNEVSRALLELVPWRAREGLDKLVSDANEQYKLVSDTIGQRVDEIDAAI
:.:.. :. :. . ::: .: :. ::. . .: : ... :..
CCDS43 EAMRRGLLRATTAAL---LLEA---QAATGF--LVDPVRNQRLYVHEAV-------KAGV
3380 3390 3400 3410 3420
3590 3600 3610 3620 3630 3640
pF1KE0 QRSQQYEQAADAELAWVAETKRKLMALGPIRLEQDQTTAQLQVQKAFSI--DIIRHKDSM
. .:: .:: : . : .. . : : : . . . :... . : .
CCDS43 VGPELHEQLLSAEKA--VTGYRDPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGII
3430 3440 3450 3460 3470
3650 3660 3670 3680 3690
pF1KE0 DELFSHRSEI-----FGTCGEEQKTVLQEKTESLIQQYEAISLLNSERYARLERAQVLVN
: . ::: . : .::.. :: . ... .. . : ::: :.
CCDS43 DPVHSHRVPVDVAYQRGYFSEEMNRVLADPSDDTKGFFDPNTHENLTYRQLLERC---VE
3480 3490 3500 3510 3520 3530
3700 3710 3720 3730 3740 3750
pF1KE0 QFWETYEELSPWIEETRALIAQLPSPAIDHEQLRQQQEEMRQLRESIAEHKPHIDKLLKI
. :: .: : .: ... . . .:. :. :: . . . : .: ..
CCDS43 DP-ETGLRLLPLKGAEKAEVVET-TQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEV
3540 3550 3560 3570 3580 3590
3760 3770 3780 3790 3800 3810
pF1KE0 GPQLKELNPEEGEMVEEKYQKAENMYA-QIKEEVRQRALALDEAVSQSTQITEFHDKIEP
. ..: ::: :.:. : : . ...: . . . ..:.: . .
CCDS43 --MQSDLIPEE--------QRAQLMADFQAGRVTKERMIIIIIEIIEKTEIIR-----QQ
3600 3610 3620 3630
3820 3830 3840 3850 3860 3870
pF1KE0 MLETLENLSSRLRMPPLIPAEVDKIR--ECISDNKSATVELEKLQPSFEALKRRGEELIG
: . . . :: :. :.. ... . . .. . : . . .. : :
CCDS43 GLASYDYVRRRLTAEDLFEARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGV
3640 3650 3660 3670 3680 3690
3880 3890 3900 3910 3920 3930
pF1KE0 RSQGADKDLAAKEIQDKLDQMVFFWEDIKARAEEREIK--FLDVLELAEKFWYDMAALLT
:. . :. : . : . .. : . : . .:: .. .:.. : :.
CCDS43 YLPGSRQTLS---IYQALKKGLLSAEVARLLLEAQAATGFLLDPVK-GERLTVDEAVRKG
3700 3710 3720 3730 3740 3750
3940 3950 3960 3970 3980
pF1KE0 TI-KDTQDIVHDLESP--GIDPSIIKQQVEAAETIKEETDGLHEELEFIRILGADLIFAC
. . .: . . : : .: . ...:.: .: : :.: :.: :
CCDS43 LVGPELHDRLLSAERAVTGYRDPYTEQTISLFQAMKKELIPTEEAL---RLLDAQL--AT
3760 3770 3780 3790 3800 3810
3990 4000 4010 4020 4030 4040
pF1KE0 GETEKPEVRKSID-EMNNAWENLNKTWKERLEKLEDAMQAAVQYQDTLQAMFDWLDNTVI
: :.. . :. ::: ...: . . ... :. . . . : .
CCDS43 GGIVDPRLGFHLPLEVAYQRGYLNKDTHDQLSE-PSEVRSYVDPSTDERLSYTQL----L
3820 3830 3840 3850 3860
4050 4060 4070 4080 4090 4100
pF1KE0 KLCTMPPVGTDLNTVKDQLNEMKEFKVEVYQQQIEMEKLNHQGELMLKKATDETDRDIIR
. : :: . . :.. ... . ..:: :: ::. ... ::. .:
CCDS43 RRCRRDD-GT--GQLLLPLSDARKLTFRGLRKQITME------ELVRSQVMDEATALQLR
3870 3880 3890 3900 3910
4110 4120 4130 4140 4150 4160
pF1KE0 EPLTELKHLWENLGEKIAHRQHKLEGALLALGQFQHALEELMSWLTHTEELLDAQRPISG
: :: .... .:: :. :::. : : : .: .: .. . :: ..
CCDS43 EGLTSIEEVTKNL-------QKFLEGTSCIAGVFVDATKERLSVYQAMKKGI--IRPGTA
3920 3930 3940 3950 3960
4170 4180 4190 4200 4210 4220
pF1KE0 DPKVIEVELAKHHVLKNDVLAHQATVETVNKAGNELLESSAGDDASSLRSRLEAMNQCWE
...:.. : .:. . . . . ::: . . :
CCDS43 -FELLEAQAATGYVI-DPIKGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGK
3970 3980 3990 4000 4010 4020
4230 4240 4250 4260 4270 4280
pF1KE0 SVLQKTEEREQQLQSTLQQAQGFHSEIEDFLLELTRMESQLSASKPTGGLPETAREQLDT
CCDS43 LISLFQAMKKGLILKDHGIRLLEAQIATGGIIDPEESHRLPVEVAYKRGLFDEEMNEILT
4030 4040 4050 4060 4070 4080
5300 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 20:04:22 2016 done: Sun Nov 6 20:04:25 2016
Total Scan time: 15.100 Total Display time: 8.790
Function used was FASTA [36.3.4 Apr, 2011]