FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1773, 3298 aa
1>>>pF1KA1773 3298 - 3298 aa - 3298 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.1901+/-0.0011; mu= 15.1722+/- 0.066
mean_var=184.8097+/-37.421, 0's: 0 Z-trim(109.9): 198 B-trim: 75 in 1/53
Lambda= 0.094343
statistics sampled from 11033 (11233) to 11033 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.345), width: 16
Scan time: 11.210
The best scores are: opt bits E(32554)
CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298) 21809 2983.0 0
CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916) 2612 370.1 1.2e-100
CCDS47150.1 DCHS2 gene_id:54798|Hs108|chr4 (1369) 1679 242.9 1.1e-62
CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4 (4981) 1467 214.5 1.5e-53
CCDS4317.1 FAT2 gene_id:2196|Hs108|chr5 (4349) 1289 190.2 2.6e-46
CCDS48141.1 PCDH19 gene_id:57526|Hs108|chrX (1100) 1201 177.8 3.7e-43
CCDS43976.1 PCDH19 gene_id:57526|Hs108|chrX (1101) 1201 177.8 3.7e-43
CCDS55462.1 PCDH19 gene_id:57526|Hs108|chrX (1148) 1201 177.8 3.8e-43
CCDS47177.1 FAT1 gene_id:2195|Hs108|chr4 (4588) 1144 170.5 2.4e-40
CCDS75345.1 PCDHGA11 gene_id:56105|Hs108|chr5 ( 837) 1121 166.8 5.6e-40
CCDS47294.1 PCDHGA11 gene_id:56105|Hs108|chr5 ( 935) 1121 166.8 6.1e-40
CCDS75343.1 PCDHGA10 gene_id:56106|Hs108|chr5 ( 850) 1110 165.3 1.6e-39
CCDS47292.1 PCDHGA10 gene_id:56106|Hs108|chr5 ( 936) 1110 165.3 1.7e-39
CCDS54930.1 PCDHGA11 gene_id:56105|Hs108|chr5 ( 750) 1084 161.7 1.7e-38
CCDS75331.1 PCDHGA4 gene_id:56111|Hs108|chr5 ( 851) 1078 160.9 3.3e-38
CCDS58979.2 PCDHGA4 gene_id:56111|Hs108|chr5 ( 962) 1078 161.0 3.6e-38
CCDS75338.1 PCDHGA8 gene_id:9708|Hs108|chr5 ( 820) 1075 160.5 4.2e-38
CCDS47291.1 PCDHGA8 gene_id:9708|Hs108|chr5 ( 932) 1075 160.5 4.7e-38
CCDS75335.1 PCDHGA6 gene_id:56109|Hs108|chr5 ( 818) 1069 159.7 7.4e-38
CCDS75342.1 PCDHGB6 gene_id:56100|Hs108|chr5 ( 820) 1068 159.6 8.2e-38
CCDS4269.1 PCDH12 gene_id:51294|Hs108|chr5 (1184) 1071 160.1 8.2e-38
CCDS54926.1 PCDHGA6 gene_id:56109|Hs108|chr5 ( 932) 1069 159.7 8.2e-38
CCDS75341.1 PCDHGA9 gene_id:56107|Hs108|chr5 ( 828) 1068 159.6 8.3e-38
CCDS54929.1 PCDHGB6 gene_id:56100|Hs108|chr5 ( 930) 1068 159.6 9e-38
CCDS58981.1 PCDHGA9 gene_id:56107|Hs108|chr5 ( 932) 1068 159.6 9.1e-38
CCDS47289.1 PCDHGA2 gene_id:56113|Hs108|chr5 ( 932) 1063 158.9 1.5e-37
CCDS75344.1 PCDHGB7 gene_id:56099|Hs108|chr5 ( 808) 1060 158.5 1.7e-37
CCDS54922.1 PCDHGA1 gene_id:56114|Hs108|chr5 ( 931) 1061 158.6 1.8e-37
CCDS47293.1 PCDHGB7 gene_id:56099|Hs108|chr5 ( 929) 1060 158.5 1.9e-37
CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 1054 158.1 8.4e-37
CCDS75346.1 PCDHGA12 gene_id:26025|Hs108|chr5 ( 820) 1041 155.9 1e-36
CCDS4260.1 PCDHGA12 gene_id:26025|Hs108|chr5 ( 932) 1041 155.9 1.2e-36
CCDS75336.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 817) 1033 154.8 2.2e-36
CCDS54927.1 PCDHGA7 gene_id:56108|Hs108|chr5 ( 932) 1033 154.8 2.5e-36
CCDS4243.1 PCDHB1 gene_id:29930|Hs108|chr5 ( 818) 1030 154.4 3e-36
CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10 (1381) 1007 151.4 3.9e-35
CCDS4257.1 PCDHB15 gene_id:56121|Hs108|chr5 ( 787) 1000 150.3 4.9e-35
CCDS75326.1 PCDHA11 gene_id:56138|Hs108|chr5 ( 810) 992 149.2 1.1e-34
CCDS47284.1 PCDHA11 gene_id:56138|Hs108|chr5 ( 949) 992 149.3 1.2e-34
CCDS75334.1 PCDHGB3 gene_id:56102|Hs108|chr5 ( 814) 972 146.5 7e-34
CCDS58980.1 PCDHGB3 gene_id:56102|Hs108|chr5 ( 929) 972 146.5 7.7e-34
CCDS4253.1 PCDHB11 gene_id:56125|Hs108|chr5 ( 797) 956 144.3 3.1e-33
CCDS4254.1 PCDHB12 gene_id:56124|Hs108|chr5 ( 795) 955 144.2 3.4e-33
CCDS4251.1 PCDHB16 gene_id:57717|Hs108|chr5 ( 776) 946 142.9 7.8e-33
CCDS4244.1 PCDHB2 gene_id:56133|Hs108|chr5 ( 798) 938 141.9 1.7e-32
CCDS4250.1 PCDHB8 gene_id:56128|Hs108|chr5 ( 801) 928 140.5 4.4e-32
CCDS4245.1 PCDHB3 gene_id:56132|Hs108|chr5 ( 796) 926 140.2 5.3e-32
CCDS4249.1 PCDHB7 gene_id:56129|Hs108|chr5 ( 793) 911 138.2 2.2e-31
CCDS75328.1 PCDHB9 gene_id:56127|Hs108|chr5 ( 797) 911 138.2 2.2e-31
CCDS4246.1 PCDHB4 gene_id:56131|Hs108|chr5 ( 795) 902 137.0 5.1e-31
>>CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11 (3298 aa)
initn: 21809 init1: 21809 opt: 21809 Z-score: 16040.9 bits: 2983.0 E(32554): 0
Smith-Waterman score: 21809; 100.0% identity (100.0% similar) in 3298 aa overlap (1-3298:1-3298)
10 20 30 40 50 60
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 IGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 TPDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TPDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 ALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQAL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 LDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEINRRQSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEINRRQSE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 GDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTVHVRDANDNQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTVHVRDANDNQP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 SMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 IYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYEL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 EPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 EPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 TATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 DGGGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DGGGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 SYHILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SYHILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 VPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLD
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 AVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDT
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 VLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA1 GPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA1 QVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKA
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA1 ELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA1 TYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVA
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KA1 VLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPG
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KA1 SELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEP
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KA1 PPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGALTYTLVGGADPEGTFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGALTYTLVGGADPEGTFA
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KA1 LDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDP
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KA1 LALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRG
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KA1 LDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPP
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KA1 GPAALHVVARDPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GPAALHVVARDPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVV
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KA1 ASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGA
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KA1 NGQVTYGGVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NGQVTYGGVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVA
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KA1 VEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVL
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KA1 DLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAY
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KA1 SVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDRE
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KA1 QCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPT
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KA1 LALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVA
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KA1 TDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNG
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KA1 PITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLT
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KA1 LQDANDNAPRFLRPHYVAFLPESRPLEGPLLQVEADDLDQGSGGQISYSLAASQPARGLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LQDANDNAPRFLRPHYVAFLPESRPLEGPLLQVEADDLDQGSGGQISYSLAASQPARGLF
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KA1 HVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIPQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIPQP
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KA1 WELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 WELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFE
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KA1 QCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSA
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KA1 TDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAP
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KA1 GRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDY
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KA1 SIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQP
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KA1 PQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFT
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KA1 VSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVN
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750 2760
pF1KA1 DHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFAL
2710 2720 2730 2740 2750 2760
2770 2780 2790 2800 2810 2820
pF1KA1 NSSTGELRARVPFDYEHTESFRLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NSSTGELRARVPFDYEHTESFRLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHF
2770 2780 2790 2800 2810 2820
2830 2840 2850 2860 2870 2880
pF1KA1 QVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSSPYFGINQTTGALYLRVDSRAPGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSSPYFGINQTTGALYLRVDSRAPGSG
2830 2840 2850 2860 2870 2880
2890 2900 2910 2920 2930 2940
pF1KA1 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
2890 2900 2910 2920 2930 2940
2950 2960 2970 2980 2990 3000
pF1KA1 VAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPSPPPSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPSPPPSE
2950 2960 2970 2980 2990 3000
3010 3020 3030 3040 3050 3060
pF1KA1 HLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVASVASSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVASVASSL
3010 3020 3030 3040 3050 3060
3070 3080 3090 3100 3110 3120
pF1KA1 AARGPDSGIQQDADGLSDTSCEPPAPDTWYKGRKAGLLLPGAGATLYREEGPPATATAFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AARGPDSGIQQDADGLSDTSCEPPAPDTWYKGRKAGLLLPGAGATLYREEGPPATATAFL
3070 3080 3090 3100 3110 3120
3130 3140 3150 3160 3170 3180
pF1KA1 GGCGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GGCGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVF
3130 3140 3150 3160 3170 3180
3190 3200 3210 3220 3230 3240
pF1KA1 TEIARLKDEARPCPPAPRIDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRSPIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TEIARLKDEARPCPPAPRIDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRSPIS
3190 3200 3210 3220 3230 3240
3250 3260 3270 3280 3290
pF1KA1 HEGSLSSAAMSPSFSPSLSPLAARSPVVSPFGVAQGPSASALSAESGLEPPDDTELHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HEGSLSSAAMSPSFSPSLSPLAARSPVVSPFGVAQGPSASALSAESGLEPPDDTELHI
3250 3260 3270 3280 3290
>>CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4 (2916 aa)
initn: 2202 init1: 678 opt: 2612 Z-score: 1920.4 bits: 370.1 E(32554): 1.2e-100
Smith-Waterman score: 4890; 33.7% identity (61.2% similar) in 2913 aa overlap (495-3296:79-2916)
470 480 490 500 510 520
pF1KA1 VNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHW----
::: : :.: : . ::: : ..
CCDS37 LKRGSPETELWGAIVFRSQEENAKPVKETEVTASDADSGLYGFIEYSLYDGFLSYEAPQA
50 60 70 80 90 100
530 540 550 560
pF1KA1 FSIDPTSGIITTAASLDYELEPQP-QLIVVATDGG---LPPLA-------SSATVSVALQ
: ::: .: : .. ..: : .: .:.: : :: . :: ..: : : :.
CCDS37 FRIDPHDGQICVSQDIDRERDPATYDLLVEAKDGDEQRMTHLALVKGGLSAQAFVRVDLE
110 120 130 140 150 160
570 580 590 600 610 620
pF1KA1 DVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPF
:::::.: :. . : .:. . ::::: ...: ::: ::: .: ..: : : :: :
CCDS37 DVNDNHPVFNPSTYVTSISDETQPGTEIINVLATDQDSGIYGTVAYELIPGNVSSL---F
170 180 190 200 210 220
630 640 650 660 670 680
pF1KA1 RIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGGGLKSMV-YVKVFLSDENDNPPQFYPR
::. .: . :. .:.. ..:. .. .. : . : :.
CCDS37 TIDSTTGLYSPEVEIL-----SAVNFSADKEVMNSLEMFLPLLRHFKKVERDEEAAEKKF
230 240 250 260 270 280
690 700 710 720 730 740
pF1KA1 EYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPL
: . . . . :...: .. :. . . .:. . : : :.. .. ::
CCDS37 EASRGWFMRFKGRRHLHYLKVQDEAASADGEAAARYVANLAK---ILGE--GIIYLTLPL
290 300 310 320 330
750 760 770 780 790 800
pF1KA1 ARRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTS
.. .....: ..:.::::: : .: : : : : .: ::. .:.: : ::: .
CCDS37 SHLESTTLSLMVSAQDGGGLTAVINADVTIHIFQTTLAPAEFERPKYTFLVYEDVPEDSP
340 350 360 370 380 390
810 820 830 840 850 860
pF1KA1 VGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRAG
.: :.:..: . :. .:.:: : ::. : ..: .:::.: ::. : :.:
CCDS37 IGTVKAREPLNSSEPIFYRISSGDLGGKFSIHPRLGTIRTRKPLDHETQ-PVVVLTVQAQ
400 410 420 430 440 450
870 880 890 900 910 920
pF1KA1 SGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSR
: :: . ..: . . ::::: ::: : . . .: ::: .: :: : ::: :.
CCDS37 LGSAPACSSTEVNITVMDVNDNHPAFLRTSDEIRISQTTPPGTALYLARAEDRDSGRNGL
460 470 480 490 500 510
930 940 950 960 970 980
pF1KA1 VTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLRVVV
. ... . :.:..: . : . : :: . : :.:.: : :... . : ::.
CCDS37 IRYSIASPQPGVFAIDRALGVLFLNGSLGAGEQRELTLTLRAEDQGVHPQAALLVLTVVI
520 530 540 550 560 570
990 1000 1010 1020 1030 1040
pF1KA1 QDVGTRGLAPR--FNSPTYRVDLPSGTTAGTQVLQVQAQAPDG-----GPITYHLAAEGA
. : .: :. .:.:.. . . ::.::.::. : : .:. : :
CCDS37 EK---REHSPSWTFEHLVYQVEVSESLSPMTQMLQTQAH-PLGPQRAASPLRYSLEPSVD
580 590 600 610 620 630
1050 1060 1070 1080 1090 1100
pF1KA1 SSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILNQNEH
:. ::..: .::...: .: :. . : ..:.: . : :. ..:: : . ..:..
CCDS37 SAMFGIRPYTGWIYLRRQFDYESTQTYNFRVFAWIPEDGFL--QNVSTTVIVRVWDENDN
640 650 660 670 680
1110 1120 1130 1140 1150 1160
pF1KA1 SPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKAFRIHPQTG
:: . .: :: : :. : .:.. : : ::: ::.: : : :: :.: :...:.::
CCDS37 SPTFLHDVLFLKVEESPVPQGVIGKITAIDMDSGKNGQLLYFL--LS-DGKFFKMNPNTG
690 700 710 720 730 740
1170
pF1KA1 EVTT------------------------LQT--------------------LDREQQSSY
. : ::. ::::... .
CCDS37 PAGTIYVITWADGAAAFSGTDFAFSSDELQAFVLKSLFCELGEGELINWVALDREHRGHH
750 760 770 780 790 800
1180 1190 1200 1210 1220 1230
pF1KA1 QLLVQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVT
.. : : : :::::..: .:.:.: :.::: : : : : : ..: . : . :::
CCDS37 EMTVLVTDRGSPPRNATMAVYVSVTDINDNRPFFPQC--LPGKELHVKVLEGQPVNMLVT
810 820 830 840 850 860
1240 1250 1260 1270 1280 1290
pF1KA1 TLQAKDPDEGENGTILYTLTGP-GSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQ
:. :::::::.:. . :.... .:. :.. ..::. :.. : :: : ... : ::
CCDS37 TVFAKDPDEGNNAEVTYSVSSEDSSDHFKIDANNGEIRTTTILSYDYRPSYRMSVIATDQ
870 880 890 900 910 920
1300 1310 1320 1330 1340 1350
pF1KA1 GSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAA
: :: ... . .::.: :.. ... .: :.:.: .... . .
CCDS37 GVPPLQGQAVVNIQVIP---LSKGRAIMSQNIRHLIIP--------ENLKPTKIMSLIKS
930 940 950 960 970
1360 1370 1380 1390 1400 1410
pF1KA1 PEPAGV---GALTYTLVGGADPEGTFALDAASGRLYLARPLDFEAGPPW--RALTVRAEG
. : : ...:. : .: : .:...: :.:.. ::.:. . :..:. ..
CCDS37 SDHLQQHYNGKLHFSIVAD-DKDGHFEIDSSTGDLFLSKELDYETTSHYLFRVITTD-HS
980 990 1000 1010 1020 1030
1420 1430 1440 1450 1460 1470
pF1KA1 PGGAGARLLRVQVQVQDENEHAPAFARDPLALALPENPEPGAALYTFRASDADGPGPNSD
. . . . ....:.:.:.:.:.: . ..... :: :. .:.: :.: :: ::
CCDS37 KNLSLSSTVFLSIDVEDQNDHSPSFQDELIVISVEENVPIGTLVYVFNAKDDDGSFLNSR
1040 1050 1060 1070 1080 1090
1480 1490 1500 1510 1520 1530
pF1KA1 VRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVS
..: . ..: . . . :.: . ::::. :...: : :.:. .:.. :: ..
CCDS37 IQYYIESHNPGTNPFLIHPSFGTLVTVSRLDRESIPTVILTVTASDQAVNVTDRRLRSLT
1100 1110 1120 1130 1140 1150
1540 1550 1560 1570 1580 1590
pF1KA1 ARVFVTDENDNAPVFASPSRVRLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGDGH
:.. . : ::. :.: : ... :: : . :..:.::: :. ..:.: . ::...
CCDS37 AQIVILDVNDHNPTFISFPNAHVKEDVTVGSLVHHITAHDPDEGRNGKVTYSILSGNENM
1160 1170 1180 1190 1200 1210
1600 1610 1620 1630 1640 1650
pF1KA1 -FRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQ
: : :.: :... ::: :....:.:::.: : :.: :..:.:::.: :::::::.:.
CCDS37 TFMLDESSGLLTTTCPLDYEMKTQHILTVLALDDGTPALSSSQTLTVTVLDVNDEAPVFK
1220 1230 1240 1250 1260 1270
1660 1670 1680 1690 1700
pF1KA1 QQEYSVLLRENNPPGTSLLTLRATDPDVGANGQVTY---GGVSSESFSLDPDTGVLTTLR
:. : . ..::. :: . ..: : : :.:... . :.: : : .. ::: ..:
CCDS37 QHLYEASVKENQNPGEFVTRVEALDRDSGVNSKLQFEIMPGASFELFEINSDTGEVVTTT
1280 1290 1300 1310 1320 1330
1710 1720 1730 1740 1750 1760
pF1KA1 ALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVEDENDHAPTFGSAHLSLEVPEGQDPQ
:::: :: ..: : ..: : : . .:. .::::::::: : . ..:: :.:.:.
CCDS37 ILDREIQEVFTLRVLVRDGGFPSLSSTTTILCTVEDENDHAPEFIVSSYDIEVLENQEPE
1340 1350 1360 1370 1380 1390
1770 1780 1790 1800 1810 1820
pF1KA1 TLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEA
.. . ::: :.: : ..:.:.::. . :... :::..: : :::: : : :
CCDS37 VVYTVLASDMDAGNNRAVEYHIIDGNTDECFTINEMSGELSTTRALDREQISNFTLVILC
1400 1410 1420 1430 1440 1450
1830 1840 1850 1860 1870 1880
pF1KA1 RDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGAN
: :.: :... : : :::::::.:.::. :. : ::. .::..: :.: : : : :
CCDS37 SDLGDPPRSSVIHLQVRVLDANDHSPSFPTLYYQSSVREDAEVGTVVLVLSAVDKDEGLN
1460 1470 1480 1490 1500 1510
1890 1900 1910 1920 1930 1940
pF1KA1 GHVTYYLGAGTAGAFLLEPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVSVT
:.. :.: ..::: ..: :: :.:. .:::: ..:::. : : . : :::: .
CCDS37 GQTEYFLTDEASGAFTIDPMSGTLKTSNTLDREARSQHTFSAVARDCSIQGSRSTTVIIK
1520 1530 1540 1550 1560 1570
1950 1960 1970 1980 1990 2000
pF1KA1 ITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRLAGTP
. : ::::. :.. .:. . : .:. .: .. .::.: : : :..... .: :
CCDS37 VYVTDVNDNDPVLEQNPFDVFLSPESPTNQTTVI----VRADDLDLGPNGTVVFSFAETQ
1580 1590 1600 1610 1620
2010 2020 2030 2040 2050 2060
pF1KA1 PPGTTVDSYTGEIRVARSPVA-LGPRDRVLFIVATDLGRPARSATGVIIVGLQGEAERGP
..:.:::::. ..: . : : . .:: : :::..::.... ..:: .
CCDS37 SM-FSIDKYTGEIQFQQNPSSEYFPI--WLQLKVTDQGIPARTTTGLLVIHMEGEDVK-I
1630 1640 1650 1660 1670 1680
2070 2080 2090 2100 2110 2120
pF1KA1 RFPRASSEATIRENAPPGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFSIQPSTGAITV
: . .. . :: :: ::. .: . . . :::.:::: :..:. ..: .::
CCDS37 SFSHHLYKGLVTENCEAGTSIVTVKAFAPDSIQDSMKYSIFSGNEDGVLSLCSKSGQLTV
1690 1700 1710 1720 1730 1740
2130 2140 2150 2160 2170 2180
pF1KA1 RSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLTLQDANDNAPRFLRPHYVAFLPESRPL
. . ::::: ...:.. :::.: :. ... .:: :::.: : . : : . ::.
CCDS37 KEPKFLDFEVRNEVQLIVLAESSGHRAYCKVAVLIQDENDNSPCFEQSIYQASVSESQLY
1750 1760 1770 1780 1790 1800
2190 2200 2210 2220 2230 2240
pF1KA1 EGPLLQVEADDLDQGSGGQISYSLAASQPARGLFHVDPTTGTITTTAILDREIWAETRLV
.. ..:: : :::.: .: : ::. ... .. :..: .:.::: :::: :. . :.
CCDS37 NAHVIQVFATDLDSGLNGLIEYSILSGNQEEA-FQIDALSGVITTKAILDYELTSSYSLI
1810 1820 1830 1840 1850 1860
2250 2260 2270 2280 2290 2300
pF1KA1 LMATDRGSPALVGSATLTVMVIDTNDNRPTIPQPWELRVSEDALLGSEIAQVTGNDVDSG
..:::.: : : ..... :.: : ::: :.. ....::.: : ...:. .::: .
CCDS37 VQATDKGMPRLSNTTVIKVQVTDINDNAPAFLPSEAVEITEDSLPGVIVTHVSVHDVDLN
1870 1880 1890 1900 1910 1920
2310 2320 2330 2340 2350 2360
pF1KA1 PVLWYVLSP-SGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVL
.. . .. :.: :.. . : : :. ::::. .:.: . :. : .. :.:
CCDS37 SAFIFSFAKESNPGTKFAIDQNTGVVVLVKTLDFEEMTEYELLIQISDSVHYTEGALVVR
1930 1940 1950 1960 1970 1980
2370 2380 2390 2400 2410 2420
pF1KA1 VEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVD
: ::::: :.:::..::: . : : : ..:..:::: .:. : :::.. : . ::.:
CCDS37 VLDVNDNPPVFSQDFYQVTVPESIPVGYSVLTLSATDLESNEN--ISYRILSSSKEFSID
1990 2000 2010 2020 2030
2430 2440 2450 2460 2470 2480
pF1KA1 PNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAARATVHVQLQDQNDHAPSFTLS
:.:::.::: .. : : .... ..:: : : : : . :.. ..:.:..:: ::..
CCDS37 PKNGTIFTISPVLLL--DTISTTQFLVEASDGGNPDLRALTLVEIGIEDMNNYAPEFTVK
2040 2050 2060 2070 2080 2090
2490 2500 2510 2520 2530 2540
pF1KA1 HYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAG
: ....:: ::::.:. : : .: .. :.::::::: :..: .. . :
CCDS37 SYNLSLSEDALVGSTLVTFSNIDHDWTRENTYVEYSIISGNSQNNFHVETKFFH---SEY
2100 2110 2120 2130 2140 2150
2550 2560 2570 2580 2590 2600
pF1KA1 PGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRA
: . .: ::::. :: :. ....:.. :.: : :: ::.. ... ::::::::: :.
CCDS37 PY-KQVGYLVLLHSLDREASASHELVILASDSGCPPLSSTAVISIQVLDVNDNPPNFSSL
2160 2170 2180 2190 2200 2210
2610 2620 2630 2640 2650 2660
pF1KA1 SYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFTVSSGDPSGLFELDESSGTLRLAHAL
::.. : :.::.:... : :.: : : :. . ... ::. .: : :.:..:.: : . :
CCDS37 SYHTHVKESTPLGSHITVVSANDRDTGSHAEIIYNIISGNEKGHFYLEENTGVLYLIKPL
2220 2230 2240 2250 2260 2270
2670 2680 2690 2700 2710 2720
pF1KA1 DCETQARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLV
: : ... :.:::.: ::..: : . : : :::.: : .. .: : :: : .. .
CCDS37 DYEKMTKFTLTVQASDAEKKHFSFAVVFVSVLDDNDHAPQFMFSSFSCIVPENLPISSTI
2280 2290 2300 2310 2320 2330
2730 2740 2750 2760 2770 2780
pF1KA1 TTLHAIDGDAGAFGRLRYSLLEAGPGPEG----REAFALNSSTGELRARVPFDYEHTESF
...:.: ::: .:.: ::.. .: .. : .. ::...:. .:::. ...
CCDS37 CSINALDFDAGPYGELTYSIVSPCFLTHGMSYDHDLFLIDPLTGDIHAKQILDYENGNKY
2340 2350 2360 2370 2380 2390
2790 2800 2810 2820 2830 2840
pF1KA1 RLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHFQVPEGARRGHSLGHVQATDED
: : : : :. .::..: : . : ::..:.: . : .:: . . .:.:.:.: :
CCDS37 CLTVQAKDKGDATASLVVWVDIEGIDEFEPIFTQDQYFFTLPEKNKDRQLIGRVEASDAD
2400 2410 2420 2430 2440 2450
2850 2860 2870 2880 2890 2900
pF1KA1 GGADGLVLYSLATSSPYFGINQTTGALYLRVDSRA-PGSGTATSGGGGRTRREAPRELRL
.: ::..::::.::::.:..:.:.: .:: :: : ... . :..
CCDS37 AGIDGVILYSLGTSSPFFSVNKTNGNIYL---IRALPLI---------KSQLNKEDTLEM
2460 2470 2480 2490 2500
2910 2920 2930 2940 2950 2960
pF1KA1 EVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGAVAASLGVVVVLALAALVLGL
..::..: :. :. : :... .. : .: . ... .. .: : : ... .
CCDS37 KIIAHSPKSDSKFASCTVFVNVSFSSEG-TPLAVFASSFSISLVVSFLVFLILICILIVM
2510 2520 2530 2540 2550 2560
2970 2980 2990 3000 3010
pF1KA1 VRARSRKAEAAPGPMSQAAPLASDSLQKLGREPP---SPPPSEHLYHQTLPSYGGP---G
. ...: .... : .: .. :. . .. ....: . : .
CCDS37 ILRHKQKDTINNYEEKKTSSLDAD--LRVTRDASVLKAFQKTDDCSNEVVPVDATPEWLS
2570 2580 2590 2600 2610
3020 3030 3040 3050 3060
pF1KA1 AGGPYPRG--GSLDPSHSSGRGSAEA--AEDDEIRMINEFPRVASVASSLA---ARGPDS
. . . . :.:::. :.:. ::: ::. ::: : :.:. .: :::
CCDS37 LISIMEKDIVNLYRHSNSSGHCSVEGETAEDKEIQRINEHPYRKCSDSALSDHESRVPDS
2620 2630 2640 2650 2660 2670
3070 3080 3090 3100 3110 3120
pF1KA1 GIQQDADGLSDTSCEPPA---PDTWYKGRKAGLLLPGAG--ATLYREEGPPATATAFLGG
:: .:.: :: : : . .: .. : : : .: ... : :. .
CCDS37 GIPRDSDQLSCLSGETDVMVTAETAEASQTFGEGDQGEGCSTTCAQNNVLPQTVQKREAK
2680 2690 2700 2710 2720 2730
3130 3140 3150 3160 3170 3180
pF1KA1 CGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVFTE
.. . : . . .::.. ...... . .:.:.::::: :.::::::::..
CCDS37 ESILADVRKESVFISGDQEVRCAALSTQTTSDHDGKDNYHWNYLLSWEPKFQPLASVFND
2740 2750 2760 2770 2780 2790
3190 3200 3210 3220 3230
pF1KA1 IARLKDEARPCPPAPR-----IDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRS
::.:::: : :. . :::::::::.:: :.:::. :. . :: ::
CCDS37 IAKLKDEHLHMPGIPKEKKSFVFPPPLITAVAQPGIKAVPPR--MPAVNLGQVPPKHPRS
2800 2810 2820 2830 2840 2850
3240 3250 3260 3270 3280 3290
pF1KA1 PIS-HEGSLSSAAMSPSFSPSLSPLAARSPVVSPF---GVAQGPSASALSAESGLEPPDD
:: : ::: . :.:.:::::: :. . :..::. : : :. : :. :.
CCDS37 PIPYHLGSLPEG-MTPNFSPSLSLLTMQPPALSPLLREGELLGTHISGTCHE--LKAEDE
2860 2870 2880 2890 2900 2910
pF1KA1 TELHI
...
CCDS37 VQI
>>CCDS47150.1 DCHS2 gene_id:54798|Hs108|chr4 (1369 aa)
initn: 1324 init1: 591 opt: 1679 Z-score: 1238.7 bits: 242.9 E(32554): 1.1e-62
Smith-Waterman score: 2794; 39.4% identity (64.2% similar) in 1292 aa overlap (39-1257:61-1338)
10 20 30 40 50 60
pF1KA1 PSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTLIGDISAGL
:. .: .: :..:: : ::.::: :::
CCDS47 TPHGRSGSSGARTQRSLLWLLVHVWLWAASGSSAQLFNLTLSVDEGLPPDTLVGDIRAGL
40 50 60 70 80 90
70 80 90 100 110 120
pF1KA1 PAGTAAPLM-YFISAQ-EGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAVTPDGAT
::. .:.: . . : . :. . .:..:::: ::::.::.: :.:.: ::.
CCDS47 PAAQQQEGSGFFLSEDSDDSPLLDDFHVHPDTGIIRTARRLDRERRDHYSFVAATLLGAV
100 110 120 130 140 150
130 140 150 160 170 180
pF1KA1 VEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGYAL----
:.: .:: :.:::.: :: :.: : . :: . : :.: ::: ..::::.:
CCDS47 VQVEIRVNDVNDHSPRFPLDSLQLDVSELSPPGTAFRLPVAHDPDAGLFSTQGYTLVQPS
160 170 180 190 200 210
190 200 210 220
pF1KA1 --SGDGAGETFRLETR-PGPDGTPV-P---------ELVVTGELDRENRSHYMLQLEAYD
: :: :.:. : ::: .:. : .::. .::::. . . ::.::.:
CCDS47 DLPKDPAGPFFQLRYRTPGPLPSPLLPGSSSPLEPLDLVLLRRLDREEAAAHRLQIEAWD
220 230 240 250 260 270
230 240 250 260 270 280
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
:: : : . ... .:: ::. :.:.:..:.:.: :. ::. : .: :.: : : ::
CCDS47 GGRPRRTGLLSVELRVLDENDNPPVFEQDEYRAAVREDAQPGAEVCRVRATDRDLGPNGF
280 290 300 310 320 330
290 300 310 320 330
pF1KA1 VTYEINRRQSEGDGP----------FSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGA
: : . :: : : :... .:.... :::: : . :.:::.::::::
CCDS47 VRYSVRARQVPGAGSGGGALGDAAYFAVEELSGVVRVWRPLDREAQAWHQLVVEARDGGA
340 350 360 370 380 390
340 350 360 370 380 390
pF1KA1 HPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFA
.::.... :.. : :.:::.:.. :.::. : .:::.: ::. :::.:::: : ::.
CCDS47 EPEVATVRVSIAVLDVNDNRPAIHVLFLTEGGVARVSEGARPGDYVARVSVSDAD-GDWE
400 410 420 430 440
400 410 420 430 440
pF1KA1 H----------------VNVSLEGGEGHFALSTQDSV-IYLVCVARRLDREERDAYNLRV
. ...::::::: ::: ....:: :::: :: :.: .
CCDS47 KEDEATGELGVGLGDGSISLSLEGGEGDFALLPGGPPGVFFLCVEGPLDRESRDLYELLL
450 460 470 480 490 500
450 460 470 480 490 500
pF1KA1 TATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQ
.:::.::::: .: ...:.:.:.::. : :..: :. . :.: ::. :. :.: : :.
CCDS47 VATDAGSPPLSTEETLLLRVADLNDQPPLFSQQHYKAS-VSEAAAPGTVVMWVSASDADE
510 520 530 540 550 560
510 520 530 540
pF1KA1 -GTN-GQVTYSL----AP---GA------HTHW----FSIDPTSGIITTAASLDYELEPQ
:.. . . :.. :: :. :: :.:: :: :.: .:: :..
CCDS47 AGSDHAWLRYTVVQLSAPCNLGSLQSKMVHTAECGPSFAIDSESGAISTIRTLDREVQEA
570 580 590 600 610 620
550 560 570 580 590 600
pF1KA1 PQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTAT
.: ::: : : :::... ::....::::::: : : :::.. : . : :::::::.
CCDS47 VELKVVAQDLGEPPLSATCLVSITVDDVNDNEPIFWRQVYNATIAEHAPVGHCFLQVTAS
630 640 650 660 670 680
610 620 630 640 650 660
pF1KA1 DADSGPFGLLSYSLGAGLGSSGSPP-FRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDG
::::: .:.. ::: :. : .: :::: :.:..:... .::.. :...:. : : ::
CCDS47 DADSGLYGFIEYSLYDGFLSYEAPQAFRIDPHDGQICVSQDIDRERDPATYDLLVEAKDG
690 700 710 720 730 740
670 680 690 700 710 720
pF1KA1 GGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSY
:::.....:.: : : ::: : : : :..::: .. ::: .. . : : :.: .: ..:
CCDS47 GGLSAQAFVRVDLEDVNDNHPVFNPSTYVTSISDETQPGTEIINVLATDQDSGIYGTVAY
750 760 770 780 790 800
730 740 750 760 770 780
pF1KA1 HILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISIVP
... :: :::.: .:.. .. ::.. .....: ..:.::::: : .: : : :
CCDS47 ELIPGNVSSLFTIDSTTGIIYLTLPLSHLESTTLSLMVSAQDGGGLTAVINADVTIHIFQ
810 820 830 840 850 860
790 800 810 820 830 840
pF1KA1 GTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLDAV
: .: ::. .:.: : ::: . .: :.:..: . :. .:.:: : ::.
CCDS47 TTLAPAEFERPKYTFLVYEDVPEDSPIGTVKAREPLNSSEPIFYRISSGDLGGKFSIHPR
870 880 890 900 910 920
850 860 870 880 890 900
pF1KA1 SGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVL
: ..: .:::.: ::. : :.: : :: . ..: . . ::::: ::: : .
CCDS47 LGTIRTRKPLDHETQ-PVVVLTVQAQLGSAPACSSTEVNITVMDVNDNHPAFLRTSDEIR
930 940 950 960 970 980
910 920 930 940 950 960
pF1KA1 LPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSGGP
. .: ::: .: :: : ::: :. . ... . :.:..: . : . : :: .
CCDS47 ISQTTPPGTALYLARAEDRDSGRNGLIRYSIASPQPGVFAIDRALGVLFLNGSLGAGEQR
990 1000 1010 1020 1030 1040
970 980 990 1000 1010 1020
pF1KA1 AHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPR--FNSPTYRVDLPSGTTAGTQVL
: :.:.: : :... . : ::.. : .: :. .:.:.. . . ::.:
CCDS47 ELTLTLRAEDQGVHPQAALLVLTVVIEK---REHSPSWTFEHLVYQVEVSESLSPMTQML
1050 1060 1070 1080 1090 1100
1030 1040 1050 1060 1070
pF1KA1 QVQAQAPDG-----GPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAV
:.::. : : .:. : : :. ::..: .::...: .: :. . : ..:.:
CCDS47 QTQAH-PLGPQRAASPLRYSLEPSVDSAMFGIRPYTGWIYLRRQFDYESTQTYNFRVFAW
1110 1120 1130 1140 1150 1160
1080 1090 1100 1110 1120 1130
pF1KA1 SGSKAELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSG
. : :. ..:: : . ..:..:: . .: :: : :. : .:.. : : :::
CCDS47 IPEDGFL--QNVSTTVIVRVWDENDNSPTFLHDVLFLKVEESPVPQGVIGKITAIDMDSG
1170 1180 1190 1200 1210 1220
1140 1150 1160 1170 1180 1190
pF1KA1 PNGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTG
::.: : : :: :.: :...:.:::. . .::::... ... : : : :::::..:
CCDS47 KNGQLLYFL--LS-DGKFFKMNPNTGELINWVALDREHRGHHEMTVLVTDRGSPPRNATM
1230 1240 1250 1260 1270
1200 1210 1220 1230 1240 1250
pF1KA1 TVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYT
.:.:.: :.::: : : : : : ..: . : . ::::. :::::::.:. . :.
CCDS47 AVYVSVTDINDNRPFFPQC--LPGKELHVKVLEGQPVNMLVTTVFAKDPDEGNNAEVTYS
1280 1290 1300 1310 1320 1330
1260 1270 1280 1290 1300 1310
pF1KA1 LTGPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSA
..
CCDS47 VSSARPMPLKGKTAFGKQSCKKQTNKQTNKILT
1340 1350 1360
>>CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4 (4981 aa)
initn: 1113 init1: 421 opt: 1467 Z-score: 1075.0 bits: 214.5 E(32554): 1.5e-53
Smith-Waterman score: 4164; 30.4% identity (59.0% similar) in 2993 aa overlap (19-2949:561-3419)
10 20 30 40
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLD
:.. :.. :: .. : ...: . :
CCDS37 LVTTGSSGGLDRELASQIVLNISARDQGVHPKVSYAQLVVTLLDVNDEKP-VFSQPEGYD
540 550 560 570 580
50 60 70 80 90 100
pF1KA1 LQIDEEQPAGT--LIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARV
... :. :.:: :. . : : . . . : ::. .. .: :: . :
CCDS37 VSVVENAPTGTELLMLRATDG-DLGDNGTVRF--SLQEAETDRRSFRLDPVSGRLSTISS
590 600 610 620 630 640
110 120 130 140 150 160
pF1KA1 LDREQRDRYRFTAVT------PDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGT
::::.. : . ... :... ....: . ::::..:.: .. .. :. :.
CCDS37 LDREEQAFYSLLVLATDLGSPPQSSMARINVSLLDINDNSPVFYPVQYFAHIKENEPGGS
650 660 670 680 690 700
170 180 190 200 210 220
pF1KA1 RYPLEPARDADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSH
: : : : :: :..: ::. :... . .:. ... ::::...
CCDS37 YITTVSATDPDLGTNGTVKYSIS---AGDRSRFQVN-AQSGVISTRMA----LDREEKTA
710 720 730 740 750
230 240 250 260 270 280
pF1KA1 YMLQLEAYDGGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFAS
:.::. : :::. ::.. .:.:: .:. :.:.: : :: :..: : : .: ::
CCDS37 YQLQIVATDGGNLQSPNQAIVTITVLDTQDNPPVFSQVAYSFVVFENVALGYHVGSVSAS
760 770 780 790 800 810
290 300 310 320 330
pF1KA1 DADAGVNGAVTYEINRRQSEGD--GPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGG
: .:. ..: : . :: : :.:. :: : .: :.. ..: : : :
CCDS37 TMD--LNSNISYLI----TTGDQKGMFAINQVTGQLTTANVIDREEQSFYQLKVVASGGT
820 830 840 850 860 870
340 350 360 370 380 390
pF1KA1 AHPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDF
. :...:.. :.: :::.: ::.: : .: : :. . . .. :::.:
CCDS37 V---TGDTMVNITVKDLNDNSPH----FLQAIESVNVVENWQAGHSIFQAKAVDPDEGVN
880 890 900 910 920
400 410 420 430 440 450
pF1KA1 AHVNVSL-EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAA
. : :: .. .. ::.. ....: :. :: . .:.... :.: : : : . .
CCDS37 GMVLYSLKQNPKNLFAINEKNGTISLLGP---LDVHA-GSYQIEILASDMGVPQLSSSVI
930 940 950 960 970 980
460 470 480 490 500 510
pF1KA1 FVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAH
....: :::::.:.:: :: : : .: .: : : :.:.::...:..: :
CCDS37 LTVYVHDVNDNSPVFD-QLSYEVTLSESEPVNSRFFKVQASDKDSGANGEIAYTIAEGNT
990 1000 1010 1020 1030 1040
520 530 540 550 560 570
pF1KA1 THWFSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQ
:.: : .: . . :: ::. . :.:::.: .. ::.....:.: :.:::::.:
CCDS37 GDAFGIFP-DGQLYIKSELDRELQDRYVLMVVASDRAVEPLSATVNVTVILEDVNDNRPL
1050 1060 1070 1080 1090
580 590 600 610 620 630
pF1KA1 FQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGD
:. : :. . : . :. .:.:.: : :: : . ::. .: :.. : ::.
CCDS37 FNSTNYTFYFEEEQRAGSFVGKVSAVDKDFGPNGEVRYSF-----EMVQPDFELHAISGE
1100 1110 1120 1130 1140 1150
640 650 660 670 680
pF1KA1 VCTTRTLDRD-----QGPSSFDFTVTAVDGG---GLKSMVYVKVFLSDENDNPPQFYPRE
. .:. .::. .: . :.::: :.: : ::... :.:...: ::: :.:
CCDS37 ITNTHQFDRESLMRRRGTAVFSFTVIATDQGIPQPLKDQATVHVYMKDINDNAPKFLKDF
1160 1170 1180 1190 1200 1210
690 700 710 720 730 740
pF1KA1 YAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLA
: :.:: .. : :::. : : :.:..: . : :. :: :..: :: .:. :
CCDS37 YQATISESAANLTQVLRVSASDVDEGNNGLIHYSIIKGNEERQFAIDSTSGQVTLIGKLD
1220 1230 1240 1250 1260 1270
750 760 770 780 790 800
pF1KA1 RRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSV
.:. . .: : : :.: . . . ..:.:. . . : : . .: :.. : :
CCDS37 YEATPAYSLVIQAVDSGTIPLNSTCTLNIDILDENDNTPSFPKSTLFVDVLENMRIGELV
1280 1290 1300 1310 1320 1330
810 820 830 840 850 860
pF1KA1 GIVQAHNPP-GRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRA-
. : : . : : . :..: . .: ::.. .: . . :: : . . .:.. :
CCDS37 SSVTATDSDSGDNADLYYSITGTNNHGTFSISPNTGSIFLAKKLDFETQS-LYKLNITAK
1340 1350 1360 1370 1380 1390
870 880 890 900 910 920
pF1KA1 GSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNS
.: :: .. : . . : ::: :.:: . . : :: . .. : :::. .:.
CCDS37 DQGRPPRSSTMSVVIHVRDFNDNPPSFPPGDIFKSIVENIPIGTSVISVTAHDPDADING
1400 1410 1420 1430 1440 1450
930 940 950 960 970 980
pF1KA1 RVTFTLLAGG--GGAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLR
....:.. :. ::.: . : . . . :: ..: : . : .: .. :.
CCDS37 QLSYTIIQQMPRGNHFTIDEVKGTIYTNAEIDREFANLFELTVKANDQAVPIETRRYALK
1460 1470 1480 1490 1500 1510
990 1000 1010 1020 1030
pF1KA1 ---VVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPD---GGPITYHLAAE
..: :.. .: : : . . ::.. :. . ..: :: .: : :.. .
CCDS37 NVTILVTDLNDN--VPMFISQNALAADPSAVI-GSVLTTIMAADPDEGANGEIEYEII-N
1520 1530 1540 1550 1560
1040 1050 1060 1070 1080 1090
pF1KA1 GASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILNQN
: .. : .. :: : : .:: .: .: : : : ..:: . .:....:. :.
CCDS37 GDTDTFIVDRYSGDLRVASAL-VPSQLIYNLIV-----SATDLGPERRKSTTELTIILQG
1570 1580 1590 1600 1610 1620
1100 1110 1120 1130 1140 1150
pF1KA1 EHSPRLSEDPTFLAV-AENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKA----F
.: ... : .... :..: ::.: . :.. : .. . : . .. . :. :
CCDS37 LDGPVFTQ-PKYITILKEGEPIGTNVISIEAAS-PRGSEAPVEYYIVSVRCEEKTVGRLF
1630 1640 1650 1660 1670 1680
1160 1170 1180 1190 1200 1210
pF1KA1 RIHPQTGEVTTLQTLDREQQSSYQLL--VQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFL
: .:: . : ::::: . :. .. . . ::. . :.... :.::: :.:
CCDS37 TIGRHTGIIQTAAILDREQGACLYLVDVYAIEKSTAFPRTQRAEVEITLQDINDNPPVF-
1690 1700 1710 1720 1730 1740
1220 1230 1240 1250 1260 1270
pF1KA1 QASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPGSELFSLHPHSGE
: . : . . :. . : : : ::: :. . ::. . ... : . :.::.
CCDS37 -----PTDMLDLTVEENIGDGSKIMQLTAMDADEGANALVTYTIISGADDSFRIDPESGD
1750 1760 1770 1780 1790
1280 1290 1300 1310 1320 1330
pF1KA1 LLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAP
:... : : .: .: : . : :.: .:..... . : :. .. :
CCDS37 LIATRRLDRERRSKYSLLVRA-DDGL--QSSDMRINITV----------SDVNDHTPKFS
1800 1810 1820 1830 1840
1340 1350 1360 1370 1380 1390
pF1KA1 VPVVLTVTAAEGLRPGSLLGSV-AAPEPAGV-GALTYTLVGGADPEGTFALDAASGRLYL
:: . : ::::.... :. . .:: : .:: .:. : .: : :. .: . :
CCDS37 RPVY-SFDIPEDTIPGSLVAAILATDDDSGVNGEITY-IVNEDDEDGIFFLNPITGVFNL
1850 1860 1870 1880 1890 1900
1400 1410 1420 1430 1440 1450
pF1KA1 ARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDPLALALPENPE
.: ::.:. . :::::: ::. .:: .. : :.. : :. . . .: ::
CCDS37 TRLLDYEV-QQYYILTVRAED-GGGQFTTIRVYFNILDVNDNPPIFSLNSYSTSLMENLP
1910 1920 1930 1940 1950
1460 1470 1480 1490 1500 1510
pF1KA1 PGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALL
:... .: ..::: : ::.. : . . . . .: ..:.:.. ..::::.
CCDS37 VGSTVLVFNVTDADD-GINSQLTYSIASGDS-LGQFTVD-KNGVLKVLKALDRESQSFYN
1960 1970 1980 1990 2000 2010
1520 1530 1540 1550 1560 1570
pF1KA1 LLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPPGPAALHVVAR
:.:.. : : . : .. ... ... : ::: :.: ::. . .::. : ..... :
CCDS37 LVVQVHDLPQIPASRFTSTAQVSIILLDVNDNPPTFLSPKLTYIPENTPIDTVVFKAQAT
2020 2030 2040 2050 2060 2070
1580 1590 1600 1610 1620 1630
pF1KA1 DPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRS
::: : . . : : . ..: . . : . .. ::::. ....:::::.:.:.: :
CCDS37 DPDSGPNSYIEYTLLNPLGNKFSIGTIDGEVRLTGELDREEVSNYTLTVVATDKGQPSLS
2080 2090 2100 2110 2120 2130
1640 1650 1660 1670 1680
pF1KA1 ATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGANGQVTYG---
.. ..: : :.::. : : : :.: . ::. ::... . :.: : :.:::: ::
CCDS37 SSTEVVVMVLDINDNNPIFAQALYKVEINENTLTGTDIIQVFAADGDEGTNGQVRYGIVN
2140 2150 2160 2170 2180 2190
1690 1700 1710 1720 1730 1740
pF1KA1 GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVEDENDH
: ... : .: ::..:. . ::::. .::: : :::: :. :: ... : ::
CCDS37 GNTNQEFRIDSVTGAITVAKPLDREKTPTYHLTVQATDRGSTPRTDTSTVSIVLLDINDF
2200 2210 2220 2230 2240 2250
1750 1760 1770 1780 1790 1800
pF1KA1 APTFGSAHLSLEVPE--GQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASG
.:.: . :..::: : :.:. .. : : : :.:..:.: .. :. ..::.:. :::
CCDS37 VPVFELSPYSVNVPENLGTLPRTILQVVARDDDRGSNSKLSYVLFGGNEDNAFTLS-ASG
2260 2270 2280 2290 2300 2310
1810 1820 1830 1840 1850 1860
pF1KA1 EFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVP
:.:. . ::::.. : : : : :.:.:::..: ..: : :.::..:.: :: . .:
CCDS37 ELGVTQSLDRETKERFVLMITATDSGSPALTGTGTINVIVDDVNDNVPTFASKAYFTTIP
2320 2330 2340 2350 2360 2370
1870 1880 1890 1900 1910 1920
pF1KA1 EDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDREQCPSY
::.:.:: .: ..: : ::. :. : .:... : ..::.:.. :.: :::: .:
CCDS37 EDAPTGTDVLLVNASDADASKNA-VIRIIGGNSQ--FTINPSTGQIITSALLDRETKDNY
2380 2390 2400 2410 2420 2430
1930 1940 1950 1960 1970 1980
pF1KA1 TFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALAT
:. : :... :::...:: .:: ::::. : : : ..: : . : . .
CCDS37 TLVVVCSDAGSPEPLSSSTSVLVTVTDVNDNPPRFQHHPYVTHIPSP----TLPGSFVFA
2440 2450 2460 2470 2480
1990 2000 2010 2020 2030 2040
pF1KA1 LRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVATDLGR
. . : : : :. . : :.: .: : : .: .:. : . .. . . : :
CCDS37 VTVTDADIGPNSELHYSLSGRNSEKFHIDPLRGAI-MAAGPLN-GASEVTFSVHVKDGGS
2490 2500 2510 2520 2530 2540
2050 2060 2070 2080 2090 2100
pF1KA1 PARSATGVIIVGLQGEAERGPRFP--RASSEATIRENAPPGTPIVSPRAVHAGGTNG-PI
.. . .. : . ..:. :: ::. .. . . : . .:. .. ... : :.
CCDS37 FPKTDSTTVTVRFVNKAD----FPKVRAKEQTFMFPENQPVSSLVT--TITGSSLRGEPM
2550 2560 2570 2580 2590
2110 2120 2130 2140 2150
pF1KA1 TYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTV---LTL
.: : ::: .::.:. :: ... .. :::: . . ..:..:: :. : .
CCDS37 SYYIASGNLGNTFQIDQLTGQVSI--SQPLDFEKIQKYVVWIEARDGGFPPFSSYEKLDI
2600 2610 2620 2630 2640 2650
2160 2170 2180 2190 2200 2210
pF1KA1 TLQDANDNAPRFLRPHYVAFLPES-RPLEGPLLQVEADDLDQGSGGQISYSLAASQPARG
:. :.::::: : . ... . :. : . .: : : : :.: .::..: .. .. ..
CCDS37 TVLDVNDNAPIFKEDPFISEILENLSPRK--ILTVSAMDKDSGPNGQLDYEIVNGN-MEN
2660 2670 2680 2690 2700 2710
2220 2230 2240 2250 2260 2270
pF1KA1 LFHVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIP
: .. .:: : .. :::: .. :.. ..:.:::. :. . . ..: ::: : .
CCDS37 SFSINHATGEIRSVRPLDREKVSHYVLTIKSSDKGSPSQSTSVKVMINILDENDNAPRFS
2720 2730 2740 2750 2760 2770
2280 2290 2300 2310 2320 2330
pF1KA1 QPWELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLD
: . .: :.. :: ...:: .: : : : . ::... : . .. ::.
CCDS37 QIFSAHVPENSPLGYTVTRVTTSDEDIGINAISRYSIMDASLPFTINPSTGDIVISRPLN
2780 2790 2800 2810 2820 2830
2340 2350 2360 2370 2380 2390
pF1KA1 FEQCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSV
:. :::.... :::. ...:..: :.::::: ::.. : . : : :: . .:
CCDS37 REDTDRYRIRVSAHDSGWTVSTDVTIFVTDINDNAPRFSRTSYYLDCPELTEIGSKVTQV
2840 2850 2860 2870 2880 2890
2400 2410 2420 2430 2440 2450
pF1KA1 SATDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDV-----VLE
::: : :.::.. : . : .. : .. ..: .:. . : . :.. ..
CCDS37 FATDPDEGSNGQVFYFIKSQSEYFRINATTGEIFNKQILKYQNVTGFSNVNINRHSFIVT
2900 2910 2920 2930 2940 2950
2460 2470 2480 2490 2500 2510
pF1KA1 ARDHGAPGRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSR
. :.: :. ...:: ... :.::.::.: :.: . ::... :. :. . : :
CCDS37 SSDRGKPSLISETTVTINIVDSNDNAPQFLKSKYFTPVTKNVKVGTKLIRVTAIDDKDFG
2960 2970 2980 2990 3000 3010
2520 2530 2540 2550 2560 2570
pF1KA1 SHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVA
.. :.: : . : :.:. . . ... :. :. .. .::.
CCDS37 LNSEVEYFISNDNHLGKFKLDNDTGWISVASS----------LISDLN----QNFFITVT
3020 3030 3040 3050 3060
2580 2590 2600 2610 2620 2630
pF1KA1 AADRGQPPQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGP
: :.:.:: :: . : .:: . : . : :... . .:.::. .:. . : : : : .
CCDS37 AKDKGNPPLSSQATVHITVTEENYHTPEFSQSHMSATIPESHSIGSIVRTVSARDRDAAM
3070 3080 3090 3100 3110 3120
2640 2650 2660 2670 2680 2690
pF1KA1 HGLVRFTVSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAG-AHFALAPV
.::.....:::. :.: .. :.: : ::.::: : .:.....: : . :. . :
CCDS37 NGLIKYSISSGNEEGIFAINSSTGILTLAKALDYELCQKHEMTISAIDGGWVARTGYCSV
3130 3140 3150 3160 3170 3180
2700 2710 2720 2730 2740 2750
pF1KA1 TIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGP
:..: ::::..:.: . .: :: : :: : :.: :.:.:. . . :.. .
CCDS37 TVNVIDVNDNSPVFLSDDYFPTVLENAPSGTTVIHLNATDADSGTNAVIAYTVQSS----
3190 3200 3210 3220 3230
2760 2770 2780 2790 2800 2810
pF1KA1 EGREAFALNSSTGELRARVPFDYEHTESFRLLVGAADAGNLS--ASVTVSVLVTGEDEYD
. :... .:: . .. .:.: .:..: : : .. . . .::.. . : .::
CCDS37 -DSDLFVIDPNTGVITTQGFLDFETKQSYHLTVKAFNVPDEERCSFATVNIQLKGTNEYV
3240 3250 3260 3270 3280 3290
2820 2830 2840 2850 2860
pF1KA1 PVFLAPAFHFQVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSS--PYFGINQTTGAL
: :.. ..:.. :.: .: .:.: :.:.: :.:: : : . .: : ::. :: .
CCDS37 PRFVSKLYYFEISEAAPKGTIVGEVFASDRDLGTDGEVHYLIFGNSRKKGFQINKKTGQI
3300 3310 3320 3330 3340 3350
2870 2880 2890 2900 2910 2920
pF1KA1 YLRVDSRAPGSGTATSGGGGRTRREAPRELRLEVIAR--GPLPGSRSATVPVTVDITHTA
:. .: :: ... :.:.:. : . :. : :.: . .
CCDS37 YV----------------SGILDREKEERVSLKVLAKNFGSIRGADIDEVTVNVTVLDAN
3360 3370 3380 3390
2930 2940 2950 2960 2970 2980
pF1KA1 LGLAPDLNLLLVGAVAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSL
: . : . .: : :: .
CCDS37 ---DPPIFTLNIYSVQISEGVPIGTHVTFVSAFDSDSIPSWSRFSYFIGSGNENGAFSIN
3400 3410 3420 3430 3440 3450
>--
initn: 371 init1: 247 opt: 601 Z-score: 437.9 bits: 96.6 E(32554): 4.5e-18
Smith-Waterman score: 968; 36.7% identity (62.8% similar) in 572 aa overlap (12-555:5-559)
10 20 30 40 50
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLL----LLLLLLLGAGVPG-AW--GQAGSLDLQIDE
: . :: : : : :: .. : . .:: :: : .:. :
CCDS37 MDLAPDRATGRPWLPLHTLSVSQLLRVFWLLSLLPGQAWVHGAEPRQVFQVLE
10 20 30 40 50
60 70 80 90 100 110
pF1KA1 EQPAGTLIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRD
::: :::.: :. : . : .: :. .. .::. .:.. :. ..:::.
CCDS37 EQPPGTLVGTIQ------TRPGFTYRLS--ESHAL---FAINSSTGALYTTSTIDRESLP
60 70 80 90 100
120 130 140 150 160 170
pF1KA1 RYRFTAVTPDGATV---EVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDA
.. :. ..: . :: : : :.::.::.::. .. : .. : . :. : :.
CCDS37 SDVINLVVLSSAPTYPTEVRVLVRDLNDNAPVFPDPSIVVTFKEDSSSGRQVILDTATDS
110 120 130 140 150 160
180 190 200 210 220
pF1KA1 DAGRLGTQGYA---LSGDGAGETFRLETRPGPDGTPVP-ELVVTGELDRENRSHYMLQLE
: : :.. . . :. ::. :::. .:.: . .:: : :::: .:.: .:
CCDS37 DIGSNGVDHRSYRIIRGNEAGR-FRLDITLNPSGEGAFLHLVSKGGLDREVTPQYQLLVE
170 180 190 200 210 220
230 240 250 260 270 280
pF1KA1 AYDGGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGV
. : : : ::. ..::. ::::. :.:..:.:.: : :. . :: :::: :.::: :.
CCDS37 VEDKGEPKRRGYLQVNVTVQDINDNPPVFGSSHYQAGVPEDAVVGSSVLQVAAADADEGT
230 240 250 260 270 280
290 300 310 320 330 340
pF1KA1 NGAVTYEINRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSA
:. . : : :.:: ::..: .:::. ...::::: :: . :.::: : :. : :
CCDS37 NADIRY---RLQDEGT-PFQMDPETGLITVREPLDFEARRQYSLTVQAMDRGVPSLTGRA
290 300 310 320 330
350 360 370 380 390 400
pF1KA1 FVTVHVRDANDNQPSMTVIFLSADGS-PQVSEAAPPGQLVARISVSDPDD-GDFAHVNVS
. ... :.:::.: . .. : . .:.: : : .:: ..:.: :. . ....:.
CCDS37 EALIQLLDVNDNDPVVKFRYFPATSRYASVDENAQVGTVVALLTVTDADSPAANGNISVQ
340 350 360 370 380 390
410 420 430 440 450
pF1KA1 LEGG--EGHFAL-STQDSVIYLVCVARRLDREERDAYNLRVTATDS-GSPP---LRAE--
. :: . :: . :.. . :. :: ::::. .::: :...:. :.:: ..:.
CCDS37 ILGGNEQRHFEVQSSKVPNLSLIKVASALDRERIPSYNLTVSVSDNYGAPPGAAVQARSS
400 410 420 430 440 450
460 470 480 490 500 510
pF1KA1 -AAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAP
:..:. :.:.::. :.:..:.:: . : : : :::.: ..: : :.: :... ::..
CCDS37 VASLVIFVNDINDHPPVFSQQVYRVN-LSEEAPPGSYVSGISATDGDSGLNANLRYSIVS
460 470 480 490 500 510
520 530 540 550 560 570
pF1KA1 GAHTHWFSIDPTSGIITTAAS--LDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVN
: :: :. ::..::..: :: :: : : . : : :.
CCDS37 GNGLGWFHISEHSGLVTTGSSGGLDRELASQIVLNISARDQGVHPKVSYAQLVVTLLDVN
520 530 540 550 560 570
580 590 600 610 620 630
pF1KA1 DNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRID
CCDS37 DEKPVFSQPEGYDVSVVENAPTGTELLMLRATDGDLGDNGTVRFSLQEAETDRRSFRLDP
580 590 600 610 620 630
>>CCDS4317.1 FAT2 gene_id:2196|Hs108|chr5 (4349 aa)
initn: 628 init1: 331 opt: 1289 Z-score: 944.8 bits: 190.2 E(32554): 2.6e-46
Smith-Waterman score: 2669; 28.9% identity (55.7% similar) in 2540 aa overlap (396-2870:76-2438)
370 380 390 400 410 420
pF1KA1 FLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFA---LSTQDSVIY
:: :.: . : :.: . :..:
CCDS43 SSPKTYVESFEKMGIYLAEPQWAVRYRIISGDVANVFKTEEYVVGNFCFLRIRTKSSNTA
50 60 70 80 90 100
430 440 450 460 470 480
pF1KA1 LVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPEPL
: :.:: ::.:.: . ::.. . :.: . :.:. : :: : :. ::
CCDS43 L------LNREVRDSYTLIIQATEK-TLELEALTRVVVHILDQNDLKPLFSPPSYRVTIS
110 120 130 140 150
490 500 510 520 530 540
pF1KA1 PEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYELEP
.. : : . .::: : : : :.. :.. ..... :.: ::::..:.:..:. .
CCDS43 EDMPLK-SPICKVTATDADLGQNAEFYYAF--NTRSEMFAIHPTSGVVTVAGKLNVTWRG
160 170 180 190 200 210
550 560 570 580 590
pF1KA1 QPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASL---PEGTQPGTCFLQ
. .: :.:.: ... :.: :. :: ... ::. : .. :: .
CCDS43 KHELQVLAVDRMRKISEGNGFGSLAALVVH-VEPALRKPPAIASVVVTPPDSNDGTTYAT
220 230 240 250 260 270
600 610 620 630 640 650
pF1KA1 VTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGD--VCTTRTLDRDQGPSSFDFTV
: . ::.:. . : . .: .. .. :.:.. . ... .. . .:....
CCDS43 VLV-DANSSGAEVESVEVVGGDPGKHFKAIKSYARSNEFSLVSVKDINWMEYLHGFNLSL
280 290 300 310 320 330
660 670 680 690 700 710
pF1KA1 TAVDGGGLKSMVYVKVF-LSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGS
: .:.: . .. : : . . .: : ...: ::::. :. .:. : .
CCDS43 QARSGSGPYFYSQIRGFHLPPSKLSSLKFEKAVYRVQLSEFSPPGSRVVMVRV-TP---A
340 350 360 370 380
720 730 740 750 760 770
pF1KA1 HGRLSYHILAGNSPPL-FTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSAR
:.: .: .: . : :. ..::.:.. . . . ::.: . : :: :.
CCDS43 FPNLQY-VLKPSSENVGFKLNARTGLITTTKLMDFHDRAHYQLHIRTSPG---QA--STV
390 400 410 420 430 440
780 790 800 810 820 830
pF1KA1 VDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHN-PPGRLAPVTLSLSGGDPR
: :.:: . :.:.. .: .. :.. ::::: : : . :. . :: :..: :.
CCDS43 VVIDIVDCNNHAPLFNRSSYDGTLDENIPPGTSVLAVTATDRDHGENGYVTYSIAG--PK
450 460 470 480 490 500
840 850 860 870 880 890
pF1KA1 GL-FSLDAVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLD--DVNDNS
.: ::.: :...: .:.: ::. . ..:::.. : .: ..:. ..:::.
CCDS43 ALPFSIDPYLGIISTSKPMDYELMKRIYTFRVRASDWGSPFRREKEVSIFLQLRNLNDNQ
510 520 530 540 550 560
900 910 920 930 940 950
pF1KA1 PAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGA-FTVDPTTGHV
: : . : . . : :.:. :.: : : . . ...:. : .. .: .
CCDS43 PMFEEVNCTGSIRQDWPVGKSIMTMSAIDVDELQNLK--YEIVSGNELEYFDLNHFSGVI
570 580 590 600 610
960 970 980 990 1000
pF1KA1 RLMRPLG--PSGGP-AHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRV
: ::. .: : .. :.. : :: . . . . .::.: :.:. :.
CCDS43 SLKRPFINLTAGQPTSYSLKITASDGKNYASPTTLNI-TVVKD-------PHFEVPV---
620 630 640 650 660
1010 1020 1030 1040 1050 1060
pF1KA1 DLPSGTTAGTQVLQVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQEL
: : :: ... :. .::. : .
CCDS43 -----TCDKTGVLTQFTKT------ILHF--------IGLQNQES---------------
670 680 690
1070 1080 1090 1100 1110 1120
pF1KA1 YILKVMAVSGSKAELGQQTGTATVRVSILNQNEHSPRLSED--PTFLAVAENQPPGTSVG
: :. :. .: .. :...:.. :: : . : :. : .: ..
CCDS43 ----------SDEEF---TSLSTYQI-----NHYTPQF-EDHFPQSIDVLESVPINTPLA
700 710 720 730
1130 1140 1150 1160 1170 1180
pF1KA1 RVFATDRDSGPNGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQD
:. ::: :.: ::.:.: . . .:.. : :. .:: .:. :: : . : : : : :
CCDS43 RLAATDPDAGFNGKLVYVIADGNEEG-CFDIELETGLLTVAAPLDYEATNFYILNVTVYD
740 750 760 770 780 790
1190 1200 1210 1220 1230 1240
pF1KA1 GGSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPD
:.: .:. . : : : :::.: : :: . . . . :: .. : .:: :
CCDS43 LGTPQKSSWKLLTVNVKDWNDNAPRF------PPGGYQLTISEDTEVGTTIAELTTKDAD
800 810 820 830 840
1250 1260 1270 1280 1290 1300
pF1KA1 EGENGTILYTLTGPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASL
.:: . ::: .: .: ::::: .:::.... : : .:.:.: . :.:: : .. .:
CCDS43 SEDNGRVRYTLLSP-TEKFSLHPLTGELVVTGHLDRESEPRYILKVEARDQ--PSKGHQL
850 860 870 880 890 900
1310 1320 1330 1340 1350 1360
pF1KA1 QLLVQVLPSAR-LAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEP--AGV
..... . . . . :. . :: : : ::..: . : .: . .
CCDS43 FSVTDLIITLEDVNDNSPQCITEHNRLKVP--------EDLPPGTVLTFLDASDPDLGPA
910 920 930 940 950
1370 1380 1390 1400 1410
pF1KA1 GALTYTLVGGADPEGTFALDAASGRLYLARPLDFE--AGPPWRALTVRAEGPGGAGAR--
: . :.:. :: .::: .: .: : : : :::: :: :.. : : ::
CCDS43 GEVRYVLMDGA--HGTFRVDLMTGALILERELDFERRAG---YNLSLWASDGGRPLARRT
960 970 980 990 1000 1010
1420 1430 1440 1450 1460 1470
pF1KA1 LLRVQVQVQDENE--HAPAFARDPLALALPENPEPGAALYTFRASDADGPGPNSDVRYRL
: .:.: : : :: : : :: . :: :. . . :.: : : .....: .
CCDS43 LCHVEVIVLDVNENLHPPHFASFVHQGQVQENSPSGTQVIVVAAQD-DDSGLDGELQY-F
1020 1030 1040 1050 1060 1070
1480 1490 1500 1510 1520 1530
pF1KA1 LRQEPPVPALRLDARTGALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVSARVFV
:: . :. .. :: ... :::: . : : :.:: .: .. . . . :
CCDS43 LRAGTGLAAFSINQDTGMIQTLAPLDREFASYYWLTVLAVDR---GSVPLSSVTEVYIEV
1080 1090 1100 1110 1120
1540 1550 1560 1570 1580 1590
pF1KA1 TDENDNAPVFAS----PSRVRLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGD-GH
:: ::: : ... :: . :: : : ..:.. : ::: . ..... ..::. :
CCDS43 TDANDNPPQMSQAVFYPS---IQEDAPVGTSVLQLDAWDPDSSSKGKLTFNITSGNYMGF
1130 1140 1150 1160 1170 1180
1600 1610 1620 1630 1640 1650
pF1KA1 FRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQQ
: .: :: ::... ::::.. ::.: :.. :.: : ..:. ..:.. ::::. : :..
CCDS43 FMIHPVTGLLSTAQQLDRENKDEHILEVTVLDNGEPSLKSTSRVVVGILDVNDNPPIFSH
1190 1200 1210 1220 1230 1240
1660 1670 1680 1690 1700
pF1KA1 QEYSVLLREN-NP--PGTSLLTLRATDPDVGANGQVTYGGVSS--ESFSLDPDTGVLTTL
. ..: : : .: :: . : :.: : : ::.:::. .: :.::.: :::...
CCDS43 KLFNVRLPERLSPVSPGP-VYRLVASDLDEGLNGRVTYSIEDSDEEAFSIDLVTGVVSSS
1250 1260 1270 1280 1290 1300
1710 1720 1730 1740 1750 1760
pF1KA1 RALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVE----DENDHAP-TFGSAHLSLEVP
.. : . ::. : : :.:: ..::. .: . . : .: .. :. :
CCDS43 STFTAGEYN--ILTIKATDSGQPP--LSASVRLHIEWIPWPRPSSIPLAFDETYYSFTVM
1310 1320 1330 1340 1350
1770 1780 1790 1800 1810 1820
pF1KA1 EGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAF
: :: .. . . : : . . : :: . : .. ..: . :::: . . .
CCDS43 E-TDP--VNHMVGVISVEGRPGLFWFNISGGDKDMDFDIEKTTGSIVIARPLDTRRRSNY
1360 1370 1380 1390 1400 1410
1830 1840 1850 1860 1870 1880
pF1KA1 QLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHD
.: .:. ::.. :: . . . : : : : : :.::.:. :. ::..:: :
CCDS43 NLTVEVTDGSRTI--ATQVHIFMIANINHHRPQFLETRYEVRVPQDTVPGVELLRVQAID
1420 1430 1440 1450 1460 1470
1890 1900 1910 1920 1930
pF1KA1 PDAGANGHVTYY--LGAGTAGAFLLEPSSGELRTAAALDREQCPS-YTFSVSAVDGAAAG
: : . : . :.:. : :.:::: : :.. :: . :: .:..: . :
CCDS43 QDKGKSLIYTIHGSQDPGSASLFQLDPSSGVLVTVGKLDLGSGPSQHTLTVMVRDQEI--
1480 1490 1500 1510 1520 1530
1940 1950 1960 1970 1980 1990
pF1KA1 PLSTT-VSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALATLRAEDRDAGANA
:.. . : ::: :.: : : : : .:. :. .: : .:: : : :.::
CCDS43 PIKRNFVWVTIHVEDGNLHPPRF----TQLHYEASVPDTIAPGTELLQVRAMDADRGVNA
1540 1550 1560 1570 1580
2000 2010 2020 2030 2040 2050
pF1KA1 SILYRL-AGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVATDLGRPARSATGVIIV
. : : :. .... : : .:.. . ..: . : : : : ...:.
CCDS43 EVHYSLLKGNSEGFFNINALLGIITLAQKLDQANHAPHTLTVKAEDQGSPQWHDLATVII
1590 1600 1610 1620 1630 1640
2060 2070 2080 2090 2100 2110
pF1KA1 GLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFS
. . .: : .. . : :. : :.::. :. . . .:: . ::. :.::
CCDS43 HVYPSDRSAPIFSKSEYFVEIPESIPVGSPILLVSAM----SPSEVTYELREGNKDGVFS
1650 1660 1670 1680 1690 1700
2120 2130 2140 2150 2160 2170
pF1KA1 IQPSTGAITVRSAEGLDFEVSPRLRLVLQAES-GGAFAFTVLTLTLQDANDNAPRFLRPH
.. .: :... . :: : .: ... . .:::. ..... . : ::::: ::.
CCDS43 MNSYSGLISTQ--KKLDHEKISSYQLKIRGSNMAGAFTDVMVVVDIIDENDNAPMFLKST
1710 1720 1730 1740 1750 1760
2180 2190 2200 2210 2220
pF1KA1 YVAFLPESRPLEGPLLQ-------VEADDLDQGSGGQISYSLAASQPARGLFHVDPTTGT
.:. . :. :: . ... ..:.: :. ... . :.. . : .:..::. ::
CCDS43 FVGQISEAAPLYSMIMDKNNNPFVIHASDSDKEANSLLVYKILEPE-ALKFFKIDPSMGT
1770 1780 1790 1800 1810 1820
2230 2240 2250 2260 2270 2280
pF1KA1 ITTTAILDREIWAETRLVLMATDRGSPALVGS--ATLTVMVIDTNDNRPTIP-QPWELRV
.: .. .: : .. ... :.:::.: . : . . : :.::. : . : .:. .
CCDS43 LTIVSEMDYESMPSFQFCVYVHDQGSPVLFAPRPAQVIIHVRDVNDSPPRFSEQIYEVAI
1830 1840 1850 1860 1870 1880
2290 2300 2310 2320 2330 2340
pF1KA1 SEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFEQCDRY
: :. .: ..: :: . : .. .. .. .. : .:. .: : .:
CCDS43 VGPIHPGMELLMVRASDEDSE--VNYSIKTGNADEAVTIHPVTGSISVLNPA-FLGLSR-
1890 1900 1910 1920 1930
2350 2360 2370 2380 2390 2400
pF1KA1 QLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDS
.: . : :: .. : . . . .: :.. :.:..: . . :. .:.. ..: . .
CCDS43 KLTIRASDGLYQDTALVKISLTQVLDKSLQFDQDVYWAAVKENLQDRKALVILGA--QGN
1940 1950 1960 1970 1980 1990
2410 2420 2430 2440 2450 2460
pF1KA1 GANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAAR
: .:: : . .: : . . :.: : ::. .. . . ....:.::. .: :.:.
CCDS43 HLNDTLSYFLLNGTDMFHMVQSAGVLQT--RGVAFDREQQDTHELAVEVRDNRTPQRVAQ
2000 2010 2020 2030 2040 2050
2470 2480 2490 2500 2510 2520
pF1KA1 ATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISG
. :.:...: ::. :.: : . . . ::..:. . ::: : . ...:: : .
CCDS43 GLVRVSIEDVNDNPPKFKHLPYYTIIQDGTEPGDVLFQVSATDEDLG-TNGAVTYEFAED
2060 2070 2080 2090 2100 2110
2530 2540 2550 2560 2570 2580
pF1KA1 NWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSV
:...: : : . : .:.:...:..:.: : : : : : .:
CCDS43 Y--TYFRIDPYL--------------GDISLKKPFDYQALNKYHLKVIARDGGTPSLQSE
2120 2130 2140 2150
2590 2600 2610 2620 2630 2640
pF1KA1 VPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGL-VRFTVSSG
: ::: : . :.: :.: :::. . . .::..: . :.:: . ...
CCDS43 EEVLVTVR--NKSNPLFQSPYYKVRVPENITLYTPILHTQARS----PEGLRLIYNIVEE
2160 2170 2180 2190 2200 2210
2650 2660 2670 2680 2690 2700
pF1KA1 DPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGP
.: :: : ..:.: .. :: :....: ..:.:.: : . :. : : . :.::::. :
CCDS43 EPLMLFTTDFKTGVLTVTGPLDYESKTKHVFTVRATDTALGSFSEATVEVLVEDVNDNPP
2220 2230 2240 2250 2260 2270
2710 2720 2730 2740 2750 2760
pF1KA1 AFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSST
.: . .::..:. : : : : : : :.: . :...: : . . : .:.::
CCDS43 TFSQLVYTTSISEGLPAQTPVIQLLASDQDSGRNRDVSYQIVE--DGSDVSKFFQINGST
2280 2290 2300 2310 2320
2770 2780 2790 2800 2810 2820
pF1KA1 GELRARVPFDYEHTESFRLLVGAADAGN--LSASVTVSVLVTGEDEYDPVFLAPAFHFQV
::. . .::: . :.. : : : :. :.. . : : :. .. : : : .. .:
CCDS43 GEMSTVQELDYEAQQHFHVKVRAMDKGDPPLTGETLVVVNVSDINDNPPEFRQPQYEANV
2330 2340 2350 2360 2370 2380
2830 2840 2850 2860 2870 2880
pF1KA1 PEGARRGHSLGHVQATDEDGGADGLVLYSLATSSP--YFGINQTTGALYLRVDSRAPGSG
: : :: . .::: : :. . . : . ... .: ::...: . .
CCDS43 SELATCGHLVLKVQAIDPDSRDTSRLEYLILSGNQDRHFFINSSSGIISMFNLCKKHLDS
2390 2400 2410 2420 2430 2440
2890 2900 2910 2920 2930 2940
pF1KA1 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
CCDS43 SYNLRVGASDGVFRATVPVYINTTNANKYSPEFQQHLYEAELAENAMVGTKVIDLLAIDK
2450 2460 2470 2480 2490 2500
>--
initn: 687 init1: 266 opt: 648 Z-score: 473.3 bits: 102.9 E(32554): 4.8e-20
Smith-Waterman score: 1523; 32.0% identity (57.1% similar) in 1200 aa overlap (219-1394:2448-3593)
190 200 210 220 230 240
pF1KA1 ETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQALLDVTLLDI
: : :.. : :: :: . . .. .
CCDS43 ILSGNQDRHFFINSSSGIISMFNLCKKHLDSSYNLRVGASDG---VFRATVPVYINTTNA
2420 2430 2440 2450 2460 2470
250 260 270 280 290 300
pF1KA1 NDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEI-NRRQSEGDGPFSI
: ..: :.: :.: ..:. :. :....: : :.: :.. : : :. :: :::
CCDS43 NKYSPEFQQHLYEAELAENAMVGTKVIDLLAIDKDSGPYGTIDYTIINKLASE---KFSI
2480 2490 2500 2510 2520 2530
310 320 330 340 350 360
pF1KA1 DAHTGLLQLERPLDFEQ--RRVHELVVQARDGGAHPELGSAFVTVHV--RDANDNQPSMT
. . . :.. :: :. .:: . :.:::::.. :: ::.. : ::: :..
CCDS43 NPNGQIATLQK-LDRENSTERVIAIKVMARDGGGR----VAFCTVKIILTDENDNPPQFK
2540 2550 2560 2570 2580
370 380 390 400 410 420
pF1KA1 VIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSVIYL
. ... . .::. .: :..: : :.:. : :. :.. . . . : .
CCDS43 ASEYTVSIQSNVSKDSPVIQVLAY----DADEGQNADVTYSVNPEDLVKDVIEINPVTGV
2590 2600 2610 2620 2630 2640
430 440 450 460 470 480
pF1KA1 VCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYR---PE
: : : : .. .. . : :.: : . . :.:. . . : :.. :: ::
CCDS43 VKVKDSLVGLENQTLDFFIKAQDGGPPHWNSLVPVRLQVVPKKVSLPKFSEPLYTFSAPE
2650 2660 2670 2680 2690 2700
490 500 510 520 530
pF1KA1 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----WFSIDPTSGIITTAAS
::: . : .: :.:.:: : :::. :. . ::.:: .:.: .
CCDS43 DLPEGSEIG-IVKAVAAQDP-------VIYSLVRGTTPESNKDGVFSLDPDTGVIKVRKP
2710 2720 2730 2740 2750
540 550 560 570 580 590
pF1KA1 LDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGT
.:.: :. :.: ..: ..:.. . :::::.: :. :.: : :. ::
CCDS43 MDHESTKLYQIDVMAHCLQNTDVVSLVSVNIQVGDVNDNRPVFEADPYKAVLTENMPVGT
2760 2770 2780 2790 2800 2810
600 610 620 630 640 650
pF1KA1 CFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDF
.:::: : :.: : .:: :.: ::. : ::..:: . : . :: . ... :
CCDS43 SVIQVTAIDKDTGRDGQVSYRLSADPGSNVHELFAIDSESGWITTLQELDCETC-QTYHF
2820 2830 2840 2850 2860 2870
660 670 680 690 700 710
pF1KA1 TVTAVDGGG---LKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDP
:.: : : :.:.. :.: ..::::: :.: .:: .:. .: :: : :.. :
CCDS43 HVVAYDHGQTIQLSSQALVQVSITDENDNAPRFASEEYRGSVVENSEPGELVATLKTLDA
2880 2890 2900 2910 2920 2930
720 730 740 750 760
pF1KA1 DQGSHGR-LSYHILAGNSPPLFTLDEQSGLLTVA--WPLARRANSVVQLEIGAEDGGGLQ
: . ..: .. .: :. : ... . .. : :. .. :.. : :: .:
CCDS43 DISEQNRQVTCYITEGDPLGQFGISQVGDEWRISSRKTLDREHTAKYLLRVTASDGK-FQ
2940 2950 2960 2970 2980 2990
770 780 790 800 810 820
pF1KA1 AEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHN-PPGRLAPVTLSL
: :. :.: .. . . : :: :. .: ::: :: . :.: . : .: ::
CCDS43 A--SVTVEIFVLDVNDNSPQCSQLLYTGKVHEDVFPGHFILKVSATDLDTDTNAQITYSL
3000 3010 3020 3030 3040 3050
830 840 850 860 870 880
pF1KA1 SGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVN
: . :.:: .: : :: :::: :..: ..: .: . : . . ..:::
CCDS43 HGPGAHE-FKLDPHTGELTTLTALDRER-KDVFNLVAKATDGGGRSCQ-ADITLHVEDVN
3060 3070 3080 3090 3100
890 900 910 920 930 940
pF1KA1 DNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTG
::.: : . .: . ::. ::. .. : :::.:.:..:...: .. : :..: :::
CCDS43 DNAPRFFPSHCAVAVFDNTTVKTPVAVVFARDPDQGANAQVVYSLPDSAEGHFSIDATTG
3110 3120 3130 3140 3150 3160
950 960 970 980 990 1000
pF1KA1 HVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVD
.:: .:: :: ..: : :.: : . :.:. :: . : : . . :.
CCDS43 VIRLEKPLQVRPQAPLELTVRASDLGTPIPLSTLGT-VTVSVVGLEDYLPVFLNTEHSVQ
3170 3180 3190 3200 3210 3220
1010 1020 1030 1040 1050 1060
pF1KA1 LPSGTTAGTQVLQVQAQAPDGGPIT-YHLAAEGASSPFGLEPQSGWLWVRAALDREAQEL
.: . ::.:::. . . :. : :.... . .. : :. ..: :.: :.:: :..
CCDS43 VPEDAPPGTEVLQLATLTRPGAEKTGYRVVSGNEQGRFRLDARTGILYVNASLDFETSPK
3230 3240 3250 3260 3270 3280
1070 1080 1090 1100 1110 1120
pF1KA1 YILKVMAVSGSKAELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRV
:.:.. :.. :.. : :: :.: . ::: :.. .:: : :: : . :
CCDS43 YFLSIECSRKSSSSLSDVT---TVMVNITDVNEHRPQFPQDPYSTRVLENALVGDVILTV
3290 3300 3310 3320 3330 3340
1130 1140 1150 1160 1170 1180
pF1KA1 FATDRDSGP-NGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDG
:::.: :: :. .:::: .. .. : :::. ::. . ..::::: :::.: ... :.
CCDS43 SATDED-GPLNSDITYSLIGGNQLGH-FTIHPKKGELQVAKALDREQASSYSLKLRATDS
3350 3360 3370 3380 3390 3400
1190 1200 1210 1220 1230 1240
pF1KA1 GSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDE
:.:: . . : :.::: : :.: . .. : . : :. : : .:::
CCDS43 GQPPLHEDTDIAIQVADVNDNPPRFFQLNYST------TVQENSPIGSKVLQLILSDPDS
3410 3420 3430 3440 3450
1250 1260 1270 1280 1290 1300
pF1KA1 GENGTIL-YTLT-GPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSAS
::: . .: : .. : . : .: :.:: : : . : : ..: :.: :: :.
CCDS43 PENGPPYSFRITKGNNGSAFRVTP-DGWLVTAEGLSRRAQEWYQLQIQASDSGIPPLSSL
3460 3470 3480 3490 3500 3510
1310 1320 1330 1340 1350 1360
pF1KA1 LQLLVQVLPSARLAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGA
.. :.: ... : :.: .:. . .:..: :...:.. : . .
CCDS43 TSVRVHVTEQSHYA----------PSA-LPLEIFITVGEDEFQGGMVGKIHATDRDPQDT
3520 3530 3540 3550 3560
1370 1380 1390 1400 1410 1420
pF1KA1 LTYTLVGGADPEGTFALDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQV
:::.:. :.. : .:.. :. :
CCDS43 LTYSLAEEETLGRHFSVGAPDGKIIAAQGLPRGHYSFNVTVSDGTFTTTAGVHVYVWHVG
3570 3580 3590 3600 3610 3620
>>CCDS48141.1 PCDH19 gene_id:57526|Hs108|chrX (1100 aa)
initn: 1191 init1: 295 opt: 1201 Z-score: 888.4 bits: 177.8 E(32554): 3.7e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)
10 20 30 40 50
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
::::.:::: .: : ::..: .:. ..::: :
CCDS48 MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
10 20 30
60 70 80 90 100 110
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
::.:.... :: : . . :. . :. :. ::.. : . .::. :
CCDS48 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
40 50 60 70 80 90
120 130 140 150 160
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
. .. ....:. : .. :.::.::.:: :. :.. : .. ::: ::. : :
CCDS48 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
100 110 120 130 140 150
170 180 190 200 210 220
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
:.: .:.: : :. . : : :: . ::. :::: ::::..::: ... : :
CCDS48 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
160 170 180 190 200 210
230 240 250 260 270 280
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
::.::: . . :.. . : ::. :.:..: : . : :. :..::... ::: : :.::
CCDS48 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
220 230 240 250 260 270
290 300 310 320 330 340
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
:.: .: : : :.:: :.::. . ::.:. .:.:: :::.: : . .
CCDS48 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
280 290 300 310 320
350 360 370 380 390 400
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
::: : :.::: : .... .... .:::.:::: ..: . ::: :.: ..:. :
CCDS48 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
330 340 350 360 370 380
410 420 430 440 450 460
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
:. : :. .: . . : :::::..: ::: . : :.: : :.. .:.. .::
CCDS48 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
390 400 410 420 430 440
470 480 490 500 510 520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
::: : :.. :. . : ::.... :.::::: : ::.:.:...:. .
CCDS48 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
450 460 470 480 490 500
530 540 550 560 570 580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
::.:.:: : . :...: .. :.: ::::: : :.::: : . ::::: : .
CCDS48 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
510 520 530 540 550 560
590 600 610 620 630
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
. :.. .:... : : : : : : : ..:.. :. : :.:: .
CCDS48 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
570 580 590 600 610 620
640 650 660 670 680 690
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
:.: ::::. ... ::... :.: : : .:.. . : ..:: :
CCDS48 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
CCDS48 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCRIAEYSYGHQKKSSKKKKISKNDIR
690 700 710 720 730 740
>>CCDS43976.1 PCDH19 gene_id:57526|Hs108|chrX (1101 aa)
initn: 1191 init1: 295 opt: 1201 Z-score: 888.4 bits: 177.8 E(32554): 3.7e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)
10 20 30 40 50
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
::::.:::: .: : ::..: .:. ..::: :
CCDS43 MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
10 20 30
60 70 80 90 100 110
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
::.:.... :: : . . :. . :. :. ::.. : . .::. :
CCDS43 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
40 50 60 70 80 90
120 130 140 150 160
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
. .. ....:. : .. :.::.::.:: :. :.. : .. ::: ::. : :
CCDS43 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
100 110 120 130 140 150
170 180 190 200 210 220
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
:.: .:.: : :. . : : :: . ::. :::: ::::..::: ... : :
CCDS43 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
160 170 180 190 200 210
230 240 250 260 270 280
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
::.::: . . :.. . : ::. :.:..: : . : :. :..::... ::: : :.::
CCDS43 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
220 230 240 250 260 270
290 300 310 320 330 340
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
:.: .: : : :.:: :.::. . ::.:. .:.:: :::.: : . .
CCDS43 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
280 290 300 310 320
350 360 370 380 390 400
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
::: : :.::: : .... .... .:::.:::: ..: . ::: :.: ..:. :
CCDS43 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
330 340 350 360 370 380
410 420 430 440 450 460
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
:. : :. .: . . : :::::..: ::: . : :.: : :.. .:.. .::
CCDS43 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
390 400 410 420 430 440
470 480 490 500 510 520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
::: : :.. :. . : ::.... :.::::: : ::.:.:...:. .
CCDS43 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
450 460 470 480 490 500
530 540 550 560 570 580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
::.:.:: : . :...: .. :.: ::::: : :.::: : . ::::: : .
CCDS43 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
510 520 530 540 550 560
590 600 610 620 630
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
. :.. .:... : : : : : : : ..:.. :. : :.:: .
CCDS43 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
570 580 590 600 610 620
640 650 660 670 680 690
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
:.: ::::. ... ::... :.: : : .:.. . : ..:: :
CCDS43 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
CCDS43 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCRIAEYSYGHQKKSSKKKKISKNDIR
690 700 710 720 730 740
>>CCDS55462.1 PCDH19 gene_id:57526|Hs108|chrX (1148 aa)
initn: 1021 init1: 295 opt: 1201 Z-score: 888.1 bits: 177.8 E(32554): 3.8e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)
10 20 30 40 50
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
::::.:::: .: : ::..: .:. ..::: :
CCDS55 MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
10 20 30
60 70 80 90 100 110
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
::.:.... :: : . . :. . :. :. ::.. : . .::. :
CCDS55 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
40 50 60 70 80 90
120 130 140 150 160
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
. .. ....:. : .. :.::.::.:: :. :.. : .. ::: ::. : :
CCDS55 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
100 110 120 130 140 150
170 180 190 200 210 220
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
:.: .:.: : :. . : : :: . ::. :::: ::::..::: ... : :
CCDS55 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
160 170 180 190 200 210
230 240 250 260 270 280
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
::.::: . . :.. . : ::. :.:..: : . : :. :..::... ::: : :.::
CCDS55 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
220 230 240 250 260 270
290 300 310 320 330 340
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
:.: .: : : :.:: :.::. . ::.:. .:.:: :::.: : . .
CCDS55 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
280 290 300 310 320
350 360 370 380 390 400
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
::: : :.::: : .... .... .:::.:::: ..: . ::: :.: ..:. :
CCDS55 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
330 340 350 360 370 380
410 420 430 440 450 460
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
:. : :. .: . . : :::::..: ::: . : :.: : :.. .:.. .::
CCDS55 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
390 400 410 420 430 440
470 480 490 500 510 520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
::: : :.. :. . : ::.... :.::::: : ::.:.:...:. .
CCDS55 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
450 460 470 480 490 500
530 540 550 560 570 580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
::.:.:: : . :...: .. :.: ::::: : :.::: : . ::::: : .
CCDS55 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
510 520 530 540 550 560
590 600 610 620 630
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
. :.. .:... : : : : : : : ..:.. :. : :.:: .
CCDS55 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
570 580 590 600 610 620
640 650 660 670 680 690
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
:.: ::::. ... ::... :.: : : .:.. . : ..:: :
CCDS55 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
CCDS55 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCSNCLTITCLLGCFIKGQNSKCLHCI
690 700 710 720 730 740
>>CCDS47177.1 FAT1 gene_id:2195|Hs108|chr4 (4588 aa)
initn: 446 init1: 322 opt: 1144 Z-score: 837.9 bits: 170.5 E(32554): 2.4e-40
Smith-Waterman score: 1715; 29.9% identity (58.5% similar) in 1399 aa overlap (594-1953:2299-3634)
570 580 590 600 610 620
pF1KA1 VSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGS
:: .:: :::.:: : .::.. : :
CCDS47 VDIIVDDINDNPPVFAQQSYAVTLSEASVIGTSVVQVRATDSDSEPNRGISYQM-FGNHS
2270 2280 2290 2300 2310 2320
630 640 650 660 670 680
pF1KA1 SGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDN
.. :..:. .: . :::: .:. . : : ::::: :.: : : : ..: :::
CCDS47 KSHDHFHVDSSTGLISLLRTLDYEQSRQHTIF-VRAVDGGMPTLSSDVIVTVDVTDLNDN
2330 2340 2350 2360 2370 2380
690 700 710 720 730 740
pF1KA1 PPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGL
:: : . : : :: ..: : : ..:.: :... .:.: ::.::. :..: .:.
CCDS47 PPLFEQQIYEARISEHAPHGHFVTCVKAYDADSSDIDKLQYSILSGNDHKHFVIDSATGI
2390 2400 2410 2420 2430 2440
750 760 770 780 790 800
pF1KA1 LTVAWPLARRA-NSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVP
.:.. : :.: . .:.... :: . :..: .... :. : : : .: .
CCDS47 ITLS-NLHRHALKPFYSLNLSVSDG---VFRSSTQVHVTVIGGNLHSPAFLQNEYEVELA
2450 2460 2470 2480 2490 2500
810 820 830 840 850
pF1KA1 EDVAPGTSVGIVQAHN-PPGRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGP
:.. : : :.. . : . :: . . . : .. : . ::. :::: .
CCDS47 ENAPLHTLVMEVKTTDGDSGIYGHVTYHIVNDFAKDRFYINE-RGQIFTLEKLDRETPAE
2510 2520 2530 2540 2550 2560
860 870 880 890 900 910
pF1KA1 -VLELEVRA-GSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLR
:. ... : .: :: . : :.: : :::.: : : . : . ..: :: . .
CCDS47 KVISVRLMAKDAGGKVAFCT--VNVILTDDNDNAPQFRATKYEVNIGSSAAKGTSVVKVL
2570 2580 2590 2600 2610
920 930 940 950 960 970
pF1KA1 ALDPDSGVNSRVTFTLLAGGGGA---FTVDPTTGHVRLMRPLGPSGGPAHELELEARDGG
: : : : :. .:... : . .. . .. .: . . : . . ..: :.:
CCDS47 ASDADEGSNADITYAIEADSESVKENLEINKLSGVITTKESLIGLENEFFTFFVRAVDNG
2620 2630 2640 2650 2660 2670
980 990 1000 1010 1020 1030
pF1KA1 SPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPDGGPITY
:: . : . : :. . . :.:. : : . . ::.. ..:. .: . :
CCDS47 SPSKES--VVLVYVKILPPEMQLPKFSEPFYTFTVSEDVPIGTEIDLIRAE--HSGTVLY
2680 2690 2700 2710 2720 2730
1040 1050 1060 1070 1080
pF1KA1 HLAAEGASSP-------FGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTG
:. .: ..: : .. ::: : .. .::.:. . : ....: . . ....
CCDS47 SLV-KG-NTPESNRDESFVIDRQSGRLKLEKSLDHETTKWYQFSILARCTQDDH--EMVA
2740 2750 2760 2770 2780 2790
1090 1100 1110 1120 1130 1140
pF1KA1 TATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQL
.. : ... . :..:: . .: ..:: : :. : .. :.: ::: ::.. :::.:
CCDS47 SVDVSIQVKDANDNSPVFESSPYEAFIVENLPGGSRVIQIRASDADSGTNGQVMYSLDQS
2800 2810 2820 2830 2840 2850
1150 1160 1170 1180 1190 1200
pF1KA1 S--EDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPR-STTGTVHVAVLDL
. : ..: :. .:: .:::. ::.:....::. : ..: : . :.:. : :.: :.
CCDS47 QSVEVIESFAINMETGWITTLKELDHEKRDNYQIKVVASDHGEKIQLSSTAIVDVTVTDV
2860 2870 2880 2890 2900 2910
1210 1220 1230 1240 1250 1260
pF1KA1 NDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGE-NGTILYTLTGPGSEL
::. : : : : : . : : ... :.. : : : : . : .:: :. :
CCDS47 NDSPPRFT-AEIYKG-----TVSEDDPQGGVIAILSTTDADSEEINRQVTYFITG-GDPL
2920 2930 2940 2950 2960
1270 1280 1290 1300 1310
pF1KA1 --FSLHPHSGE--LLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAE
:... ..: . . :: : .: .:.::..: : :. .: .. :.::
CCDS47 GQFAVETIQNEWKVYVKKPLDREKRDNYLLTITATD-GTFSSKAIVE--VKVL-------
2970 2980 2990 3000 3010
1320 1330 1340 1350 1360 1370
pF1KA1 PPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGV---GALTYTLVG-GADP
: . .:. .. . : : . ::.:. ...: . : . . .::::.: ::.
CCDS47 ---DANDNSPVCE-KTLYSDTIPEDVLPGKLIMQISATD-ADIRSNAEITYTLLGSGAEK
3020 3030 3040 3050 3060
1380 1390 1400 1410 1420 1430
pF1KA1 EGTFALDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQV--QVQDENEHA
: :. .:.: . ::: : .. : ::: :: :. .... ..: :..:
CCDS47 ---FKLNPDTGELKTSTPLDREEQAVYH-LLVRATDGGG---RFCQASIVLTLEDVNDNA
3070 3080 3090 3100 3110 3120
1440 1450 1460 1470 1480 1490
pF1KA1 PAFARDPLALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTG
: :. :: :... :: :::. : .:.:::. : : . : :. . . .. .:
CCDS47 PEFSADPYAITVFENTEPGTLLTRVQATDADA-GLNRKILYSLI--DSADGQFSINELSG
3130 3140 3150 3160 3170
1500 1510 1520 1530 1540 1550
pF1KA1 ALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSR-V
.. . :::: . : ..:.:. . :: .: .. : : : ::: ::: .
CCDS47 IIQLEKPLDRELQAVYTLSLKAVDQ--GLPRRLTATGTVIVSVLDINDNPPVFEYREYGA
3180 3190 3200 3210 3220 3230
1560 1570 1580 1590 1600 1610
pF1KA1 RLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGD-GHFRLHSSTGALSVVRPLDREQ
. :: : .:.: : . :. :...: . ::.. :.: . :.:::. ... :: :.
CCDS47 TVSEDILVGTEVLQVYAASRDIEANAEITYSIISGNEHGKFSIDSKTGAVFIIENLDYES
3240 3250 3260 3270 3280 3290
1620 1630 1640 1650 1660 1670
pF1KA1 RAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTL
:. ::: :.: :.: : . ...:.:.:.::..:.:.:. :.... :. :..:.
CCDS47 SHEYYLTVEATDGGTPSLSDVATVNVNVTDINDNTPVFSQDTYTTVISEDAVLEQSVITV
3300 3310 3320 3330 3340 3350
1680 1690 1700 1710 1720
pF1KA1 RATDPDVGANGQVTYG---GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGS
: : : .:... :. : .. ::..:: : . . . :::: .::: :.: ::
CCDS47 MADDADGPSNSHIHYSIIDGNQGSSFTIDPVRGEVKVTKLLDRETISGYTLTVQASDNGS
3360 3370 3380 3390 3400 3410
1730 1740 1750 1760 1770 1780
pF1KA1 PPQLTHVTVRVAVEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLR--ASDPDVGANGQ-L
::... .:: . : : ::.::.:. .. :. . :.. : ...:. ..: : . :: .
CCDS47 PPRVNTTTVNIDVSDVNDNAPVFSRGNYSVIIQENK-PVGFSVLQLVVTDEDSSHNGPPF
3420 3430 3440 3450 3460 3470
1790 1800 1810 1820 1830 1840
pF1KA1 QYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTV
. :. :. :: .. .: . : . :. . . :.... :.:.: ::. . . :
CCDS47 FFTIVTGNDEKAFEVN-PQGVLLTSSAIKRKEKDHYLLQVKVADNGKPQLSSLTYIDIRV
3480 3490 3500 3510 3520 3530
1850 1860 1870 1880 1890 1900
pF1KA1 LDANDHAPA-FPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLL
.. . . :: .:. . . :. .:.. . : : . .:: : . : .
CCDS47 IEESIYPPAILPLEIFITSSGEEYSGGVIG---KIHATDQDVYDTLTYSLDPQMDNLFSV
3540 3550 3560 3570 3580 3590
1910 1920 1930 1940 1950 1960
pF1KA1 EPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSP
..:.: . :: : : ..::..:: ..:....:. .:.:
CCDS47 SSTGGKLIAHKKLDIGQ---YLLNVSVTDGK----FTTVADITVHIRQVTQEMLNHTIAI
3600 3610 3620 3630 3640
1970 1980 1990 2000 2010 2020
pF1KA1 LRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVAR
CCDS47 RFANLTPEEFVGDYWRNFQRALRNILGVRRNDIQIVSLQSSEPHPHLDVLLFVEKPGSAQ
3650 3660 3670 3680 3690 3700
>--
initn: 446 init1: 322 opt: 1358 Z-score: 995.3 bits: 199.6 E(32554): 4.1e-49
Smith-Waterman score: 2468; 27.9% identity (56.1% similar) in 2362 aa overlap (430-2717:108-2294)
400 410 420 430 440 450
pF1KA1 HVNVSLEGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFV
:.:: .: :.: : : .... ..:..
CCDS47 DSENLFKAEEYILGDFCFLRIRTKGGNTAILNREVKDHYTLIVKALEKNTN-VEARTKVR
80 90 100 110 120 130
460 470 480 490 500 510
pF1KA1 LHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH
..: :.:: : :. : ::: . . ..::.: : : ::::. ::. .:
CCDS47 VQVLDTNDLRPLFSPTSYSVS-LPENTAIRTSIARVSATDADIGTNGEFYYSFKD--RTD
140 150 160 170 180 190
520 530 540 550 560 570
pF1KA1 WFSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASS-----ATVSVALQDVNDN
:.: ::::.:. .. ::: .. ..:.: :. .:: : ..: ....:.
CCDS47 MFAIHPTSGVIVLTGRLDYLETKLYEMEILAADRGMKLYGSSGISSMAKLTVHIEQANEC
200 210 220 230 240 250
580 590 600 610 620
pF1KA1 EPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFG-LLSYSLGAG---------LGSS
: . . . : . . ::. : :.: : . : :. :: .
CCDS47 APVITAVTLS---PSELDRDPAYAIVTVDDCDQGANGDIASLSIVAGDLLQQFRTVRSFP
260 270 280 290 300 310
630 640 650 660 670 680
pF1KA1 GSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGGG---LKSMVYVKVFLSDENDN
:: ... : .: .: :. : ....:. : : : ..:. ..: . . .
CCDS47 GSKEYKVKAIGG-------IDWDSHPFGYNLTLQAKDKGTPPQFSSVKVIHVTSPQFKAG
320 330 340 350 360
690 700 710 720 730 740
pF1KA1 PPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGL
: .: : : :: .::.: :. ..: : :: : .. :.. :.:. ..::
CCDS47 PVKFEKDVYRAEISEFAPPNTPVVMVKAI-PAY-SHLRYVFKSTPGKAK--FSLNYNTGL
370 380 390 400 410
750 760 770 780 790 800
pF1KA1 LTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPE
... :. :. . .::. . : . :..: .... .. .:: : : : . :
CCDS47 ISILEPVKRQQAAHFELEVTTSD-----RKASTKVLVKVLGANSNPPEFTQTAYKAAFDE
420 430 440 450 460 470
810 820 830 840 850 860
pF1KA1 DVAPGTSVGIVQAHNPP-GRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPV
.: ::.: ..: .: :. . :: :... . :..: .: ..: . :: ::. :
CCDS47 NVPIGTTVMSLSAVDPDEGENGYVTYSIANLNHVP-FAIDHFTGAVSTSENLDYELMPRV
480 490 500 510 520 530
870 880 890 900 910
pF1KA1 LELEVRAGS-GVPPAFAVARV-RVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRA
:..::.. :.: : . . :...:::.: : . .: . . : : :. :
CCDS47 YTLRIRASDWGLPYRREVEVLATITLNNLNDNTPLFEKINCEGTIPRDLGVGEQITTVSA
540 550 560 570 580 590
920 930 940 950 960 970
pF1KA1 LDPDSGVNSRVTFTLLAGGG-GAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPP
.: : . : . . ::. :...:..: . : : : . :
CCDS47 IDADEL--QLVQYQIEAGNELDFFSLNPNSGVLSLKRSLMDGLGA---------------
600 610 620 630
980 990 1000 1010 1020 1030
pF1KA1 RTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPDGGPITYHLA
..: ::... : . : .: : ... :.:... : :. : . : . ..
CCDS47 KVSFHSLRITATD------GENFATPLY-INI---TVAASHKL-VNLQCEETG--VAKML
640 650 660 670 680
1040 1050 1060 1070 1080 1090
pF1KA1 AEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILN
:: . :. :. :...... . .:
CCDS47 AEKLLQANKLHNQG-----------EVEDIFF-----------------DSHSV------
690 700
1100 1110 1120 1130 1140 1150
pF1KA1 QNEHSPRL-SEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKAFRI
: : :.. : :: . : :::: :.:: . .:: :.: ::.:.:... .::: : :
CCDS47 -NAHIPQFRSTLPTGIQVKENQPVGSSVIFMNSTDLDTGFNGKLVYAVSGGNEDS-CFMI
710 720 730 740 750 760
1160 1170 1180 1190 1200 1210
pF1KA1 HPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFLQASG
.:: . :. :::: ..: : . : : : : ... .::.:.: ::: : ::: :
CCDS47 DMETGMLKILSPLDRETTDKYTLNITVYDLGIPQKAAWRLLHVVVVDANDNPPEFLQES-
770 780 790 800 810 820
1220 1230 1240 1250 1260 1270
pF1KA1 AAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPGSELFSLHPHSGELLTA
..: . . . ..: : : : :: . :... .. ::. .: . :
CCDS47 -----YFVEVSEDKEVHSEIIQVEATDKDLGPNGHVTYSIV-TDTDTFSIDSVTGVVNIA
830 840 850 860 870 880
1280 1290 1300 1310 1320 1330
pF1KA1 APLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAPVPVV
:: : . .. : . :.::. : ::. :. .. : :. . .: . .:
CCDS47 RPLDRELQHEHSLKIEARDQA---REEP-QLFSTVVVKVSLE----DVND-NPPTFIPPN
890 900 910 920 930
1340 1350 1360 1370 1380 1390
pF1KA1 LTVTAAEGLRPGSLLGSVAAPEP--AGVGALTYTLVGGADPEGTFALDAASGRLYLARPL
: . : : :... . : .: . : . :.:. . ::.: .: :: . ... :
CCDS47 YRVKVREDLPEGTVIMWLEAHDPDLGQSGQVRYSLLDHG--EGNFDVDKLSGAVRIVQQL
940 950 960 970 980
1400 1410 1420 1430 1440 1450
pF1KA1 DFEAGPPWRALTVRAEGPGG--AGARLLRVQVQVQDENE--HAPAFARDPLALALPENPE
::: . :::::. : . . :.:.: : :: : :.:. .. :.
CCDS47 DFEKKQVYN-LTVRAKDKGKPVSLSSTCYVEVEVVDVNENLHPPVFSSFVEKGTVKEDAP
990 1000 1010 1020 1030 1040
1460 1470 1480 1490 1500 1510
pF1KA1 PGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALL
:. ..: : : :. ....:: . :. : .... .::.. . ::::.:
CCDS47 VGSLVMTVSAHDEDARR-DGEIRYSI-RDGSGVGVFKIGEETGVIETSDRLDRESTSHYW
1050 1060 1070 1080 1090 1100
1520 1530 1540 1550 1560
pF1KA1 LLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPE---DQPPGPAALHV
: : :::. . .. . . : : ::::: . : : :: ..: .....
CCDS47 LTVFATDQGVVPL---SSFIEIYIEVEDVNDNAPQTSEP--VYYPEIMENSPKDVSVVQI
1110 1120 1130 1140 1150 1160
1570 1580 1590 1600 1610 1620
pF1KA1 VARDPDLGEAARVSYRLASGG-DGHFRLHSSTGALSVV-RPLDREQRAEHVLTVVASDHG
: ::: . .. :...::. .: : .: .:: .... : :::::. ::.: :...:.:
CCDS47 EAFDPDSSSNDKLMYKITSGNPQGFFSIHPKTGLITTTSRKLDREQQDEHILEVTVTDNG
1170 1180 1190 1200 1210 1220
1630 1640 1650 1660 1670
pF1KA1 SPPRSATQVLTVSVADVNDEAPTFQQQEYSVLL-------RENNPPGTSLLTLRATDPDV
:::.:. . :.. : ::. : : :. :.. : :: : : . ::: :
CCDS47 SPPKSTIARVIVKILDENDNKPQFLQKFYKIRLPEREKPDRERNARREPLYHVIATDKDE
1230 1240 1250 1260 1270 1280
1680 1690 1700 1710 1720 1730
pF1KA1 GANGQVTYG---GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHV
: :....:. : .: ..: :::... : .. . .: :.. : : : : . .
CCDS47 GPNAEISYSIEDGNEHGKFFIEPKTGVVSSKR-FSAAGEYDI-LSIKAVDNGRPQKSS--
1290 1300 1310 1320 1330
1740 1750 1760 1770 1780
pF1KA1 TVRVAVEDENDHAPT-----FGSAHLSLEVPEGQDP--QTLTMLRASDPDVGANGQLQYR
:.:. .: . :. : . ... : :. :: . . .. . : . : .
CCDS47 TTRLHIEWISKPKPSLEPISFEESFFTFTVMES-DPVAHMIGVISVEPPGI----PLWFD
1340 1350 1360 1370 1380 1390
1790 1800 1810 1820 1830 1840
pF1KA1 ILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDA
: :. .. : .: ..: . . .::: : . ..: .:: :: :. .. . :.:.
CCDS47 ITGGNYDSHFDVDKGTGTIIVAKPLDAEQKSNYNLTVEATDGTTTILTQVF---IKVIDT
1400 1410 1420 1430 1440
1850 1860 1870 1880 1890 1900
pF1KA1 NDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAG----TAGAFLL
::: : : . : : .:::. : .::..: : : .... : : .. . : :
CCDS47 NDHRPQFSTSKYEVVIPEDTAPETEILQISAVDQD--EKNKLIYTLQSSRDPLSLKKFRL
1450 1460 1470 1480 1490 1500
1910 1920 1930 1940 1950 1960
pF1KA1 EPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVS-VTITVRDVNDHAPTFPTS
.:..: : :. ::.: ..:..: . : . :.. . . ....: :.::::: : .:
CCDS47 DPATGSLYTSEKLDHEAVHQHTLTVMVRDQDV--PVKRNFARIVVNVSDTNDHAPWFTAS
1510 1520 1530 1540 1550 1560
1970 1980 1990 2000 2010 2020
pF1KA1 PLRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRL-AGTPPPGTTVDSYTGEIRV
. :. . : .. ...: . : :.: : :: .:: . .:. . .: : :..
CCDS47 SYKGRVYE---SAAVGSVVLQ-VTALDKDKGKNAEVLYSIESGNIGNSFMIDPVLGSIKT
1570 1580 1590 1600 1610 1620
2030 2040 2050 2060 2070 2080
pF1KA1 ARSPVALGPRDRVLFIVATDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAP
:. . . :.. ::: : : : . . . . .:.: . . :..
CCDS47 AKELDRSNQAEYDLMVKATDKGSPPMSEITSVRIFVTIADNASPKFTSKEYSVELSETVS
1630 1640 1650 1660 1670 1680
2090 2100 2110 2120 2130 2140
pF1KA1 PGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRL
:. .:. ..: ... ..: : .:: .:.:.: .:.: ...: ::::. : :
CCDS47 IGS-FVGMVTAH---SQSSVVYEIKDGNTGDAFDINPHSGTIITQKA--LDFETLPIYTL
1690 1700 1710 1720 1730
2150 2160 2170 2180 2190
pF1KA1 VLQAES-GGAFAFTVLTLTLQDANDNAPRFLRPHYVAFLPESRPLEGPLLQ-------VE
..:. . .: . :.. . ::: ::::: :.. .:.... :: ... .: ..
CCDS47 IIQGTNMAGLSTNTTVLVHLQDENDNAPVFMQAEYTGLISESASINSVVLTDRNVPLVIR
1740 1750 1760 1770 1780 1790
2200 2210 2220 2230 2240 2250
pF1KA1 ADDLDQGSGGQISYSLAASQPA-RGLFHVDPTTGTITTTAILDREIWAETRLVLMATDRG
: : :. :.. . : .. .:. . : .: .::.: :. :: : . ...... : :
CCDS47 AADADKDSNALLVYHIV--EPSVHTYFAIDSSTGAIHTVLSLDYEETSIFHFTVQVHDMG
1800 1810 1820 1830 1840 1850
2260 2270 2280 2290 2300
pF1KA1 SPALVG--SATLTVMVIDTNDNRPTIPQP-WELRVSEDALLGSEIAQVTGNDVDSGPV--
.: : . .:..:: ::: :: :.. .: .: . . : .. :...:.::.
CCDS47 TPRLFAEYAANVTVHVIDINDCPPVFAKPLYEASLLLPTYKGVKVITVNATDADSSAFSQ
1860 1870 1880 1890 1900 1910
2310 2320 2330 2340 2350 2360
pF1KA1 LWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVLVED
: : .. .. . ::. : ... . .... ::.: . : :: : ... . :..
CCDS47 LIYSITEGNIGEKFSMDYKTGALTVQNTTQLRS--RYELTVRASDGRFAGLTSVKINVKE
1920 1930 1940 1950 1960 1970
2370 2380 2390 2400 2410 2420
pF1KA1 VNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVDPNN
... :.:..:.... :.. . .. ..: . : . ::. .: :... ..
CCDS47 SKESHLKFTQDVYSAVVKENSTEAETLAVITAIG--NPINEPLFYHILNPDRRFKISRTS
1980 1990 2000 2010 2020
2430 2440 2450 2460 2470 2480
pF1KA1 GTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAARATVHVQLQDQNDHAPSFTLSHYR
:.: : .:: . .. . : :::.:. .. :. .:...:.: ..::::.:: :. :
CCDS47 GVLST-TGT-PFDREQQEAFDVVVEVTEEHKPSAVAHVVVKVIVEDQNDNAPVFVNLPYY
2030 2040 2050 2060 2070 2080
2490 2500 2510 2520 2530 2540
pF1KA1 VAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGP
..: : : .. . :.: :..:. . : : : : : ::
CCDS47 AVVKVDTEVGHVIRYVTAVDRDSGRN-GEVHY---------------YLKEHHEHFQIGP
2090 2100 2110 2120 2130
2550 2560 2570 2580 2590 2600
pF1KA1 RALGCLVLLEPLDFESLTQ-YNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRASY
:: . : . .....:.. : .::.: : :.: :. : : .::. : ::: . :
CCDS47 --LGEISLKKQFELDTLNKEYLVTVVAKDGGNPAFSAEVIVPITVM--NKAMPVFEKPFY
2140 2150 2160 2170 2180
2610 2620 2630 2640 2650 2660
pF1KA1 RVTVPEDTPVGAELLHVEASDADPGPHGL-VRFTVSSGDPSGLFELDESSGTLRLAHALD
. . :. : . ..::.:. .:.:: : .....::: . : .. ..:.. . ::
CCDS47 SAEIAESIQVHSPVVHVQAN----SPEGLKVFYSITDGDPFSQFTINFNTGVINVIAPLD
2190 2200 2210 2220 2230 2240
2670 2680 2690 2700 2710 2720
pF1KA1 CETQARHQLVVQAADP-AGAHFALAPVTIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLV
:.. ..: ..:.: .::: : . : : :.:.::. :.: . .....:
CCDS47 FEAHPAYKLSIRATDSLTGAH-AEVFVDIIVDDINDNPPVFAQQSYAVTLSEASVIGTSV
2250 2260 2270 2280 2290 2300
2730 2740 2750 2760 2770 2780
pF1KA1 TTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSSTGELRARVPFDYEHTESFRLLV
CCDS47 VQVRATDSDSEPNRGISYQMFGNHSKSHDHFHVDSSTGLISLLRTLDYEQSRQHTIFVRA
2310 2320 2330 2340 2350 2360
>>CCDS75345.1 PCDHGA11 gene_id:56105|Hs108|chr5 (837 aa)
initn: 1135 init1: 406 opt: 1121 Z-score: 831.2 bits: 166.8 E(32554): 5.6e-40
Smith-Waterman score: 1121; 35.2% identity (61.6% similar) in 679 aa overlap (25-677:13-667)
10 20 30 40 50 60
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
::::: ..::. . : .: .. .. :: :..
CCDS75 MANRLQRGDRSRLLLLLCIFLGT-LRGF--RARQIRYSVPEETEKGSF
10 20 30 40
70 80 90 100 110
pF1KA1 IGDISAGL---PAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRF
.:.:: : : : . ..: : .:.. .:: . :: .:::. .
CCDS75 VGNISKDLGLEPRELAKRGVRIVS----RGKTQLFAVNPRSGSLITAGRIDREELCETVS
50 60 70 80 90 100
120 130 140 150 160 170
pF1KA1 TAVTPDGATVE-------VTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDA
. :: : :.. ::::.::.: . .. ..: ::. :.:. : :::
CCDS75 SCFLNMELLVEDTLKIYGVEVEIIDINDNAPSFQEDEVEIKVSEHAIPGARFALPNARDP
110 120 130 140 150 160
180 190 200 210 220 230
pF1KA1 DAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDG
:.: . :.: :: .. : :. : ::. ::::. : ::::... ..: : : ::
CCDS75 DVGVNSLQSYQLSPNNY---FSLQLRGRTDGAKNPELVLEGSLDREKEAAHLLLLTALDG
170 180 190 200 210
240 250 260 270 280 290
pF1KA1 GSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAV
:.: :.. . . :..::.::: : :.:: :.. : :... :. ::.: :.: : :.:: :
CCDS75 GDPIRKGAVPIRVVVLDVNDHIPMFTQSVYRVSVPENISSGTRVLMVNATDPDEGINGEV
220 230 240 250 260 270
300 310 320 330 340 350
pF1KA1 TYEINRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTV
: . .:... :..:..:: .:.. ::::. : .:. .:..:::. . ..::
CCDS75 MYSFRNMESKASEIFQLDSQTGEVQVRGSLDFEKYRFYEMEIQGQDGGGLFTTTTMLITV
280 290 300 310 320 330
360 370 380 390 400 410
pF1KA1 HVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEG
:.::: : .:. :. .: . : .::: ..: ..:.: :.:. ..:. . . .
CCDS75 --VDVNDNAPEITIT--SSINS--ILENSPPGTVIALLNVQDQDSGENGQVSCFIPN-HL
340 350 360 370 380 390
420 430 440 450 460 470
pF1KA1 HFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAP
: : . : . ..: :::: ..::. .::::.::::: ::. :.:.: ::: :
CCDS75 PFKLEKTYGNYYKLITSRVLDRELVQSYNITLTATDQGSPPLSAETHVWLNVADDNDNPP
400 410 420 430 440 450
480 490 500 510 520
pF1KA1 AFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGA-----HTHWFSIDP
.: .. : .:: :. . ::: :::. :. :::::. . . . ::.
CCDS75 VFPHSSYSAY-IPENNPRGASIFSVTALDPDSKQNALVTYSLTDDTVQGVPLSSYVSINS
460 470 480 490 500 510
530 540 550 560 570 580
pF1KA1 TSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQ--FQRTFY
..:.. . :.::: . .: :.: :.: :::.:....:. . : ::: :. .
CCDS75 NTGVLYALQSFDYEQFRDLELRVIARDSGDPPLSSNVSLSLFVLDQNDNAPEILYPALPT
520 530 540 550 560 570
590 600 610 620 630
pF1KA1 NASL-----PEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDV
..: :....:: .:.:.: ::: . ::: : : .: : . :.:.:
CCDS75 DGSTGVELAPRSAEPGYLVTKVVAVDKDSGQNAWLSYRL---LKASEPGLFAVGEHTGEV
580 590 600 610 620
640 650 660 670 680 690
pF1KA1 CTTRTL-DRDQGPSSFDFTVTAVDGGG---LKSMVYVKVFLSDENDNPPQFYPREYAASI
:.:.: ::: .:. :.::. : :.. : . : ..:
CCDS75 RTARALLDRDALKQSL---VVAVQDHGQPPLSATVTLTVAVADSIPEVLADLGSLESLAN
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA1 SAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRANS
CCDS75 SETSDLSLYLVVAVAAVSCIFLVFVIVLLALRLWRWHKSRLLQASEGGLAGMPTSHFVGV
690 700 710 720 730 740
3298 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 20:10:55 2016 done: Thu Nov 3 20:10:58 2016
Total Scan time: 11.210 Total Display time: 3.230
Function used was FASTA [36.3.4 Apr, 2011]