Result of FASTA (ccds) for pF1KA1773
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KA1773, 3298 aa
  1>>>pF1KA1773 3298 - 3298 aa - 3298 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 8.1901+/-0.0011; mu= 15.1722+/- 0.066
 mean_var=184.8097+/-37.421, 0's: 0 Z-trim(109.9): 198  B-trim: 75 in 1/53
 Lambda= 0.094343
 statistics sampled from 11033 (11233) to 11033 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.345), width:  16
 Scan time: 11.210

The best scores are:                                      opt bits E(32554)
CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11          (3298) 21809 2983.0       0
CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4          (2916) 2612 370.1 1.2e-100
CCDS47150.1 DCHS2 gene_id:54798|Hs108|chr4         (1369) 1679 242.9 1.1e-62
CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4           (4981) 1467 214.5 1.5e-53
CCDS4317.1 FAT2 gene_id:2196|Hs108|chr5            (4349) 1289 190.2 2.6e-46
CCDS48141.1 PCDH19 gene_id:57526|Hs108|chrX        (1100) 1201 177.8 3.7e-43
CCDS43976.1 PCDH19 gene_id:57526|Hs108|chrX        (1101) 1201 177.8 3.7e-43
CCDS55462.1 PCDH19 gene_id:57526|Hs108|chrX        (1148) 1201 177.8 3.8e-43
CCDS47177.1 FAT1 gene_id:2195|Hs108|chr4           (4588) 1144 170.5 2.4e-40
CCDS75345.1 PCDHGA11 gene_id:56105|Hs108|chr5      ( 837) 1121 166.8 5.6e-40
CCDS47294.1 PCDHGA11 gene_id:56105|Hs108|chr5      ( 935) 1121 166.8 6.1e-40
CCDS75343.1 PCDHGA10 gene_id:56106|Hs108|chr5      ( 850) 1110 165.3 1.6e-39
CCDS47292.1 PCDHGA10 gene_id:56106|Hs108|chr5      ( 936) 1110 165.3 1.7e-39
CCDS54930.1 PCDHGA11 gene_id:56105|Hs108|chr5      ( 750) 1084 161.7 1.7e-38
CCDS75331.1 PCDHGA4 gene_id:56111|Hs108|chr5       ( 851) 1078 160.9 3.3e-38
CCDS58979.2 PCDHGA4 gene_id:56111|Hs108|chr5       ( 962) 1078 161.0 3.6e-38
CCDS75338.1 PCDHGA8 gene_id:9708|Hs108|chr5        ( 820) 1075 160.5 4.2e-38
CCDS47291.1 PCDHGA8 gene_id:9708|Hs108|chr5        ( 932) 1075 160.5 4.7e-38
CCDS75335.1 PCDHGA6 gene_id:56109|Hs108|chr5       ( 818) 1069 159.7 7.4e-38
CCDS75342.1 PCDHGB6 gene_id:56100|Hs108|chr5       ( 820) 1068 159.6 8.2e-38
CCDS4269.1 PCDH12 gene_id:51294|Hs108|chr5         (1184) 1071 160.1 8.2e-38
CCDS54926.1 PCDHGA6 gene_id:56109|Hs108|chr5       ( 932) 1069 159.7 8.2e-38
CCDS75341.1 PCDHGA9 gene_id:56107|Hs108|chr5       ( 828) 1068 159.6 8.3e-38
CCDS54929.1 PCDHGB6 gene_id:56100|Hs108|chr5       ( 930) 1068 159.6   9e-38
CCDS58981.1 PCDHGA9 gene_id:56107|Hs108|chr5       ( 932) 1068 159.6 9.1e-38
CCDS47289.1 PCDHGA2 gene_id:56113|Hs108|chr5       ( 932) 1063 158.9 1.5e-37
CCDS75344.1 PCDHGB7 gene_id:56099|Hs108|chr5       ( 808) 1060 158.5 1.7e-37
CCDS54922.1 PCDHGA1 gene_id:56114|Hs108|chr5       ( 931) 1061 158.6 1.8e-37
CCDS47293.1 PCDHGB7 gene_id:56099|Hs108|chr5       ( 929) 1060 158.5 1.9e-37
CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22        (3014) 1054 158.1 8.4e-37
CCDS75346.1 PCDHGA12 gene_id:26025|Hs108|chr5      ( 820) 1041 155.9   1e-36
CCDS4260.1 PCDHGA12 gene_id:26025|Hs108|chr5       ( 932) 1041 155.9 1.2e-36
CCDS75336.1 PCDHGA7 gene_id:56108|Hs108|chr5       ( 817) 1033 154.8 2.2e-36
CCDS54927.1 PCDHGA7 gene_id:56108|Hs108|chr5       ( 932) 1033 154.8 2.5e-36
CCDS4243.1 PCDHB1 gene_id:29930|Hs108|chr5         ( 818) 1030 154.4   3e-36
CCDS81472.1 CDH23 gene_id:64072|Hs108|chr10        (1381) 1007 151.4 3.9e-35
CCDS4257.1 PCDHB15 gene_id:56121|Hs108|chr5        ( 787) 1000 150.3 4.9e-35
CCDS75326.1 PCDHA11 gene_id:56138|Hs108|chr5       ( 810)  992 149.2 1.1e-34
CCDS47284.1 PCDHA11 gene_id:56138|Hs108|chr5       ( 949)  992 149.3 1.2e-34
CCDS75334.1 PCDHGB3 gene_id:56102|Hs108|chr5       ( 814)  972 146.5   7e-34
CCDS58980.1 PCDHGB3 gene_id:56102|Hs108|chr5       ( 929)  972 146.5 7.7e-34
CCDS4253.1 PCDHB11 gene_id:56125|Hs108|chr5        ( 797)  956 144.3 3.1e-33
CCDS4254.1 PCDHB12 gene_id:56124|Hs108|chr5        ( 795)  955 144.2 3.4e-33
CCDS4251.1 PCDHB16 gene_id:57717|Hs108|chr5        ( 776)  946 142.9 7.8e-33
CCDS4244.1 PCDHB2 gene_id:56133|Hs108|chr5         ( 798)  938 141.9 1.7e-32
CCDS4250.1 PCDHB8 gene_id:56128|Hs108|chr5         ( 801)  928 140.5 4.4e-32
CCDS4245.1 PCDHB3 gene_id:56132|Hs108|chr5         ( 796)  926 140.2 5.3e-32
CCDS4249.1 PCDHB7 gene_id:56129|Hs108|chr5         ( 793)  911 138.2 2.2e-31
CCDS75328.1 PCDHB9 gene_id:56127|Hs108|chr5        ( 797)  911 138.2 2.2e-31
CCDS4246.1 PCDHB4 gene_id:56131|Hs108|chr5         ( 795)  902 137.0 5.1e-31


>>CCDS7771.1 DCHS1 gene_id:8642|Hs108|chr11               (3298 aa)
 initn: 21809 init1: 21809 opt: 21809  Z-score: 16040.9  bits: 2983.0 E(32554):    0
Smith-Waterman score: 21809; 100.0% identity (100.0% similar) in 3298 aa overlap (1-3298:1-3298)

               10        20        30        40        50        60
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KA1 IGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAV
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KA1 TPDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TPDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGY
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KA1 ALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQAL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KA1 LDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEINRRQSE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEINRRQSE
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KA1 GDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTVHVRDANDNQP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTVHVRDANDNQP
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KA1 SMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSV
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KA1 IYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPE
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KA1 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYEL
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KA1 EPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 EPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQV
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KA1 TATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAV
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KA1 DGGGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DGGGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRL
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KA1 SYHILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SYHILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISI
              730       740       750       760       770       780

              790       800       810       820       830       840
pF1KA1 VPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLD
              790       800       810       820       830       840

              850       860       870       880       890       900
pF1KA1 AVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDT
              850       860       870       880       890       900

              910       920       930       940       950       960
pF1KA1 VLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSG
              910       920       930       940       950       960

              970       980       990      1000      1010      1020
pF1KA1 GPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVL
              970       980       990      1000      1010      1020

             1030      1040      1050      1060      1070      1080
pF1KA1 QVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKA
             1030      1040      1050      1060      1070      1080

             1090      1100      1110      1120      1130      1140
pF1KA1 ELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRL
             1090      1100      1110      1120      1130      1140

             1150      1160      1170      1180      1190      1200
pF1KA1 TYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVA
             1150      1160      1170      1180      1190      1200

             1210      1220      1230      1240      1250      1260
pF1KA1 VLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPG
             1210      1220      1230      1240      1250      1260

             1270      1280      1290      1300      1310      1320
pF1KA1 SELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEP
             1270      1280      1290      1300      1310      1320

             1330      1340      1350      1360      1370      1380
pF1KA1 PPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGALTYTLVGGADPEGTFA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGALTYTLVGGADPEGTFA
             1330      1340      1350      1360      1370      1380

             1390      1400      1410      1420      1430      1440
pF1KA1 LDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDP
             1390      1400      1410      1420      1430      1440

             1450      1460      1470      1480      1490      1500
pF1KA1 LALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRG
             1450      1460      1470      1480      1490      1500

             1510      1520      1530      1540      1550      1560
pF1KA1 LDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPP
             1510      1520      1530      1540      1550      1560

             1570      1580      1590      1600      1610      1620
pF1KA1 GPAALHVVARDPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GPAALHVVARDPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVV
             1570      1580      1590      1600      1610      1620

             1630      1640      1650      1660      1670      1680
pF1KA1 ASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGA
             1630      1640      1650      1660      1670      1680

             1690      1700      1710      1720      1730      1740
pF1KA1 NGQVTYGGVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NGQVTYGGVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVA
             1690      1700      1710      1720      1730      1740

             1750      1760      1770      1780      1790      1800
pF1KA1 VEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVL
             1750      1760      1770      1780      1790      1800

             1810      1820      1830      1840      1850      1860
pF1KA1 DLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAY
             1810      1820      1830      1840      1850      1860

             1870      1880      1890      1900      1910      1920
pF1KA1 SVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDRE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDRE
             1870      1880      1890      1900      1910      1920

             1930      1940      1950      1960      1970      1980
pF1KA1 QCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPT
             1930      1940      1950      1960      1970      1980

             1990      2000      2010      2020      2030      2040
pF1KA1 LALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVA
             1990      2000      2010      2020      2030      2040

             2050      2060      2070      2080      2090      2100
pF1KA1 TDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNG
             2050      2060      2070      2080      2090      2100

             2110      2120      2130      2140      2150      2160
pF1KA1 PITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLT
             2110      2120      2130      2140      2150      2160

             2170      2180      2190      2200      2210      2220
pF1KA1 LQDANDNAPRFLRPHYVAFLPESRPLEGPLLQVEADDLDQGSGGQISYSLAASQPARGLF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LQDANDNAPRFLRPHYVAFLPESRPLEGPLLQVEADDLDQGSGGQISYSLAASQPARGLF
             2170      2180      2190      2200      2210      2220

             2230      2240      2250      2260      2270      2280
pF1KA1 HVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIPQP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIPQP
             2230      2240      2250      2260      2270      2280

             2290      2300      2310      2320      2330      2340
pF1KA1 WELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 WELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFE
             2290      2300      2310      2320      2330      2340

             2350      2360      2370      2380      2390      2400
pF1KA1 QCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSA
             2350      2360      2370      2380      2390      2400

             2410      2420      2430      2440      2450      2460
pF1KA1 TDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAP
             2410      2420      2430      2440      2450      2460

             2470      2480      2490      2500      2510      2520
pF1KA1 GRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDY
             2470      2480      2490      2500      2510      2520

             2530      2540      2550      2560      2570      2580
pF1KA1 SIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQP
             2530      2540      2550      2560      2570      2580

             2590      2600      2610      2620      2630      2640
pF1KA1 PQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFT
             2590      2600      2610      2620      2630      2640

             2650      2660      2670      2680      2690      2700
pF1KA1 VSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVN
             2650      2660      2670      2680      2690      2700

             2710      2720      2730      2740      2750      2760
pF1KA1 DHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFAL
             2710      2720      2730      2740      2750      2760

             2770      2780      2790      2800      2810      2820
pF1KA1 NSSTGELRARVPFDYEHTESFRLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NSSTGELRARVPFDYEHTESFRLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHF
             2770      2780      2790      2800      2810      2820

             2830      2840      2850      2860      2870      2880
pF1KA1 QVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSSPYFGINQTTGALYLRVDSRAPGSG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 QVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSSPYFGINQTTGALYLRVDSRAPGSG
             2830      2840      2850      2860      2870      2880

             2890      2900      2910      2920      2930      2940
pF1KA1 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
             2890      2900      2910      2920      2930      2940

             2950      2960      2970      2980      2990      3000
pF1KA1 VAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPSPPPSE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSLQKLGREPPSPPPSE
             2950      2960      2970      2980      2990      3000

             3010      3020      3030      3040      3050      3060
pF1KA1 HLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVASVASSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HLYHQTLPSYGGPGAGGPYPRGGSLDPSHSSGRGSAEAAEDDEIRMINEFPRVASVASSL
             3010      3020      3030      3040      3050      3060

             3070      3080      3090      3100      3110      3120
pF1KA1 AARGPDSGIQQDADGLSDTSCEPPAPDTWYKGRKAGLLLPGAGATLYREEGPPATATAFL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AARGPDSGIQQDADGLSDTSCEPPAPDTWYKGRKAGLLLPGAGATLYREEGPPATATAFL
             3070      3080      3090      3100      3110      3120

             3130      3140      3150      3160      3170      3180
pF1KA1 GGCGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GGCGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVF
             3130      3140      3150      3160      3170      3180

             3190      3200      3210      3220      3230      3240
pF1KA1 TEIARLKDEARPCPPAPRIDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRSPIS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TEIARLKDEARPCPPAPRIDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRSPIS
             3190      3200      3210      3220      3230      3240

             3250      3260      3270      3280      3290        
pF1KA1 HEGSLSSAAMSPSFSPSLSPLAARSPVVSPFGVAQGPSASALSAESGLEPPDDTELHI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 HEGSLSSAAMSPSFSPSLSPLAARSPVVSPFGVAQGPSASALSAESGLEPPDDTELHI
             3250      3260      3270      3280      3290        

>>CCDS3785.1 DCHS2 gene_id:54798|Hs108|chr4               (2916 aa)
 initn: 2202 init1: 678 opt: 2612  Z-score: 1920.4  bits: 370.1 E(32554): 1.2e-100
Smith-Waterman score: 4890; 33.7% identity (61.2% similar) in 2913 aa overlap (495-3296:79-2916)

          470       480       490       500       510       520    
pF1KA1 VNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHW----
                                     ::: : :.:  : . :::  :  ..     
CCDS37 LKRGSPETELWGAIVFRSQEENAKPVKETEVTASDADSGLYGFIEYSLYDGFLSYEAPQA
       50        60        70        80        90       100        

              530       540        550                 560         
pF1KA1 FSIDPTSGIITTAASLDYELEPQP-QLIVVATDGG---LPPLA-------SSATVSVALQ
       : ::: .: : .. ..: : .:   .:.: : ::    .  ::       ..: : : :.
CCDS37 FRIDPHDGQICVSQDIDRERDPATYDLLVEAKDGDEQRMTHLALVKGGLSAQAFVRVDLE
      110       120       130       140       150       160        

     570       580       590       600       610       620         
pF1KA1 DVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPF
       :::::.: :. . : .:. . ::::: ...: ::: ::: .: ..: :  :  ::    :
CCDS37 DVNDNHPVFNPSTYVTSISDETQPGTEIINVLATDQDSGIYGTVAYELIPGNVSSL---F
      170       180       190       200       210       220        

     630       640       650       660        670       680        
pF1KA1 RIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGGGLKSMV-YVKVFLSDENDNPPQFYPR
        ::. .:       .      :. .:..     ..:. ..  .. : . : :.       
CCDS37 TIDSTTGLYSPEVEIL-----SAVNFSADKEVMNSLEMFLPLLRHFKKVERDEEAAEKKF
         230       240            250       260       270       280

      690       700       710       720       730       740        
pF1KA1 EYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPL
       : . .   .      .  :...:   .. :. . . .:. .     : :  :.. .. ::
CCDS37 EASRGWFMRFKGRRHLHYLKVQDEAASADGEAAARYVANLAK---ILGE--GIIYLTLPL
              290       300       310       320            330     

      750       760       770       780       790       800        
pF1KA1 ARRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTS
       ..  .....: ..:.::::: :  .: : : :   : .:  ::. .:.: : :::   . 
CCDS37 SHLESTTLSLMVSAQDGGGLTAVINADVTIHIFQTTLAPAEFERPKYTFLVYEDVPEDSP
         340       350       360       370       380       390     

      810       820       830       840       850       860        
pF1KA1 VGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRAG
       .: :.:..: .   :.   .:.::  : ::.    : ..: .:::.:   ::. : :.: 
CCDS37 IGTVKAREPLNSSEPIFYRISSGDLGGKFSIHPRLGTIRTRKPLDHETQ-PVVVLTVQAQ
         400       410       420       430       440        450    

      870       880       890       900       910       920        
pF1KA1 SGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSR
        :  :: . ..: . . ::::: :::    : . .  .: ::: .:  :: : ::: :. 
CCDS37 LGSAPACSSTEVNITVMDVNDNHPAFLRTSDEIRISQTTPPGTALYLARAEDRDSGRNGL
          460       470       480       490       500       510    

      930       940       950       960       970       980        
pF1KA1 VTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLRVVV
       . ... .   :.:..: . : . :   :: .      : :.:.: :  :... . : ::.
CCDS37 IRYSIASPQPGVFAIDRALGVLFLNGSLGAGEQRELTLTLRAEDQGVHPQAALLVLTVVI
          520       530       540       550       560       570    

      990        1000      1010      1020           1030      1040 
pF1KA1 QDVGTRGLAPR--FNSPTYRVDLPSGTTAGTQVLQVQAQAPDG-----GPITYHLAAEGA
       .    :  .:   :.  .:.:..  . .  ::.::.::. : :     .:. : :     
CCDS37 EK---REHSPSWTFEHLVYQVEVSESLSPMTQMLQTQAH-PLGPQRAASPLRYSLEPSVD
             580       590       600       610        620       630

            1050      1060      1070      1080      1090      1100 
pF1KA1 SSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILNQNEH
       :. ::..: .::...:  .: :. . : ..:.:     . :  :. ..:: : . ..:..
CCDS37 SAMFGIRPYTGWIYLRRQFDYESTQTYNFRVFAWIPEDGFL--QNVSTTVIVRVWDENDN
              640       650       660       670         680        

            1110      1120      1130      1140      1150      1160 
pF1KA1 SPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKAFRIHPQTG
       :: . .:  :: : :.  :   .:.. : : ::: ::.: : :  :: :.: :...:.::
CCDS37 SPTFLHDVLFLKVEESPVPQGVIGKITAIDMDSGKNGQLLYFL--LS-DGKFFKMNPNTG
      690       700       710       720       730          740     

                                                        1170       
pF1KA1 EVTT------------------------LQT--------------------LDREQQSSY
        . :                        ::.                    ::::... .
CCDS37 PAGTIYVITWADGAAAFSGTDFAFSSDELQAFVLKSLFCELGEGELINWVALDREHRGHH
         750       760       770       780       790       800     

      1180      1190      1200      1210      1220      1230       
pF1KA1 QLLVQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVT
       .. : : : :::::..: .:.:.: :.::: : : :     :  : ..: .  : . :::
CCDS37 EMTVLVTDRGSPPRNATMAVYVSVTDINDNRPFFPQC--LPGKELHVKVLEGQPVNMLVT
         810       820       830       840         850       860   

      1240      1250       1260      1270      1280      1290      
pF1KA1 TLQAKDPDEGENGTILYTLTGP-GSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQ
       :. :::::::.:. . :....  .:. :..  ..::. :.. :    :: : ... : ::
CCDS37 TVFAKDPDEGNNAEVTYSVSSEDSSDHFKIDANNGEIRTTTILSYDYRPSYRMSVIATDQ
           870       880       890       900       910       920   

       1300      1310      1320      1330      1340      1350      
pF1KA1 GSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAA
       : :: ...  . .::.:   :..    ...      .:        :.:.: .... . .
CCDS37 GVPPLQGQAVVNIQVIP---LSKGRAIMSQNIRHLIIP--------ENLKPTKIMSLIKS
           930       940          950               960       970  

       1360         1370      1380      1390      1400        1410 
pF1KA1 PEPAGV---GALTYTLVGGADPEGTFALDAASGRLYLARPLDFEAGPPW--RALTVRAEG
        .       : : ...:.  : .: : .:...: :.:.. ::.:.   .  :..:.  ..
CCDS37 SDHLQQHYNGKLHFSIVAD-DKDGHFEIDSSTGDLFLSKELDYETTSHYLFRVITTD-HS
            980       990       1000      1010      1020       1030

            1420      1430      1440      1450      1460      1470 
pF1KA1 PGGAGARLLRVQVQVQDENEHAPAFARDPLALALPENPEPGAALYTFRASDADGPGPNSD
        . . .  . ....:.:.:.:.:.:  . ..... ::   :. .:.: :.: ::   :: 
CCDS37 KNLSLSSTVFLSIDVEDQNDHSPSFQDELIVISVEENVPIGTLVYVFNAKDDDGSFLNSR
             1040      1050      1060      1070      1080      1090

            1480      1490      1500      1510      1520      1530 
pF1KA1 VRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVS
       ..: .  ..: .  . .    :.: .   ::::. :...: : :.:. .:.. ::   ..
CCDS37 IQYYIESHNPGTNPFLIHPSFGTLVTVSRLDRESIPTVILTVTASDQAVNVTDRRLRSLT
             1100      1110      1120      1130      1140      1150

            1540      1550      1560      1570      1580      1590 
pF1KA1 ARVFVTDENDNAPVFASPSRVRLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGDGH
       :.. . : ::. :.: :   ... ::   :  . :..:.::: :. ..:.: . ::... 
CCDS37 AQIVILDVNDHNPTFISFPNAHVKEDVTVGSLVHHITAHDPDEGRNGKVTYSILSGNENM
             1160      1170      1180      1190      1200      1210

             1600      1610      1620      1630      1640      1650
pF1KA1 -FRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQ
        : :  :.: :... ::: :....:.:::.: : :.:  :..:.:::.: :::::::.:.
CCDS37 TFMLDESSGLLTTTCPLDYEMKTQHILTVLALDDGTPALSSSQTLTVTVLDVNDEAPVFK
             1220      1230      1240      1250      1260      1270

             1660      1670      1680         1690      1700       
pF1KA1 QQEYSVLLRENNPPGTSLLTLRATDPDVGANGQVTY---GGVSSESFSLDPDTGVLTTLR
       :. : . ..::. ::  .  ..: : : :.:... .    :.: : : .. ::: ..:  
CCDS37 QHLYEASVKENQNPGEFVTRVEALDRDSGVNSKLQFEIMPGASFELFEINSDTGEVVTTT
             1280      1290      1300      1310      1320      1330

      1710      1720      1730      1740      1750      1760       
pF1KA1 ALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVEDENDHAPTFGSAHLSLEVPEGQDPQ
        :::: :: ..: : ..: : :   . .:.  .::::::::: :  .  ..:: :.:.:.
CCDS37 ILDREIQEVFTLRVLVRDGGFPSLSSTTTILCTVEDENDHAPEFIVSSYDIEVLENQEPE
             1340      1350      1360      1370      1380      1390

      1770      1780      1790      1800      1810      1820       
pF1KA1 TLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEA
       ..  . ::: :.: :  ..:.:.::. .  :...  :::..: : ::::    : : :  
CCDS37 VVYTVLASDMDAGNNRAVEYHIIDGNTDECFTINEMSGELSTTRALDREQISNFTLVILC
             1400      1410      1420      1430      1440      1450

      1830      1840      1850      1860      1870      1880       
pF1KA1 RDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGAN
        : :.:  :... : : :::::::.:.::.  :.  : ::. .::..: :.: : : : :
CCDS37 SDLGDPPRSSVIHLQVRVLDANDHSPSFPTLYYQSSVREDAEVGTVVLVLSAVDKDEGLN
             1460      1470      1480      1490      1500      1510

      1890      1900      1910      1920      1930      1940       
pF1KA1 GHVTYYLGAGTAGAFLLEPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVSVT
       :.. :.:   ..::: ..: :: :.:. .::::   ..:::. : : .  :  :::: . 
CCDS37 GQTEYFLTDEASGAFTIDPMSGTLKTSNTLDREARSQHTFSAVARDCSIQGSRSTTVIIK
             1520      1530      1540      1550      1560      1570

      1950      1960      1970      1980      1990      2000       
pF1KA1 ITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRLAGTP
       . : ::::. :..  .:. . :   .:. .: ..    .::.: : : :..... .: : 
CCDS37 VYVTDVNDNDPVLEQNPFDVFLSPESPTNQTTVI----VRADDLDLGPNGTVVFSFAETQ
             1580      1590      1600          1610      1620      

      2010      2020       2030      2040      2050      2060      
pF1KA1 PPGTTVDSYTGEIRVARSPVA-LGPRDRVLFIVATDLGRPARSATGVIIVGLQGEAERGP
           ..:.:::::.  ..: .   :    : . .:: : :::..::.... ..::  .  
CCDS37 SM-FSIDKYTGEIQFQQNPSSEYFPI--WLQLKVTDQGIPARTTTGLLVIHMEGEDVK-I
        1630      1640      1650        1660      1670      1680   

       2070      2080      2090      2100      2110      2120      
pF1KA1 RFPRASSEATIRENAPPGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFSIQPSTGAITV
        : .   .. . ::   :: ::. .:    . .  . :::.:::: :..:.  ..: .::
CCDS37 SFSHHLYKGLVTENCEAGTSIVTVKAFAPDSIQDSMKYSIFSGNEDGVLSLCSKSGQLTV
           1690      1700      1710      1720      1730      1740  

       2130      2140      2150      2160      2170      2180      
pF1KA1 RSAEGLDFEVSPRLRLVLQAESGGAFAFTVLTLTLQDANDNAPRFLRPHYVAFLPESRPL
       .  . :::::  ...:.. :::.:  :.  ... .:: :::.: : .  : : . ::.  
CCDS37 KEPKFLDFEVRNEVQLIVLAESSGHRAYCKVAVLIQDENDNSPCFEQSIYQASVSESQLY
           1750      1760      1770      1780      1790      1800  

       2190      2200      2210      2220      2230      2240      
pF1KA1 EGPLLQVEADDLDQGSGGQISYSLAASQPARGLFHVDPTTGTITTTAILDREIWAETRLV
       .. ..:: : :::.: .: : ::. ...  .. :..:  .:.::: :::: :. .   :.
CCDS37 NAHVIQVFATDLDSGLNGLIEYSILSGNQEEA-FQIDALSGVITTKAILDYELTSSYSLI
           1810      1820      1830       1840      1850      1860 

       2250      2260      2270      2280      2290      2300      
pF1KA1 LMATDRGSPALVGSATLTVMVIDTNDNRPTIPQPWELRVSEDALLGSEIAQVTGNDVDSG
       ..:::.: : : ..... :.: : ::: :..     ....::.: :  ...:. .::: .
CCDS37 VQATDKGMPRLSNTTVIKVQVTDINDNAPAFLPSEAVEITEDSLPGVIVTHVSVHDVDLN
            1870      1880      1890      1900      1910      1920 

       2310       2320      2330      2340      2350      2360     
pF1KA1 PVLWYVLSP-SGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVL
        .. . ..  :.:   :.. .  : : :.  ::::.  .:.: .   :. :  .. :.: 
CCDS37 SAFIFSFAKESNPGTKFAIDQNTGVVVLVKTLDFEEMTEYELLIQISDSVHYTEGALVVR
            1930      1940      1950      1960      1970      1980 

        2370      2380      2390      2400      2410      2420     
pF1KA1 VEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVD
       : ::::: :.:::..::: . :  : : ..:..:::: .:. :  :::.. : .  ::.:
CCDS37 VLDVNDNPPVFSQDFYQVTVPESIPVGYSVLTLSATDLESNEN--ISYRILSSSKEFSID
            1990      2000      2010      2020        2030         

        2430      2440      2450      2460      2470      2480     
pF1KA1 PNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAARATVHVQLQDQNDHAPSFTLS
       :.:::.:::  .. :  :  .... ..:: : : :   : . :.. ..:.:..:: ::..
CCDS37 PKNGTIFTISPVLLL--DTISTTQFLVEASDGGNPDLRALTLVEIGIEDMNNYAPEFTVK
    2040      2050        2060      2070      2080      2090       

        2490      2500      2510      2520      2530      2540     
pF1KA1 HYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAG
        : ....::   ::::.:.   : : .: .. :.:::::::    :..: .. .   :  
CCDS37 SYNLSLSEDALVGSTLVTFSNIDHDWTRENTYVEYSIISGNSQNNFHVETKFFH---SEY
      2100      2110      2120      2130      2140      2150       

        2550      2560      2570      2580      2590      2600     
pF1KA1 PGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRA
       :  . .: ::::. :: :. ....:.. :.: : :: ::.. ... ::::::::: :.  
CCDS37 PY-KQVGYLVLLHSLDREASASHELVILASDSGCPPLSSTAVISIQVLDVNDNPPNFSSL
          2160      2170      2180      2190      2200      2210   

        2610      2620      2630      2640      2650      2660     
pF1KA1 SYRVTVPEDTPVGAELLHVEASDADPGPHGLVRFTVSSGDPSGLFELDESSGTLRLAHAL
       ::.. : :.::.:...  : :.: : : :. . ... ::. .: : :.:..:.: : . :
CCDS37 SYHTHVKESTPLGSHITVVSANDRDTGSHAEIIYNIISGNEKGHFYLEENTGVLYLIKPL
          2220      2230      2240      2250      2260      2270   

        2670      2680      2690      2700      2710      2720     
pF1KA1 DCETQARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLV
       : : ...  :.:::.:    ::..: : . : : :::.: : .. .:  : :: : .. .
CCDS37 DYEKMTKFTLTVQASDAEKKHFSFAVVFVSVLDDNDHAPQFMFSSFSCIVPENLPISSTI
          2280      2290      2300      2310      2320      2330   

        2730      2740      2750          2760      2770      2780 
pF1KA1 TTLHAIDGDAGAFGRLRYSLLEAGPGPEG----REAFALNSSTGELRARVPFDYEHTESF
        ...:.: ::: .:.: ::..      .:    .. : ..  ::...:.  .:::. ...
CCDS37 CSINALDFDAGPYGELTYSIVSPCFLTHGMSYDHDLFLIDPLTGDIHAKQILDYENGNKY
          2340      2350      2360      2370      2380      2390   

            2790      2800      2810      2820      2830      2840 
pF1KA1 RLLVGAADAGNLSASVTVSVLVTGEDEYDPVFLAPAFHFQVPEGARRGHSLGHVQATDED
        : : : : :. .::..: : . : ::..:.:    . : .::  .  . .:.:.:.: :
CCDS37 CLTVQAKDKGDATASLVVWVDIEGIDEFEPIFTQDQYFFTLPEKNKDRQLIGRVEASDAD
          2400      2410      2420      2430      2440      2450   

            2850      2860      2870       2880      2890      2900
pF1KA1 GGADGLVLYSLATSSPYFGINQTTGALYLRVDSRA-PGSGTATSGGGGRTRREAPRELRL
       .: ::..::::.::::.:..:.:.: .::    :: :           ... .    :..
CCDS37 AGIDGVILYSLGTSSPFFSVNKTNGNIYL---IRALPLI---------KSQLNKEDTLEM
          2460      2470      2480                  2490      2500 

             2910      2920      2930      2940      2950      2960
pF1KA1 EVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGAVAASLGVVVVLALAALVLGL
       ..::..:   :. :.  : :... .. : .:   .    ...  .. .: : :  ... .
CCDS37 KIIAHSPKSDSKFASCTVFVNVSFSSEG-TPLAVFASSFSISLVVSFLVFLILICILIVM
            2510      2520       2530      2540      2550      2560

             2970      2980      2990         3000      3010       
pF1KA1 VRARSRKAEAAPGPMSQAAPLASDSLQKLGREPP---SPPPSEHLYHQTLPSYGGP---G
       .  ...:        .... : .:   .. :.     .   ..   ....:  . :   .
CCDS37 ILRHKQKDTINNYEEKKTSSLDAD--LRVTRDASVLKAFQKTDDCSNEVVPVDATPEWLS
             2570      2580        2590      2600      2610        

         3020        3030        3040      3050      3060          
pF1KA1 AGGPYPRG--GSLDPSHSSGRGSAEA--AEDDEIRMINEFPRVASVASSLA---ARGPDS
         . . .   .    :.:::. :.:.  ::: ::. ::: :      :.:.   .: :::
CCDS37 LISIMEKDIVNLYRHSNSSGHCSVEGETAEDKEIQRINEHPYRKCSDSALSDHESRVPDS
     2620      2630      2640      2650      2660      2670        

      3070      3080         3090      3100        3110      3120  
pF1KA1 GIQQDADGLSDTSCEPPA---PDTWYKGRKAGLLLPGAG--ATLYREEGPPATATAFLGG
       :: .:.: ::  : :  .    .:   ..  :    : :  .:  ...  : :.    . 
CCDS37 GIPRDSDQLSCLSGETDVMVTAETAEASQTFGEGDQGEGCSTTCAQNNVLPQTVQKREAK
     2680      2690      2700      2710      2720      2730        

           3130      3140      3150      3160      3170      3180  
pF1KA1 CGLSPAPTGDYGFPADGKPCVAGALTAIVAGEEELRGSYNWDYLLSWCPQFQPLASVFTE
        ..      .  : .  .    .::.. ...... . .:.:.::::: :.::::::::..
CCDS37 ESILADVRKESVFISGDQEVRCAALSTQTTSDHDGKDNYHWNYLLSWEPKFQPLASVFND
     2740      2750      2760      2770      2780      2790        

           3190           3200      3210      3220      3230       
pF1KA1 IARLKDEARPCPPAPR-----IDPPPLITAVAHPGAKSVPPKPANTAAARAIFPPASHRS
       ::.::::    :  :.     . :::::::::.:: :.:::.    :.  .  ::   ::
CCDS37 IAKLKDEHLHMPGIPKEKKSFVFPPPLITAVAQPGIKAVPPR--MPAVNLGQVPPKHPRS
     2800      2810      2820      2830      2840        2850      

      3240       3250      3260      3270         3280      3290   
pF1KA1 PIS-HEGSLSSAAMSPSFSPSLSPLAARSPVVSPF---GVAQGPSASALSAESGLEPPDD
       ::  : :::  . :.:.:::::: :. . :..::.   :   :   :.   :  :.  :.
CCDS37 PIPYHLGSLPEG-MTPNFSPSLSLLTMQPPALSPLLREGELLGTHISGTCHE--LKAEDE
       2860       2870      2880      2890      2900        2910   

            
pF1KA1 TELHI
       ...  
CCDS37 VQI  
            

>>CCDS47150.1 DCHS2 gene_id:54798|Hs108|chr4              (1369 aa)
 initn: 1324 init1: 591 opt: 1679  Z-score: 1238.7  bits: 242.9 E(32554): 1.1e-62
Smith-Waterman score: 2794; 39.4% identity (64.2% similar) in 1292 aa overlap (39-1257:61-1338)

       10        20        30        40        50        60        
pF1KA1 PSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTLIGDISAGL
                                     :. .:  .: :..::  :  ::.::: :::
CCDS47 TPHGRSGSSGARTQRSLLWLLVHVWLWAASGSSAQLFNLTLSVDEGLPPDTLVGDIRAGL
               40        50        60        70        80        90

       70         80         90       100       110       120      
pF1KA1 PAGTAAPLM-YFISAQ-EGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRFTAVTPDGAT
       ::.       .:.: . . : .  :. .   .:..:::: ::::.::.: :.:.:  ::.
CCDS47 PAAQQQEGSGFFLSEDSDDSPLLDDFHVHPDTGIIRTARRLDRERRDHYSFVAATLLGAV
              100       110       120       130       140       150

        130       140       150       160       170       180      
pF1KA1 VEVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDADAGRLGTQGYAL----
       :.: .:: :.:::.: ::     :.: : .  :: . :  :.: ::: ..::::.:    
CCDS47 VQVEIRVNDVNDHSPRFPLDSLQLDVSELSPPGTAFRLPVAHDPDAGLFSTQGYTLVQPS
              160       170       180       190       200       210

              190        200                 210       220         
pF1KA1 --SGDGAGETFRLETR-PGPDGTPV-P---------ELVVTGELDRENRSHYMLQLEAYD
           : ::  :.:. : :::  .:. :         .::.  .::::. . . ::.::.:
CCDS47 DLPKDPAGPFFQLRYRTPGPLPSPLLPGSSSPLEPLDLVLLRRLDREEAAAHRLQIEAWD
              220       230       240       250       260       270

     230       240       250       260       270       280         
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
       :: : : .   ... .:: ::. :.:.:..:.:.: :.  ::. : .: :.: : : :: 
CCDS47 GGRPRRTGLLSVELRVLDENDNPPVFEQDEYRAAVREDAQPGAEVCRVRATDRDLGPNGF
              280       290       300       310       320       330

     290       300                 310       320       330         
pF1KA1 VTYEINRRQSEGDGP----------FSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGA
       : : .  ::  : :           :...  .:.... :::: : .  :.:::.::::::
CCDS47 VRYSVRARQVPGAGSGGGALGDAAYFAVEELSGVVRVWRPLDREAQAWHQLVVEARDGGA
              340       350       360       370       380       390

     340       350       360       370       380       390         
pF1KA1 HPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFA
       .::.... :.. : :.:::.:.. :.::.  :  .:::.: ::. :::.:::: : ::. 
CCDS47 EPEVATVRVSIAVLDVNDNRPAIHVLFLTEGGVARVSEGARPGDYVARVSVSDAD-GDWE
              400       410       420       430       440          

     400                       410       420        430       440  
pF1KA1 H----------------VNVSLEGGEGHFALSTQDSV-IYLVCVARRLDREERDAYNLRV
       .                ...::::::: :::       ....::   :::: :: :.: .
CCDS47 KEDEATGELGVGLGDGSISLSLEGGEGDFALLPGGPPGVFFLCVEGPLDRESRDLYELLL
     450       460       470       480       490       500         

            450       460       470       480       490       500  
pF1KA1 TATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQ
       .:::.::::: .: ...:.:.:.::. : :..: :.   . :.: ::. :. :.: : :.
CCDS47 VATDAGSPPLSTEETLLLRVADLNDQPPLFSQQHYKAS-VSEAAAPGTVVMWVSASDADE
     510       520       530       540        550       560        

              510                    520           530       540   
pF1KA1 -GTN-GQVTYSL----AP---GA------HTHW----FSIDPTSGIITTAASLDYELEPQ
        :.. . . :..    ::   :.      ::      :.::  :: :.:  .:: :..  
CCDS47 AGSDHAWLRYTVVQLSAPCNLGSLQSKMVHTAECGPSFAIDSESGAISTIRTLDREVQEA
      570       580       590       600       610       620        

           550       560       570       580       590       600   
pF1KA1 PQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTAT
        .: ::: : : :::...  ::....::::::: : :  :::.. : .  : :::::::.
CCDS47 VELKVVAQDLGEPPLSATCLVSITVDDVNDNEPIFWRQVYNATIAEHAPVGHCFLQVTAS
      630       640       650       660       670       680        

           610       620        630       640       650       660  
pF1KA1 DADSGPFGLLSYSLGAGLGSSGSPP-FRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDG
       ::::: .:.. :::  :. :  .:  :::: :.:..:... .::.. :...:. : : ::
CCDS47 DADSGLYGFIEYSLYDGFLSYEAPQAFRIDPHDGQICVSQDIDRERDPATYDLLVEAKDG
      690       700       710       720       730       740        

            670       680       690       700       710       720  
pF1KA1 GGLKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSY
       :::.....:.: : : ::: : : :  :..::: .. ::: .. . : : :.: .: ..:
CCDS47 GGLSAQAFVRVDLEDVNDNHPVFNPSTYVTSISDETQPGTEIINVLATDQDSGIYGTVAY
      750       760       770       780       790       800        

            730       740       750       760       770       780  
pF1KA1 HILAGNSPPLFTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISIVP
       ... ::   :::.:  .:.. .. ::..  .....: ..:.::::: :  .: : : :  
CCDS47 ELIPGNVSSLFTIDSTTGIIYLTLPLSHLESTTLSLMVSAQDGGGLTAVINADVTIHIFQ
      810       820       830       840       850       860        

            790       800       810       820       830       840  
pF1KA1 GTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHNPPGRLAPVTLSLSGGDPRGLFSLDAV
        : .:  ::. .:.: : :::   . .: :.:..: .   :.   .:.::  : ::.   
CCDS47 TTLAPAEFERPKYTFLVYEDVPEDSPIGTVKAREPLNSSEPIFYRISSGDLGGKFSIHPR
      870       880       890       900       910       920        

            850       860       870       880       890       900  
pF1KA1 SGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVL
        : ..: .:::.:   ::. : :.:  :  :: . ..: . . ::::: :::    : . 
CCDS47 LGTIRTRKPLDHETQ-PVVVLTVQAQLGSAPACSSTEVNITVMDVNDNHPAFLRTSDEIR
      930       940        950       960       970       980       

            910       920       930       940       950       960  
pF1KA1 LPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTGHVRLMRPLGPSGGP
       .  .: ::: .:  :: : ::: :. . ... .   :.:..: . : . :   :: .   
CCDS47 ISQTTPPGTALYLARAEDRDSGRNGLIRYSIASPQPGVFAIDRALGVLFLNGSLGAGEQR
       990      1000      1010      1020      1030      1040       

            970       980       990        1000      1010      1020
pF1KA1 AHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPR--FNSPTYRVDLPSGTTAGTQVL
          : :.:.: :  :... . : ::..    :  .:   :.  .:.:..  . .  ::.:
CCDS47 ELTLTLRAEDQGVHPQAALLVLTVVIEK---REHSPSWTFEHLVYQVEVSESLSPMTQML
      1050      1060      1070         1080      1090      1100    

                  1030      1040      1050      1060      1070     
pF1KA1 QVQAQAPDG-----GPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAV
       :.::. : :     .:. : :     :. ::..: .::...:  .: :. . : ..:.: 
CCDS47 QTQAH-PLGPQRAASPLRYSLEPSVDSAMFGIRPYTGWIYLRRQFDYESTQTYNFRVFAW
          1110      1120      1130      1140      1150      1160   

        1080      1090      1100      1110      1120      1130     
pF1KA1 SGSKAELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSG
           . :  :. ..:: : . ..:..:: . .:  :: : :.  :   .:.. : : :::
CCDS47 IPEDGFL--QNVSTTVIVRVWDENDNSPTFLHDVLFLKVEESPVPQGVIGKITAIDMDSG
          1170        1180      1190      1200      1210      1220 

        1140      1150      1160      1170      1180      1190     
pF1KA1 PNGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTG
        ::.: : :  :: :.: :...:.:::. .  .::::... ... : : : :::::..: 
CCDS47 KNGQLLYFL--LS-DGKFFKMNPNTGELINWVALDREHRGHHEMTVLVTDRGSPPRNATM
            1230         1240      1250      1260      1270        

        1200      1210      1220      1230      1240      1250     
pF1KA1 TVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYT
       .:.:.: :.::: : : :     :  : ..: .  : . ::::. :::::::.:. . :.
CCDS47 AVYVSVTDINDNRPFFPQC--LPGKELHVKVLEGQPVNMLVTTVFAKDPDEGNNAEVTYS
     1280      1290        1300      1310      1320      1330      

        1260      1270      1280      1290      1300      1310     
pF1KA1 LTGPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSA
       ..                                                          
CCDS47 VSSARPMPLKGKTAFGKQSCKKQTNKQTNKILT                           
       1340      1350      1360                                    

>>CCDS3732.3 FAT4 gene_id:79633|Hs108|chr4                (4981 aa)
 initn: 1113 init1: 421 opt: 1467  Z-score: 1075.0  bits: 214.5 E(32554): 1.5e-53
Smith-Waterman score: 4164; 30.4% identity (59.0% similar) in 2993 aa overlap (19-2949:561-3419)

                           10        20        30        40        
pF1KA1             MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLD
                                     :..    :.. :: ..   : ...:  . :
CCDS37 LVTTGSSGGLDRELASQIVLNISARDQGVHPKVSYAQLVVTLLDVNDEKP-VFSQPEGYD
              540       550       560       570       580          

       50          60        70        80        90       100      
pF1KA1 LQIDEEQPAGT--LIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARV
       ... :. :.::  :.   . :   :  . . .  : ::.     .. .:  :: . :   
CCDS37 VSVVENAPTGTELLMLRATDG-DLGDNGTVRF--SLQEAETDRRSFRLDPVSGRLSTISS
     590       600       610        620         630       640      

        110       120             130       140       150       160
pF1KA1 LDREQRDRYRFTAVT------PDGATVEVTVRVADINDHAPAFPQARAALQVPEHTAFGT
       ::::..  : . ...      :... ....: . ::::..:.:  ..   .. :.   :.
CCDS37 LDREEQAFYSLLVLATDLGSPPQSSMARINVSLLDINDNSPVFYPVQYFAHIKENEPGGS
        650       660       670       680       690       700      

              170       180       190       200       210       220
pF1KA1 RYPLEPARDADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSH
             : : : :  ::  :..:   ::.  :...  . .:.   ...    ::::... 
CCDS37 YITTVSATDPDLGTNGTVKYSIS---AGDRSRFQVN-AQSGVISTRMA----LDREEKTA
        710       720          730        740       750            

              230       240       250       260       270       280
pF1KA1 YMLQLEAYDGGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFAS
       :.::. : :::.     ::.. .:.:: .:. :.:.:  :  :: :..: :  : .: ::
CCDS37 YQLQIVATDGGNLQSPNQAIVTITVLDTQDNPPVFSQVAYSFVVFENVALGYHVGSVSAS
      760       770       780       790       800       810        

              290       300         310       320       330        
pF1KA1 DADAGVNGAVTYEINRRQSEGD--GPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGG
         :  .:. ..: :    . ::  : :.:.  :: :     .: :..  ..: : :  : 
CCDS37 TMD--LNSNISYLI----TTGDQKGMFAINQVTGQLTTANVIDREEQSFYQLKVVASGGT
      820         830           840       850       860       870  

      340       350       360       370       380       390        
pF1KA1 AHPELGSAFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDF
       .    :...:.. :.: :::.:     ::.:  : .: :    :. . . .. :::.:  
CCDS37 V---TGDTMVNITVKDLNDNSPH----FLQAIESVNVVENWQAGHSIFQAKAVDPDEGVN
               880       890           900       910       920     

      400        410       420       430       440       450       
pF1KA1 AHVNVSL-EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAA
       . :  :: .. .. ::.. ....: :.     :: .   .:.... :.: : : : . . 
CCDS37 GMVLYSLKQNPKNLFAINEKNGTISLLGP---LDVHA-GSYQIEILASDMGVPQLSSSVI
         930       940       950           960       970       980 

       460       470       480       490       500       510       
pF1KA1 FVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAH
       ....: :::::.:.:: ::     : :    .:   .: : : :.:.::...:..: :  
CCDS37 LTVYVHDVNDNSPVFD-QLSYEVTLSESEPVNSRFFKVQASDKDSGANGEIAYTIAEGNT
             990       1000      1010      1020      1030      1040

       520       530       540       550       560       570       
pF1KA1 THWFSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQ
          :.: : .: .   . :: ::. .  :.:::.: .. ::.....:.: :.:::::.: 
CCDS37 GDAFGIFP-DGQLYIKSELDRELQDRYVLMVVASDRAVEPLSATVNVTVILEDVNDNRPL
              1050      1060      1070      1080      1090         

       580       590       600       610       620       630       
pF1KA1 FQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGD
       :. : :.  . :  . :.   .:.:.: : :: : . ::.        .: :.. : ::.
CCDS37 FNSTNYTFYFEEEQRAGSFVGKVSAVDKDFGPNGEVRYSF-----EMVQPDFELHAISGE
    1100      1110      1120      1130           1140      1150    

       640            650       660          670       680         
pF1KA1 VCTTRTLDRD-----QGPSSFDFTVTAVDGG---GLKSMVYVKVFLSDENDNPPQFYPRE
       . .:. .::.     .: . :.::: :.: :    ::... :.:...: ::: :.:    
CCDS37 ITNTHQFDRESLMRRRGTAVFSFTVIATDQGIPQPLKDQATVHVYMKDINDNAPKFLKDF
         1160      1170      1180      1190      1200      1210    

     690       700       710       720       730       740         
pF1KA1 YAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLA
       : :.:: ..   : :::. : : :.:..: . : :. ::    :..:  :: .:.   : 
CCDS37 YQATISESAANLTQVLRVSASDVDEGNNGLIHYSIIKGNEERQFAIDSTSGQVTLIGKLD
         1220      1230      1240      1250      1260      1270    

     750       760       770       780       790       800         
pF1KA1 RRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSV
        .:. . .: : : :.: .  . .  ..:.:.  . . : : .     .: :..  :  :
CCDS37 YEATPAYSLVIQAVDSGTIPLNSTCTLNIDILDENDNTPSFPKSTLFVDVLENMRIGELV
         1280      1290      1300      1310      1320      1330    

     810        820       830       840       850       860        
pF1KA1 GIVQAHNPP-GRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRA-
       . : : .   :  : .  :..: . .: ::..  .: .   . :: :  . . .:.. : 
CCDS37 SSVTATDSDSGDNADLYYSITGTNNHGTFSISPNTGSIFLAKKLDFETQS-LYKLNITAK
         1340      1350      1360      1370      1380       1390   

       870       880       890       900       910       920       
pF1KA1 GSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNS
        .: ::  ..  : . . : ::: :.::  .    .  :   :: . .. : :::. .:.
CCDS37 DQGRPPRSSTMSVVIHVRDFNDNPPSFPPGDIFKSIVENIPIGTSVISVTAHDPDADING
          1400      1410      1420      1430      1440      1450   

       930         940       950       960       970       980     
pF1KA1 RVTFTLLAGG--GGAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLR
       ....:..     :. ::.: . : .     .    .   :: ..: : . : .: .. :.
CCDS37 QLSYTIIQQMPRGNHFTIDEVKGTIYTNAEIDREFANLFELTVKANDQAVPIETRRYALK
          1460      1470      1480      1490      1500      1510   

            990      1000      1010      1020         1030         
pF1KA1 ---VVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPD---GGPITYHLAAE
          ..: :..    .: : : .  .  ::..  :. .  ..:  ::   .: : :..  .
CCDS37 NVTILVTDLNDN--VPMFISQNALAADPSAVI-GSVLTTIMAADPDEGANGEIEYEII-N
          1520        1530      1540       1550      1560          

    1040      1050      1060      1070      1080      1090         
pF1KA1 GASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILNQN
       : .. : ..  :: : : .::   .: .: : :     : ..:: .   .:....:. :.
CCDS37 GDTDTFIVDRYSGDLRVASAL-VPSQLIYNLIV-----SATDLGPERRKSTTELTIILQG
    1570      1580      1590       1600           1610      1620   

    1100      1110       1120      1130      1140      1150        
pF1KA1 EHSPRLSEDPTFLAV-AENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKA----F
         .: ... : ....  :..: ::.:  . :..   : .. . : . ..  . :.    :
CCDS37 LDGPVFTQ-PKYITILKEGEPIGTNVISIEAAS-PRGSEAPVEYYIVSVRCEEKTVGRLF
          1630       1640      1650       1660      1670      1680 

         1160      1170      1180        1190      1200      1210  
pF1KA1 RIHPQTGEVTTLQTLDREQQSSYQLL--VQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFL
        :  .:: . :   ::::: .   :.    .. . . ::.  . :.... :.::: :.: 
CCDS37 TIGRHTGIIQTAAILDREQGACLYLVDVYAIEKSTAFPRTQRAEVEITLQDINDNPPVF-
            1690      1700      1710      1720      1730      1740 

           1220      1230      1240      1250      1260      1270  
pF1KA1 QASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPGSELFSLHPHSGE
                : . : . .  :. .  : : : ::: :. . ::. . ... : . :.::.
CCDS37 -----PTDMLDLTVEENIGDGSKIMQLTAMDADEGANALVTYTIISGADDSFRIDPESGD
                  1750      1760      1770      1780      1790     

           1280      1290      1300      1310      1320      1330  
pF1KA1 LLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAP
       :...  : : .: .: : . : :.:   .:..... . :           :. .. :   
CCDS37 LIATRRLDRERRSKYSLLVRA-DDGL--QSSDMRINITV----------SDVNDHTPKFS
        1800      1810       1820        1830                1840  

           1340      1350       1360       1370      1380      1390
pF1KA1 VPVVLTVTAAEGLRPGSLLGSV-AAPEPAGV-GALTYTLVGGADPEGTFALDAASGRLYL
        ::  .    :   ::::.... :. . .:: : .:: .:.  : .: : :.  .: . :
CCDS37 RPVY-SFDIPEDTIPGSLVAAILATDDDSGVNGEITY-IVNEDDEDGIFFLNPITGVFNL
            1850      1860      1870       1880      1890      1900

             1400      1410      1420      1430      1440      1450
pF1KA1 ARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQVQVQDENEHAPAFARDPLALALPENPE
       .: ::.:.   .  ::::::  ::.    .::  .. : :.. : :. .  . .: ::  
CCDS37 TRLLDYEV-QQYYILTVRAED-GGGQFTTIRVYFNILDVNDNPPIFSLNSYSTSLMENLP
              1910      1920       1930      1940      1950        

             1460      1470      1480      1490      1500      1510
pF1KA1 PGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALL
        :... .: ..:::  : ::.. : .   .  .  . .: ..:.:.. ..::::.     
CCDS37 VGSTVLVFNVTDADD-GINSQLTYSIASGDS-LGQFTVD-KNGVLKVLKALDRESQSFYN
     1960      1970       1980       1990       2000      2010     

             1520      1530      1540      1550      1560      1570
pF1KA1 LLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPEDQPPGPAALHVVAR
       :.:.. : :   . : .. ... ... : ::: :.: ::. . .::. :   ..... : 
CCDS37 LVVQVHDLPQIPASRFTSTAQVSIILLDVNDNPPTFLSPKLTYIPENTPIDTVVFKAQAT
        2020      2030      2040      2050      2060      2070     

             1580      1590      1600      1610      1620      1630
pF1KA1 DPDLGEAARVSYRLASGGDGHFRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRS
       ::: :  . . : : .   ..: . .  : . ..  ::::. ....:::::.:.:.:  :
CCDS37 DPDSGPNSYIEYTLLNPLGNKFSIGTIDGEVRLTGELDREEVSNYTLTVVATDKGQPSLS
        2080      2090      2100      2110      2120      2130     

             1640      1650      1660      1670      1680          
pF1KA1 ATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTLRATDPDVGANGQVTYG---
       ..  ..: : :.::. : : :  :.: . ::.  ::... . :.: : :.:::: ::   
CCDS37 SSTEVVVMVLDINDNNPIFAQALYKVEINENTLTGTDIIQVFAADGDEGTNGQVRYGIVN
        2140      2150      2160      2170      2180      2190     

      1690      1700      1710      1720      1730      1740       
pF1KA1 GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVEDENDH
       : ... : .:  ::..:. . ::::.    .::: : :::: :.    :: ... : :: 
CCDS37 GNTNQEFRIDSVTGAITVAKPLDREKTPTYHLTVQATDRGSTPRTDTSTVSIVLLDINDF
        2200      2210      2220      2230      2240      2250     

      1750      1760        1770      1780      1790      1800     
pF1KA1 APTFGSAHLSLEVPE--GQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASG
       .:.:  .  :..:::  :  :.:. .. : : : :.:..:.: .. :. ..::.:. :::
CCDS37 VPVFELSPYSVNVPENLGTLPRTILQVVARDDDRGSNSKLSYVLFGGNEDNAFTLS-ASG
        2260      2270      2280      2290      2300      2310     

        1810      1820      1830      1840      1850      1860     
pF1KA1 EFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVP
       :.:. . ::::..  : : : : :.:.:::..:  ..: : :.::..:.:   :: . .:
CCDS37 ELGVTQSLDRETKERFVLMITATDSGSPALTGTGTINVIVDDVNDNVPTFASKAYFTTIP
         2320      2330      2340      2350      2360      2370    

        1870      1880      1890      1900      1910      1920     
pF1KA1 EDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLLEPSSGELRTAAALDREQCPSY
       ::.:.:: .: ..: : ::. :. :   .:...   : ..::.:.. :.: ::::   .:
CCDS37 EDAPTGTDVLLVNASDADASKNA-VIRIIGGNSQ--FTINPSTGQIITSALLDRETKDNY
         2380      2390       2400        2410      2420      2430 

        1930      1940      1950      1960      1970      1980     
pF1KA1 TFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALAT
       :. :   :...  :::...:: .:: ::::. : :   :   ..: :    . :   . .
CCDS37 TLVVVCSDAGSPEPLSSSTSVLVTVTDVNDNPPRFQHHPYVTHIPSP----TLPGSFVFA
            2440      2450      2460      2470          2480       

        1990      2000      2010      2020      2030      2040     
pF1KA1 LRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVATDLGR
       . . : : : :. . : :.:       .:   : : .: .:.  :  . .. . . : : 
CCDS37 VTVTDADIGPNSELHYSLSGRNSEKFHIDPLRGAI-MAAGPLN-GASEVTFSVHVKDGGS
      2490      2500      2510      2520        2530      2540     

        2050      2060        2070      2080      2090      2100   
pF1KA1 PARSATGVIIVGLQGEAERGPRFP--RASSEATIRENAPPGTPIVSPRAVHAGGTNG-PI
         .. . .. : . ..:.    ::  ::. .. .  .  : . .:.  .. ...  : :.
CCDS37 FPKTDSTTVTVRFVNKAD----FPKVRAKEQTFMFPENQPVSSLVT--TITGSSLRGEPM
        2550      2560          2570      2580        2590         

           2110      2120      2130      2140      2150            
pF1KA1 TYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRLVLQAESGGAFAFTV---LTL
       .: : :::  .::.:.  :: ...  .. ::::   .  . ..:..::   :.    : .
CCDS37 SYYIASGNLGNTFQIDQLTGQVSI--SQPLDFEKIQKYVVWIEARDGGFPPFSSYEKLDI
    2600      2610      2620        2630      2640      2650       

    2160      2170      2180       2190      2200      2210        
pF1KA1 TLQDANDNAPRFLRPHYVAFLPES-RPLEGPLLQVEADDLDQGSGGQISYSLAASQPARG
       :. :.::::: : .  ... . :.  : .  .: : : : :.: .::..: .. ..  ..
CCDS37 TVLDVNDNAPIFKEDPFISEILENLSPRK--ILTVSAMDKDSGPNGQLDYEIVNGN-MEN
      2660      2670      2680        2690      2700      2710     

     2220      2230      2240      2250      2260      2270        
pF1KA1 LFHVDPTTGTITTTAILDREIWAETRLVLMATDRGSPALVGSATLTVMVIDTNDNRPTIP
        : .. .:: : ..  ::::  ..  :.. ..:.:::.   :. . . ..: ::: : . 
CCDS37 SFSINHATGEIRSVRPLDREKVSHYVLTIKSSDKGSPSQSTSVKVMINILDENDNAPRFS
         2720      2730      2740      2750      2760      2770    

     2280      2290      2300      2310      2320      2330        
pF1KA1 QPWELRVSEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLD
       : .  .: :.. ::  ...:: .: : :       :    . ::...   : . .. ::.
CCDS37 QIFSAHVPENSPLGYTVTRVTTSDEDIGINAISRYSIMDASLPFTINPSTGDIVISRPLN
         2780      2790      2800      2810      2820      2830    

     2340      2350      2360      2370      2380      2390        
pF1KA1 FEQCDRYQLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSV
        :. :::.... :::.     ...:..: :.::::: ::.. : .   : :  :: . .:
CCDS37 REDTDRYRIRVSAHDSGWTVSTDVTIFVTDINDNAPRFSRTSYYLDCPELTEIGSKVTQV
         2840      2850      2860      2870      2880      2890    

     2400      2410      2420      2430      2440      2450        
pF1KA1 SATDRDSGANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDV-----VLE
        ::: : :.::.. : . : .. : .. ..: .:.       .  : . :..     .. 
CCDS37 FATDPDEGSNGQVFYFIKSQSEYFRINATTGEIFNKQILKYQNVTGFSNVNINRHSFIVT
         2900      2910      2920      2930      2940      2950    

          2460      2470      2480      2490      2500      2510   
pF1KA1 ARDHGAPGRAARATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSR
       . :.: :.  ...:: ... :.::.::.:  :.: . ::...  :. :. . : :     
CCDS37 SSDRGKPSLISETTVTINIVDSNDNAPQFLKSKYFTPVTKNVKVGTKLIRVTAIDDKDFG
         2960      2970      2980      2990      3000      3010    

          2520      2530      2540      2550      2560      2570   
pF1KA1 SHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVA
        .. :.: : . :    :.:.   .  . ...          :.  :.     .. .::.
CCDS37 LNSEVEYFISNDNHLGKFKLDNDTGWISVASS----------LISDLN----QNFFITVT
         3020      3030      3040                3050          3060

          2580      2590      2600      2610      2620      2630   
pF1KA1 AADRGQPPQSSVVPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGP
       : :.:.:: :: . : .:: . : . : :... . .:.::.  .:. .  : : : : . 
CCDS37 AKDKGNPPLSSQATVHITVTEENYHTPEFSQSHMSATIPESHSIGSIVRTVSARDRDAAM
             3070      3080      3090      3100      3110      3120

          2640      2650      2660      2670      2680       2690  
pF1KA1 HGLVRFTVSSGDPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAG-AHFALAPV
       .::.....:::.  :.: .. :.: : ::.::: :   .:.....: : .  :. .   :
CCDS37 NGLIKYSISSGNEEGIFAINSSTGILTLAKALDYELCQKHEMTISAIDGGWVARTGYCSV
             3130      3140      3150      3160      3170      3180

           2700      2710      2720      2730      2740      2750  
pF1KA1 TIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGP
       :..: ::::..:.:  .    .: :: : :: :  :.: :.:.:. . . :..  .    
CCDS37 TVNVIDVNDNSPVFLSDDYFPTVLENAPSGTTVIHLNATDADSGTNAVIAYTVQSS----
             3190      3200      3210      3220      3230          

           2760      2770      2780      2790        2800      2810
pF1KA1 EGREAFALNSSTGELRARVPFDYEHTESFRLLVGAADAGNLS--ASVTVSVLVTGEDEYD
          . :... .:: . ..  .:.:  .:..: : : .. .    . .::.. . : .:: 
CCDS37 -DSDLFVIDPNTGVITTQGFLDFETKQSYHLTVKAFNVPDEERCSFATVNIQLKGTNEYV
        3240      3250      3260      3270      3280      3290     

             2820      2830      2840      2850        2860        
pF1KA1 PVFLAPAFHFQVPEGARRGHSLGHVQATDEDGGADGLVLYSLATSS--PYFGINQTTGAL
       : :..  ..:.. :.: .:  .:.: :.:.: :.:: : : .  .:    : ::. :: .
CCDS37 PRFVSKLYYFEISEAAPKGTIVGEVFASDRDLGTDGEVHYLIFGNSRKKGFQINKKTGQI
        3300      3310      3320      3330      3340      3350     

     2870      2880      2890      2900        2910      2920      
pF1KA1 YLRVDSRAPGSGTATSGGGGRTRREAPRELRLEVIAR--GPLPGSRSATVPVTVDITHTA
       :.                .:   ::  ... :.:.:.  : . :.    : :.: .  . 
CCDS37 YV----------------SGILDREKEERVSLKVLAKNFGSIRGADIDEVTVNVTVLDAN
                        3360      3370      3380      3390         

       2930      2940      2950      2960      2970      2980      
pF1KA1 LGLAPDLNLLLVGAVAASLGVVVVLALAALVLGLVRARSRKAEAAPGPMSQAAPLASDSL
           : .  : . .:  : :: .                                     
CCDS37 ---DPPIFTLNIYSVQISEGVPIGTHVTFVSAFDSDSIPSWSRFSYFIGSGNENGAFSIN
       3400      3410      3420      3430      3440      3450      

>--
 initn: 371 init1: 247 opt: 601  Z-score: 437.9  bits: 96.6 E(32554): 4.5e-18
Smith-Waterman score: 968; 36.7% identity (62.8% similar) in 572 aa overlap (12-555:5-559)

               10        20            30         40          50   
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLL----LLLLLLLGAGVPG-AW--GQAGSLDLQIDE
                  :   . :: : :  :    :: .. : . .:: ::  :      .:. :
CCDS37        MDLAPDRATGRPWLPLHTLSVSQLLRVFWLLSLLPGQAWVHGAEPRQVFQVLE
                      10        20        30        40        50   

            60        70        80        90       100       110   
pF1KA1 EQPAGTLIGDISAGLPAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRD
       ::: :::.: :.      :   . : .:  :. ..   .::.  .:.. :. ..:::.  
CCDS37 EQPPGTLVGTIQ------TRPGFTYRLS--ESHAL---FAINSSTGALYTTSTIDRESLP
            60              70          80           90       100  

           120          130       140       150       160       170
pF1KA1 RYRFTAVTPDGATV---EVTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDA
          .. :. ..: .   :: : : :.::.::.::.   ..   : .. : .  :. : :.
CCDS37 SDVINLVVLSSAPTYPTEVRVLVRDLNDNAPVFPDPSIVVTFKEDSSSGRQVILDTATDS
            110       120       130       140       150       160  

              180          190       200        210       220      
pF1KA1 DAGRLGTQGYA---LSGDGAGETFRLETRPGPDGTPVP-ELVVTGELDRENRSHYMLQLE
       : :  :..  .   . :. ::. :::.   .:.:  .  .::  : ::::   .:.: .:
CCDS37 DIGSNGVDHRSYRIIRGNEAGR-FRLDITLNPSGEGAFLHLVSKGGLDREVTPQYQLLVE
            170       180        190       200       210       220 

        230       240       250       260       270       280      
pF1KA1 AYDGGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGV
       . : : : ::.   ..::. ::::. :.:..:.:.: : :. . :: :::: :.::: :.
CCDS37 VEDKGEPKRRGYLQVNVTVQDINDNPPVFGSSHYQAGVPEDAVVGSSVLQVAAADADEGT
             230       240       250       260       270       280 

        290       300       310       320       330       340      
pF1KA1 NGAVTYEINRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSA
       :. . :   : :.::  ::..: .:::. ...::::: :: . :.::: : :.    : :
CCDS37 NADIRY---RLQDEGT-PFQMDPETGLITVREPLDFEARRQYSLTVQAMDRGVPSLTGRA
                290        300       310       320       330       

        350       360       370        380       390        400    
pF1KA1 FVTVHVRDANDNQPSMTVIFLSADGS-PQVSEAAPPGQLVARISVSDPDD-GDFAHVNVS
        . ... :.:::.: .   .. : .   .:.: :  : .:: ..:.: :. .  ....:.
CCDS37 EALIQLLDVNDNDPVVKFRYFPATSRYASVDENAQVGTVVALLTVTDADSPAANGNISVQ
       340       350       360       370       380       390       

            410        420       430       440        450          
pF1KA1 LEGG--EGHFAL-STQDSVIYLVCVARRLDREERDAYNLRVTATDS-GSPP---LRAE--
       . ::  . :: . :..   . :. ::  ::::.  .::: :...:. :.::   ..:.  
CCDS37 ILGGNEQRHFEVQSSKVPNLSLIKVASALDRERIPSYNLTVSVSDNYGAPPGAAVQARSS
       400       410       420       430       440       450       

          460       470       480       490       500       510    
pF1KA1 -AAFVLHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAP
        :..:. :.:.::. :.:..:.:: . : : : :::.:  ..: : :.: :... ::.. 
CCDS37 VASLVIFVNDINDHPPVFSQQVYRVN-LSEEAPPGSYVSGISATDGDSGLNANLRYSIVS
       460       470       480        490       500       510      

          520       530         540       550       560       570  
pF1KA1 GAHTHWFSIDPTSGIITTAAS--LDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVN
       :    :: :.  ::..::..:  :: ::  :  : . : : :.                 
CCDS37 GNGLGWFHISEHSGLVTTGSSGGLDRELASQIVLNISARDQGVHPKVSYAQLVVTLLDVN
        520       530       540       550       560       570      

            580       590       600       610       620       630  
pF1KA1 DNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRID
                                                                   
CCDS37 DEKPVFSQPEGYDVSVVENAPTGTELLMLRATDGDLGDNGTVRFSLQEAETDRRSFRLDP
        580       590       600       610       620       630      

>>CCDS4317.1 FAT2 gene_id:2196|Hs108|chr5                 (4349 aa)
 initn: 628 init1: 331 opt: 1289  Z-score: 944.8  bits: 190.2 E(32554): 2.6e-46
Smith-Waterman score: 2669; 28.9% identity (55.7% similar) in 2540 aa overlap (396-2870:76-2438)

         370       380       390       400       410          420  
pF1KA1 FLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFA---LSTQDSVIY
                                     :: :.:  . :   :.:    . :..:   
CCDS43 SSPKTYVESFEKMGIYLAEPQWAVRYRIISGDVANVFKTEEYVVGNFCFLRIRTKSSNTA
          50        60        70        80        90       100     

            430       440       450       460       470       480  
pF1KA1 LVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYRPEPL
       :      :.:: ::.:.: . ::.. .  :.: .  :.:. : ::  : :.   ::    
CCDS43 L------LNREVRDSYTLIIQATEK-TLELEALTRVVVHILDQNDLKPLFSPPSYRVTIS
               110       120        130       140       150        

            490       500       510       520       530       540  
pF1KA1 PEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTHWFSIDPTSGIITTAASLDYELEP
        .. :  : . .::: : : : :..  :..  ..... :.: ::::..:.:..:.   . 
CCDS43 EDMPLK-SPICKVTATDADLGQNAEFYYAF--NTRSEMFAIHPTSGVVTVAGKLNVTWRG
      160        170       180         190       200       210     

            550       560       570       580          590         
pF1KA1 QPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASL---PEGTQPGTCFLQ
       . .: :.:.:       ...  :.:   :.  :: ...    ::.   :  .. :: .  
CCDS43 KHELQVLAVDRMRKISEGNGFGSLAALVVH-VEPALRKPPAIASVVVTPPDSNDGTTYAT
         220       230       240        250       260       270    

     600       610       620       630         640       650       
pF1KA1 VTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGD--VCTTRTLDRDQGPSSFDFTV
       : . ::.:.   . :  . .:  ..    ..  :.:..  . ... ..  .   .:....
CCDS43 VLV-DANSSGAEVESVEVVGGDPGKHFKAIKSYARSNEFSLVSVKDINWMEYLHGFNLSL
           280       290       300       310       320       330   

       660       670        680       690       700       710      
pF1KA1 TAVDGGGLKSMVYVKVF-LSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGS
        : .:.:   .  .. : :   . .  .:    : ...:  ::::. :. .:.  :   .
CCDS43 QARSGSGPYFYSQIRGFHLPPSKLSSLKFEKAVYRVQLSEFSPPGSRVVMVRV-TP---A
           340       350       360       370       380             

        720       730        740       750       760       770     
pF1KA1 HGRLSYHILAGNSPPL-FTLDEQSGLLTVAWPLARRANSVVQLEIGAEDGGGLQAEPSAR
          :.: .:  .:  . : :. ..::.:..  .  .  .  ::.: .  :   ::  :. 
CCDS43 FPNLQY-VLKPSSENVGFKLNARTGLITTTKLMDFHDRAHYQLHIRTSPG---QA--STV
     390        400       410       420       430          440     

         780       790       800       810        820       830    
pF1KA1 VDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHN-PPGRLAPVTLSLSGGDPR
       : :.::  .   :.:.. .:  .. :.. :::::  : : .   :. . :: :..:  :.
CCDS43 VVIDIVDCNNHAPLFNRSSYDGTLDENIPPGTSVLAVTATDRDHGENGYVTYSIAG--PK
           450       460       470       480       490         500 

           840       850       860       870       880         890 
pF1KA1 GL-FSLDAVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLD--DVNDNS
       .: ::.:   :...: .:.: ::.  .  ..:::..   :     .: ..:.  ..:::.
CCDS43 ALPFSIDPYLGIISTSKPMDYELMKRIYTFRVRASDWGSPFRREKEVSIFLQLRNLNDNQ
             510       520       530       540       550       560 

             900       910       920       930       940        950
pF1KA1 PAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGA-FTVDPTTGHV
       : :   . :  .  .   :  :.:. :.: :   : .  . ...:.    : ..  .: .
CCDS43 PMFEEVNCTGSIRQDWPVGKSIMTMSAIDVDELQNLK--YEIVSGNELEYFDLNHFSGVI
             570       580       590         600       610         

                960        970       980       990      1000       
pF1KA1 RLMRPLG--PSGGP-AHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRV
        : ::.    .: : .. :.. : :: .    . . . .::.:       :.:. :.   
CCDS43 SLKRPFINLTAGQPTSYSLKITASDGKNYASPTTLNI-TVVKD-------PHFEVPV---
     620       630       640       650        660                  

      1010      1020      1030      1040      1050      1060       
pF1KA1 DLPSGTTAGTQVLQVQAQAPDGGPITYHLAAEGASSPFGLEPQSGWLWVRAALDREAQEL
            :   : ::   ...        :.        .::. : .               
CCDS43 -----TCDKTGVLTQFTKT------ILHF--------IGLQNQES---------------
           670       680                     690                   

      1070      1080      1090      1100        1110      1120     
pF1KA1 YILKVMAVSGSKAELGQQTGTATVRVSILNQNEHSPRLSED--PTFLAVAENQPPGTSVG
                 :  :.   :. .: ..     :...:.. ::  :  . : :. : .: ..
CCDS43 ----------SDEEF---TSLSTYQI-----NHYTPQF-EDHFPQSIDVLESVPINTPLA
                       700            710        720       730     

        1130      1140      1150      1160      1170      1180     
pF1KA1 RVFATDRDSGPNGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQD
       :. ::: :.: ::.:.: . . .:..  : :. .:: .:.   :: :  . : : : : :
CCDS43 RLAATDPDAGFNGKLVYVIADGNEEG-CFDIELETGLLTVAAPLDYEATNFYILNVTVYD
         740       750       760        770       780       790    

        1190      1200      1210      1220      1230      1240     
pF1KA1 GGSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPD
        :.: .:.   . : : : :::.: :        ::  . . . .  :: .. : .:: :
CCDS43 LGTPQKSSWKLLTVNVKDWNDNAPRF------PPGGYQLTISEDTEVGTTIAELTTKDAD
          800       810       820             830       840        

        1250      1260      1270      1280      1290      1300     
pF1KA1 EGENGTILYTLTGPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSASL
         .:: . ::: .: .: ::::: .:::.... : :  .:.:.: . :.::  : .. .:
CCDS43 SEDNGRVRYTLLSP-TEKFSLHPLTGELVVTGHLDRESEPRYILKVEARDQ--PSKGHQL
      850       860        870       880       890         900     

        1310       1320      1330      1340      1350        1360  
pF1KA1 QLLVQVLPSAR-LAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEP--AGV
         ..... . . . .  :.   .     ::        : : ::..:  . : .:  . .
CCDS43 FSVTDLIITLEDVNDNSPQCITEHNRLKVP--------EDLPPGTVLTFLDASDPDLGPA
         910       920       930               940       950       

           1370      1380      1390        1400      1410          
pF1KA1 GALTYTLVGGADPEGTFALDAASGRLYLARPLDFE--AGPPWRALTVRAEGPGGAGAR--
       : . :.:. ::  .::: .:  .: : : : ::::  ::     :.. :   :   ::  
CCDS43 GEVRYVLMDGA--HGTFRVDLMTGALILERELDFERRAG---YNLSLWASDGGRPLARRT
       960         970       980       990         1000      1010  

     1420      1430        1440      1450      1460      1470      
pF1KA1 LLRVQVQVQDENE--HAPAFARDPLALALPENPEPGAALYTFRASDADGPGPNSDVRYRL
       : .:.: : : ::  : : ::       . ::   :. . .  :.: :  : .....: .
CCDS43 LCHVEVIVLDVNENLHPPHFASFVHQGQVQENSPSGTQVIVVAAQD-DDSGLDGELQY-F
           1020      1030      1040      1050       1060       1070

       1480      1490      1500      1510      1520      1530      
pF1KA1 LRQEPPVPALRLDARTGALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVSARVFV
       ::    . :. ..  :: ...   :::: .    : : :.::   .:   .. . . . :
CCDS43 LRAGTGLAAFSINQDTGMIQTLAPLDREFASYYWLTVLAVDR---GSVPLSSVTEVYIEV
             1080      1090      1100      1110         1120       

       1540          1550      1560      1570      1580       1590 
pF1KA1 TDENDNAPVFAS----PSRVRLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGD-GH
       :: ::: : ...    ::   . :: : : ..:.. : ::: .  ..... ..::.  : 
CCDS43 TDANDNPPQMSQAVFYPS---IQEDAPVGTSVLQLDAWDPDSSSKGKLTFNITSGNYMGF
      1130      1140         1150      1160      1170      1180    

            1600      1610      1620      1630      1640      1650 
pF1KA1 FRLHSSTGALSVVRPLDREQRAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQQ
       : .:  :: ::... ::::.. ::.: :.. :.: :  ..:. ..:.. ::::. : :..
CCDS43 FMIHPVTGLLSTAQQLDRENKDEHILEVTVLDNGEPSLKSTSRVVVGILDVNDNPPIFSH
         1190      1200      1210      1220      1230      1240    

            1660         1670      1680      1690        1700      
pF1KA1 QEYSVLLREN-NP--PGTSLLTLRATDPDVGANGQVTYGGVSS--ESFSLDPDTGVLTTL
       . ..: : :  .:  ::  .  : :.: : : ::.:::.  .:  :.::.:  :::... 
CCDS43 KLFNVRLPERLSPVSPGP-VYRLVASDLDEGLNGRVTYSIEDSDEEAFSIDLVTGVVSSS
         1250      1260       1270      1280      1290      1300   

       1710      1720      1730      1740           1750      1760 
pF1KA1 RALDREEQEEINLTVYAQDRGSPPQLTHVTVRVAVE----DENDHAP-TFGSAHLSLEVP
        ..   : .   ::. : : :.::    ..::. .:     . .  : .:  .. :. : 
CCDS43 STFTAGEYN--ILTIKATDSGQPP--LSASVRLHIEWIPWPRPSSIPLAFDETYYSFTVM
          1310        1320        1330      1340      1350         

            1770      1780      1790      1800      1810      1820 
pF1KA1 EGQDPQTLTMLRASDPDVGANGQLQYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAF
       :  ::  .. . .     :  : . . :  :: .  : .. ..: .   :::: . .  .
CCDS43 E-TDP--VNHMVGVISVEGRPGLFWFNISGGDKDMDFDIEKTTGSIVIARPLDTRRRSNY
    1360         1370      1380      1390      1400      1410      

            1830      1840      1850      1860      1870      1880 
pF1KA1 QLRIEARDGGQPALSATLLLTVTVLDANDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHD
       .: .:. ::..    :: .    . . : : : :    : :.::.:.  :. ::..:: :
CCDS43 NLTVEVTDGSRTI--ATQVHIFMIANINHHRPQFLETRYEVRVPQDTVPGVELLRVQAID
       1420        1430      1440      1450      1460      1470    

            1890        1900      1910      1920       1930        
pF1KA1 PDAGANGHVTYY--LGAGTAGAFLLEPSSGELRTAAALDREQCPS-YTFSVSAVDGAAAG
        : : .   : .     :.:. : :.:::: : :.. ::  . :: .:..: . :     
CCDS43 QDKGKSLIYTIHGSQDPGSASLFQLDPSSGVLVTVGKLDLGSGPSQHTLTVMVRDQEI--
         1480      1490      1500      1510      1520      1530    

     1940       1950      1960      1970      1980      1990       
pF1KA1 PLSTT-VSVTITVRDVNDHAPTFPTSPLRLRLPRPGPSFSTPTLALATLRAEDRDAGANA
       :.. . : ::: :.: : : : :     .:.     :.  .:   :  .:: : : :.::
CCDS43 PIKRNFVWVTIHVEDGNLHPPRF----TQLHYEASVPDTIAPGTELLQVRAMDADRGVNA
           1540      1550          1560      1570      1580        

      2000       2010      2020      2030      2040      2050      
pF1KA1 SILYRL-AGTPPPGTTVDSYTGEIRVARSPVALGPRDRVLFIVATDLGRPARSATGVIIV
        . : :  :.     ....  : : .:..    .   ..: . : : : :     ...:.
CCDS43 EVHYSLLKGNSEGFFNINALLGIITLAQKLDQANHAPHTLTVKAEDQGSPQWHDLATVII
     1590      1600      1610      1620      1630      1640        

       2060      2070      2080      2090      2100      2110      
pF1KA1 GLQGEAERGPRFPRASSEATIRENAPPGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFS
        .    . .: : ..   . : :. : :.::.   :.    . . .:: .  ::. :.::
CCDS43 HVYPSDRSAPIFSKSEYFVEIPESIPVGSPILLVSAM----SPSEVTYELREGNKDGVFS
     1650      1660      1670      1680          1690      1700    

       2120      2130      2140       2150      2160      2170     
pF1KA1 IQPSTGAITVRSAEGLDFEVSPRLRLVLQAES-GGAFAFTVLTLTLQDANDNAPRFLRPH
       ..  .: :...  . :: :     .: ... . .:::. ..... . : ::::: ::.  
CCDS43 MNSYSGLISTQ--KKLDHEKISSYQLKIRGSNMAGAFTDVMVVVDIIDENDNAPMFLKST
         1710        1720      1730      1740      1750      1760  

        2180      2190             2200      2210      2220        
pF1KA1 YVAFLPESRPLEGPLLQ-------VEADDLDQGSGGQISYSLAASQPARGLFHVDPTTGT
       .:. . :. :: . ...       ..:.: :. ... . :..   . :  .:..::. ::
CCDS43 FVGQISEAAPLYSMIMDKNNNPFVIHASDSDKEANSLLVYKILEPE-ALKFFKIDPSMGT
           1770      1780      1790      1800       1810      1820 

     2230      2240      2250      2260        2270       2280     
pF1KA1 ITTTAILDREIWAETRLVLMATDRGSPALVGS--ATLTVMVIDTNDNRPTIP-QPWELRV
       .: .. .: :     .. ... :.:::.: .   : . . : :.::. : .  : .:. .
CCDS43 LTIVSEMDYESMPSFQFCVYVHDQGSPVLFAPRPAQVIIHVRDVNDSPPRFSEQIYEVAI
            1830      1840      1850      1860      1870      1880 

        2290      2300      2310      2320      2330      2340     
pF1KA1 SEDALLGSEIAQVTGNDVDSGPVLWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFEQCDRY
             : :. .: ..: ::   . : .. .. ..  ..    : .:. .:  :   .: 
CCDS43 VGPIHPGMELLMVRASDEDSE--VNYSIKTGNADEAVTIHPVTGSISVLNPA-FLGLSR-
            1890      1900        1910      1920      1930         

        2350      2360      2370      2380      2390      2400     
pF1KA1 QLQLLAHDGPHEGRANLTVLVEDVNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDS
       .: . : :: ..  : . . . .: :..  :.:..: . . :.    .:.. ..:  . .
CCDS43 KLTIRASDGLYQDTALVKISLTQVLDKSLQFDQDVYWAAVKENLQDRKALVILGA--QGN
      1940      1950      1960      1970      1980      1990       

        2410      2420      2430      2440      2450      2460     
pF1KA1 GANGHISYHLASPADGFSVDPNNGTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAAR
         :  .:: : . .: : .  . :.: :    ::. .. . . ....:.::. .: :.:.
CCDS43 HLNDTLSYFLLNGTDMFHMVQSAGVLQT--RGVAFDREQQDTHELAVEVRDNRTPQRVAQ
        2000      2010      2020        2030      2040      2050   

        2470      2480      2490      2500      2510      2520     
pF1KA1 ATVHVQLQDQNDHAPSFTLSHYRVAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISG
       . :.:...: ::. :.:    : . . .   ::..:. . ::: : . ...:: : .   
CCDS43 GLVRVSIEDVNDNPPKFKHLPYYTIIQDGTEPGDVLFQVSATDEDLG-TNGAVTYEFAED
          2060      2070      2080      2090      2100       2110  

        2530      2540      2550      2560      2570      2580     
pF1KA1 NWGRVFQLEPRLAEAGESAGPGPRALGCLVLLEPLDFESLTQYNLTVAAADRGQPPQSSV
            :...: :              : . : .:.:...:..:.: : : : : :  .: 
CCDS43 Y--TYFRIDPYL--------------GDISLKKPFDYQALNKYHLKVIARDGGTPSLQSE
             2120                    2130      2140      2150      

        2590      2600      2610      2620      2630       2640    
pF1KA1 VPVTVTVLDVNDNPPVFTRASYRVTVPEDTPVGAELLHVEASDADPGPHGL-VRFTVSSG
         : :::   : . :.:    :.: :::.  . . .::..: .    :.:: . ...   
CCDS43 EEVLVTVR--NKSNPLFQSPYYKVRVPENITLYTPILHTQARS----PEGLRLIYNIVEE
       2160        2170      2180      2190          2200      2210

         2650      2660      2670      2680      2690      2700    
pF1KA1 DPSGLFELDESSGTLRLAHALDCETQARHQLVVQAADPAGAHFALAPVTIEVQDVNDHGP
       .:  ::  : ..:.: ..  :: :....: ..:.:.: : . :. : : . :.::::. :
CCDS43 EPLMLFTTDFKTGVLTVTGPLDYESKTKHVFTVRATDTALGSFSEATVEVLVEDVNDNPP
             2220      2230      2240      2250      2260      2270

         2710      2720      2730      2740      2750      2760    
pF1KA1 AFPLNLLSTSVAENQPPGTLVTTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSST
       .:   . .::..:. :  : :  : : : :.:    . :...:   : .  . : .:.::
CCDS43 TFSQLVYTTSISEGLPAQTPVIQLLASDQDSGRNRDVSYQIVE--DGSDVSKFFQINGST
             2280      2290      2300      2310        2320        

         2770      2780      2790        2800      2810      2820  
pF1KA1 GELRARVPFDYEHTESFRLLVGAADAGN--LSASVTVSVLVTGEDEYDPVFLAPAFHFQV
       ::. .   .:::  . :.. : : : :.  :.. . : : :.  ..  : :  : .. .:
CCDS43 GEMSTVQELDYEAQQHFHVKVRAMDKGDPPLTGETLVVVNVSDINDNPPEFRQPQYEANV
     2330      2340      2350      2360      2370      2380        

           2830      2840      2850        2860      2870      2880
pF1KA1 PEGARRGHSLGHVQATDEDGGADGLVLYSLATSSP--YFGINQTTGALYLRVDSRAPGSG
        : :  :: . .::: : :.   . . : . ...   .: ::...: . .          
CCDS43 SELATCGHLVLKVQAIDPDSRDTSRLEYLILSGNQDRHFFINSSSGIISMFNLCKKHLDS
     2390      2400      2410      2420      2430      2440        

             2890      2900      2910      2920      2930      2940
pF1KA1 TATSGGGGRTRREAPRELRLEVIARGPLPGSRSATVPVTVDITHTALGLAPDLNLLLVGA
                                                                   
CCDS43 SYNLRVGASDGVFRATVPVYINTTNANKYSPEFQQHLYEAELAENAMVGTKVIDLLAIDK
     2450      2460      2470      2480      2490      2500        

>--
 initn: 687 init1: 266 opt: 648  Z-score: 473.3  bits: 102.9 E(32554): 4.8e-20
Smith-Waterman score: 1523; 32.0% identity (57.1% similar) in 1200 aa overlap (219-1394:2448-3593)

      190       200       210       220       230       240        
pF1KA1 ETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDGGSPPRRAQALLDVTLLDI
                                     : : :.. : ::     :: . . ..  . 
CCDS43 ILSGNQDRHFFINSSSGIISMFNLCKKHLDSSYNLRVGASDG---VFRATVPVYINTTNA
      2420      2430      2440      2450         2460      2470    

      250       260       270       280       290        300       
pF1KA1 NDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAVTYEI-NRRQSEGDGPFSI
       : ..: :.:  :.: ..:.   :. :....: : :.:  :.. : : :.  ::    :::
CCDS43 NKYSPEFQQHLYEAELAENAMVGTKVIDLLAIDKDSGPYGTIDYTIINKLASE---KFSI
         2480      2490      2500      2510      2520         2530 

       310       320         330       340       350         360   
pF1KA1 DAHTGLLQLERPLDFEQ--RRVHELVVQARDGGAHPELGSAFVTVHV--RDANDNQPSMT
       . .  .  :.. :: :.  .::  . :.:::::..     :: ::..   : ::: :.. 
CCDS43 NPNGQIATLQK-LDRENSTERVIAIKVMARDGGGR----VAFCTVKIILTDENDNPPQFK
            2540       2550      2560          2570      2580      

           370       380       390       400       410       420   
pF1KA1 VIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEGHFALSTQDSVIYL
       .   ... . .::. .:  :..:     : :.:. : :. :..  .    .   . :  .
CCDS43 ASEYTVSIQSNVSKDSPVIQVLAY----DADEGQNADVTYSVNPEDLVKDVIEINPVTGV
       2590      2600      2610          2620      2630      2640  

           430       440       450       460       470          480
pF1KA1 VCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAPAFDRQLYR---PE
       : :   :   : .. .. . : :.: :   . .   :.:.  . . : :.. ::    ::
CCDS43 VKVKDSLVGLENQTLDFFIKAQDGGPPHWNSLVPVRLQVVPKKVSLPKFSEPLYTFSAPE
           2650      2660      2670      2680      2690      2700  

              490       500       510            520       530     
pF1KA1 PLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----WFSIDPTSGIITTAAS
        ::: .  : .:  :.:.::       : :::. :.  .      ::.:: .:.: .   
CCDS43 DLPEGSEIG-IVKAVAAQDP-------VIYSLVRGTTPESNKDGVFSLDPDTGVIKVRKP
           2710       2720             2730      2740      2750    

         540       550       560       570       580       590     
pF1KA1 LDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQRTFYNASLPEGTQPGT
       .:.:     :. :.:       ..: ..:.. . :::::.: :.   :.: : :.   ::
CCDS43 MDHESTKLYQIDVMAHCLQNTDVVSLVSVNIQVGDVNDNRPVFEADPYKAVLTENMPVGT
         2760      2770      2780      2790      2800      2810    

         600       610       620       630       640       650     
pF1KA1 CFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDF
         .:::: : :.:  : .:: :.:  ::.    : ::..:: . : . :: .   ... :
CCDS43 SVIQVTAIDKDTGRDGQVSYRLSADPGSNVHELFAIDSESGWITTLQELDCETC-QTYHF
         2820      2830      2840      2850      2860       2870   

         660          670       680       690       700       710  
pF1KA1 TVTAVDGGG---LKSMVYVKVFLSDENDNPPQFYPREYAASISAQSPPGTAVLRLRAHDP
        :.: : :    :.:.. :.: ..::::: :.:  .:: .:.  .: ::  :  :.. : 
CCDS43 HVVAYDHGQTIQLSSQALVQVSITDENDNAPRFASEEYRGSVVENSEPGELVATLKTLDA
          2880      2890      2900      2910      2920      2930   

             720       730       740         750       760         
pF1KA1 DQGSHGR-LSYHILAGNSPPLFTLDEQSGLLTVA--WPLARRANSVVQLEIGAEDGGGLQ
       : . ..: .. .:  :.    : ... .    ..    : :. ..   :.. : ::  .:
CCDS43 DISEQNRQVTCYITEGDPLGQFGISQVGDEWRISSRKTLDREHTAKYLLRVTASDGK-FQ
          2940      2950      2960      2970      2980      2990   

     770       780       790       800       810        820        
pF1KA1 AEPSARVDISIVPGTPTPPIFEQLQYVFSVPEDVAPGTSVGIVQAHN-PPGRLAPVTLSL
       :  :. :.: ..  . . :   :: :. .: ::: ::  .  :.: .      : .: ::
CCDS43 A--SVTVEIFVLDVNDNSPQCSQLLYTGKVHEDVFPGHFILKVSATDLDTDTNAQITYSL
             3000      3010      3020      3030      3040      3050

      830       840       850       860       870       880        
pF1KA1 SGGDPRGLFSLDAVSGLLQTLRPLDRELLGPVLELEVRAGSGVPPAFAVARVRVLLDDVN
        :   .  :.::  .: : ::  ::::    :..: ..: .:   .   : . . ..:::
CCDS43 HGPGAHE-FKLDPHTGELTTLTALDRER-KDVFNLVAKATDGGGRSCQ-ADITLHVEDVN
              3060      3070       3080      3090       3100       

      890       900       910       920       930       940        
pF1KA1 DNSPAFPAPEDTVLLPPNTAPGTPIYTLRALDPDSGVNSRVTFTLLAGGGGAFTVDPTTG
       ::.: :   . .: .  ::.  ::. .. : :::.:.:..:...:  .. : :..: :::
CCDS43 DNAPRFFPSHCAVAVFDNTTVKTPVAVVFARDPDQGANAQVVYSLPDSAEGHFSIDATTG
      3110      3120      3130      3140      3150      3160       

      950       960       970       980       990      1000        
pF1KA1 HVRLMRPLGPSGGPAHELELEARDGGSPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVD
        .:: .::        :: ..: : :.:   : .   :.:. :: .   : : .  . :.
CCDS43 VIRLEKPLQVRPQAPLELTVRASDLGTPIPLSTLGT-VTVSVVGLEDYLPVFLNTEHSVQ
      3170      3180      3190      3200       3210      3220      

     1010      1020      1030       1040      1050      1060       
pF1KA1 LPSGTTAGTQVLQVQAQAPDGGPIT-YHLAAEGASSPFGLEPQSGWLWVRAALDREAQEL
       .:  .  ::.:::. . .  :.  : :.... . .. : :. ..: :.: :.:: :..  
CCDS43 VPEDAPPGTEVLQLATLTRPGAEKTGYRVVSGNEQGRFRLDARTGILYVNASLDFETSPK
       3230      3240      3250      3260      3270      3280      

      1070      1080      1090      1100      1110      1120       
pF1KA1 YILKVMAVSGSKAELGQQTGTATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRV
       :.:..     :.. :.. :   :: :.: . ::: :.. .::    : ::   :  .  :
CCDS43 YFLSIECSRKSSSSLSDVT---TVMVNITDVNEHRPQFPQDPYSTRVLENALVGDVILTV
       3290      3300         3310      3320      3330      3340   

      1130       1140      1150      1160      1170      1180      
pF1KA1 FATDRDSGP-NGRLTYSLQQLSEDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDG
        :::.: :: :. .::::   .. .. : :::. ::. . ..::::: :::.: ... :.
CCDS43 SATDED-GPLNSDITYSLIGGNQLGH-FTIHPKKGELQVAKALDREQASSYSLKLRATDS
           3350      3360       3370      3380      3390      3400 

       1190      1200      1210      1220      1230      1240      
pF1KA1 GSPPRSTTGTVHVAVLDLNDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDE
       :.::      . . : :.::: : :.: . ..       : .  : :. :  :  .::: 
CCDS43 GQPPLHEDTDIAIQVADVNDNPPRFFQLNYST------TVQENSPIGSKVLQLILSDPDS
            3410      3420      3430            3440      3450     

       1250        1260      1270      1280      1290      1300    
pF1KA1 GENGTIL-YTLT-GPGSELFSLHPHSGELLTAAPLIRAERPHYVLTLSAHDQGSPPRSAS
        :::    . .: : ..  : . : .: :.::  : :  .  : : ..: :.: :: :. 
CCDS43 PENGPPYSFRITKGNNGSAFRVTP-DGWLVTAEGLSRRAQEWYQLQIQASDSGIPPLSSL
        3460      3470       3480      3490      3500      3510    

         1310      1320      1330      1340      1350      1360    
pF1KA1 LQLLVQVLPSARLAEPPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGVGA
        .. :.:  ... :          :.: .:. . .:..:    :...:.. : .     .
CCDS43 TSVRVHVTEQSHYA----------PSA-LPLEIFITVGEDEFQGGMVGKIHATDRDPQDT
         3520                3530       3540      3550      3560   

         1370      1380      1390      1400      1410      1420    
pF1KA1 LTYTLVGGADPEGTFALDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQV
       :::.:.        :.. : .:..  :. :                              
CCDS43 LTYSLAEEETLGRHFSVGAPDGKIIAAQGLPRGHYSFNVTVSDGTFTTTAGVHVYVWHVG
          3570      3580      3590      3600      3610      3620   

>>CCDS48141.1 PCDH19 gene_id:57526|Hs108|chrX             (1100 aa)
 initn: 1191 init1: 295 opt: 1201  Z-score: 888.4  bits: 177.8 E(32554): 3.7e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)

               10        20        30        40         50         
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
                           ::::.:::: .:        : ::..: .:.  ..::: :
CCDS48                  MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
                                10                20        30     

        60         70        80        90        100       110     
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
       ::.:....     :: :       . .  :. .  :. :.  ::.. : . .::.   : 
CCDS48 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
          40        50        60        70        80        90     

            120       130          140       150       160         
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
           . ..   ....:. :   .. :.::.::.:: :.  :.. : .. ::: ::. : :
CCDS48 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
         100       110       120       130       140       150     

     170       180       190       200       210       220         
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
        :.: .:.: : :. .   : : :: .   ::.   ::::   ::::..::: ... : :
CCDS48 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
         160       170          180       190       200       210  

     230       240       250       260       270       280         
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
       ::.::: . . :.. . : ::. :.:..: : . : :.  :..::... ::: : :.:: 
CCDS48 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
            220       230       240       250       260       270  

     290           300       310       320       330       340     
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
       :.:     .: :  :    :.:: :.::. .   ::.:. .:.:: :::.: : .   . 
CCDS48 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
            280          290       300       310       320         

         350       360       370       380       390       400     
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
         ::: : :.::: : .... ....   .:::.:::: ..: . ::: :.:  ..:.  :
CCDS48 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
     330       340       350        360       370       380        

         410       420       430       440       450       460     
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
        :.   : :.  .: .  . :  :::::..: ::: . : :.: : :..  .:.. .:: 
CCDS48 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
      390        400        410       420       430       440      

         470       480       490       500       510            520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
       ::: : :..  :.   . :   ::.... :.::::: : ::.:.:...:.         .
CCDS48 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
        450       460        470       480       490       500     

              530       540       550       560       570       580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
        ::.:.:: : .  :...:     .. :.: ::::: : :.::: : . ::::: : .  
CCDS48 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
         510       520       530       540       550       560     

                   590       600       610       620       630     
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
         . :..    .:...  :     : : : : :  : ..:..    :. :   :.::  .
CCDS48 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
         570       580       590       600         610         620 

         640       650       660         670       680       690   
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
       :.: ::::.  ... ::... :.: : :  .:.. . : ..::   :             
CCDS48 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
             630        640       650       660       670       680

           700       710       720       730       740       750   
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
                                                                   
CCDS48 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCRIAEYSYGHQKKSSKKKKISKNDIR
              690       700       710       720       730       740

>>CCDS43976.1 PCDH19 gene_id:57526|Hs108|chrX             (1101 aa)
 initn: 1191 init1: 295 opt: 1201  Z-score: 888.4  bits: 177.8 E(32554): 3.7e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)

               10        20        30        40         50         
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
                           ::::.:::: .:        : ::..: .:.  ..::: :
CCDS43                  MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
                                10                20        30     

        60         70        80        90        100       110     
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
       ::.:....     :: :       . .  :. .  :. :.  ::.. : . .::.   : 
CCDS43 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
          40        50        60        70        80        90     

            120       130          140       150       160         
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
           . ..   ....:. :   .. :.::.::.:: :.  :.. : .. ::: ::. : :
CCDS43 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
         100       110       120       130       140       150     

     170       180       190       200       210       220         
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
        :.: .:.: : :. .   : : :: .   ::.   ::::   ::::..::: ... : :
CCDS43 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
         160       170          180       190       200       210  

     230       240       250       260       270       280         
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
       ::.::: . . :.. . : ::. :.:..: : . : :.  :..::... ::: : :.:: 
CCDS43 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
            220       230       240       250       260       270  

     290           300       310       320       330       340     
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
       :.:     .: :  :    :.:: :.::. .   ::.:. .:.:: :::.: : .   . 
CCDS43 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
            280          290       300       310       320         

         350       360       370       380       390       400     
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
         ::: : :.::: : .... ....   .:::.:::: ..: . ::: :.:  ..:.  :
CCDS43 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
     330       340       350        360       370       380        

         410       420       430       440       450       460     
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
        :.   : :.  .: .  . :  :::::..: ::: . : :.: : :..  .:.. .:: 
CCDS43 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
      390        400        410       420       430       440      

         470       480       490       500       510            520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
       ::: : :..  :.   . :   ::.... :.::::: : ::.:.:...:.         .
CCDS43 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
        450       460        470       480       490       500     

              530       540       550       560       570       580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
        ::.:.:: : .  :...:     .. :.: ::::: : :.::: : . ::::: : .  
CCDS43 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
         510       520       530       540       550       560     

                   590       600       610       620       630     
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
         . :..    .:...  :     : : : : :  : ..:..    :. :   :.::  .
CCDS43 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
         570       580       590       600         610         620 

         640       650       660         670       680       690   
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
       :.: ::::.  ... ::... :.: : :  .:.. . : ..::   :             
CCDS43 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
             630        640       650       660       670       680

           700       710       720       730       740       750   
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
                                                                   
CCDS43 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCRIAEYSYGHQKKSSKKKKISKNDIR
              690       700       710       720       730       740

>>CCDS55462.1 PCDH19 gene_id:57526|Hs108|chrX             (1148 aa)
 initn: 1021 init1: 295 opt: 1201  Z-score: 888.1  bits: 177.8 E(32554): 3.8e-43
Smith-Waterman score: 1201; 36.4% identity (62.0% similar) in 687 aa overlap (21-680:4-667)

               10        20        30        40         50         
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSL-DLQ--IDEEQPA
                           ::::.:::: .:        : ::..: .:.  ..::: :
CCDS55                  MESLLLPVLLLLAIL--------WTQAAALINLKYSVEEEQRA
                                10                20        30     

        60         70        80        90        100       110     
pF1KA1 GTLIGDISAGL-PAGTAAPLMYFISAQEGSGVGTDLA-IDEHSGVVRTARVLDREQRDRY
       ::.:....     :: :       . .  :. .  :. :.  ::.. : . .::.   : 
CCDS55 GTVIANVAKDAREAGFALDPRQASAFRVVSNSAPHLVDINPSSGLLVTKQKIDRDLLCRQ
          40        50        60        70        80        90     

            120       130          140       150       160         
pF1KA1 R---FTAVTPDGATVEVTV---RVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARD
           . ..   ....:. :   .. :.::.::.:: :.  :.. : .. ::: ::. : :
CCDS55 SPKCIISLEVMSSSMEICVIKVEIKDLNDNAPSFPAAQIELEISEAASPGTRIPLDSAYD
         100       110       120       130       140       150     

     170       180       190       200       210       220         
pF1KA1 ADAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYD
        :.: .:.: : :. .   : : :: .   ::.   ::::   ::::..::: ... : :
CCDS55 PDSGSFGVQTYELTPN---ELFGLEIKTRGDGSRFAELVVEKSLDRETQSHYSFRITALD
         160       170          180       190       200       210  

     230       240       250       260       270       280         
pF1KA1 GGSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGA
       ::.::: . . :.. . : ::. :.:..: : . : :.  :..::... ::: : :.:: 
CCDS55 GGDPPRLGTVGLSIKVTDSNDNNPVFSESTYAVSVPENSPPNTPVIRLNASDPDEGTNGQ
            220       230       240       250       260       270  

     290           300       310       320       330       340     
pF1KA1 VTYE----INRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGS
       :.:     .: :  :    :.:: :.::. .   ::.:. .:.:: :::.: : .   . 
CCDS55 VVYSFYGYVNDRTREL---FQIDPHSGLVTVTGALDYEEGHVYELDVQAKDLGPNSIPAH
            280          290       300       310       320         

         350       360       370       380       390       400     
pF1KA1 AFVTVHVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSL
         ::: : :.::: : .... ....   .:::.:::: ..: . ::: :.:  ..:.  :
CCDS55 CKVTVSVLDTNDNPPVINLLSVNSELV-EVSESAPPGYVIALVRVSDRDSGLNGRVQCRL
     330       340       350        360       370       380        

         410       420       430       440       450       460     
pF1KA1 EGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDV
        :.   : :.  .: .  . :  :::::..: ::: . : :.: : :..  .:.. .:: 
CCDS55 LGNVP-FRLQEYES-FSTILVDGRLDREQHDQYNLTIQARDGGVPMLQSAKSFTVLITDE
      390        400        410       420       430       440      

         470       480       490       500       510            520
pF1KA1 NDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH-----W
       ::: : :..  :.   . :   ::.... :.::::: : ::.:.:...:.         .
CCDS55 NDNHPHFSKPYYQV-IVQENNTPGAYLLSVSARDPDLGLNGSVSYQIVPSQVRDMPVFTY
        450       460        470       480       490       500     

              530       540       550       560       570       580
pF1KA1 FSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQFQR
        ::.:.:: : .  :...:     .. :.: ::::: : :.::: : . ::::: : .  
CCDS55 VSINPNSGDIYALRSFNHEQTKAFEFKVLAKDGGLPSLQSNATVRVIILDVNDNTPVITA
         510       520       530       540       550       560     

                   590       600       610       620       630     
pF1KA1 T-FYNAS----LPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHS
         . :..    .:...  :     : : : : :  : ..:..    :. :   :.::  .
CCDS55 PPLINGTAEVYIPRNSGIGYLVTVVKAEDYDEGENGRVTYDMTE--GDRGF--FEIDQVN
         570       580       590       600         610         620 

         640       650       660         670       680       690   
pF1KA1 GDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDNPPQFYPREYAAS
       :.: ::::.  ... ::... :.: : :  .:.. . : ..::   :             
CCDS55 GEVRTTRTFG-ESSKSSYELIVVAHDHGKTSLSASALVLIYLSPALDAQESMGSVNLSLI
             630        640       650       660       670       680

           700       710       720       730       740       750   
pF1KA1 ISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRAN
                                                                   
CCDS55 FIIALGSIAGILFVTMIFVAIKCKRDNKEIRTYNCSNCLTITCLLGCFIKGQNSKCLHCI
              690       700       710       720       730       740

>>CCDS47177.1 FAT1 gene_id:2195|Hs108|chr4                (4588 aa)
 initn: 446 init1: 322 opt: 1144  Z-score: 837.9  bits: 170.5 E(32554): 2.4e-40
Smith-Waterman score: 1715; 29.9% identity (58.5% similar) in 1399 aa overlap (594-1953:2299-3634)

           570       580       590       600       610       620   
pF1KA1 VSVALQDVNDNEPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGS
                                     ::  .:: :::.:: :   .::..  :  :
CCDS47 VDIIVDDINDNPPVFAQQSYAVTLSEASVIGTSVVQVRATDSDSEPNRGISYQM-FGNHS
     2270      2280      2290      2300      2310      2320        

           630       640       650       660         670       680 
pF1KA1 SGSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGG--GLKSMVYVKVFLSDENDN
       ..   :..:. .: .   :::: .:. .   : : :::::   :.: : : : ..: :::
CCDS47 KSHDHFHVDSSTGLISLLRTLDYEQSRQHTIF-VRAVDGGMPTLSSDVIVTVDVTDLNDN
      2330      2340      2350       2360      2370      2380      

             690       700       710       720       730       740 
pF1KA1 PPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGL
       :: :  . : : :: ..: :  :  ..:.: :...  .:.: ::.::.   :..:  .:.
CCDS47 PPLFEQQIYEARISEHAPHGHFVTCVKAYDADSSDIDKLQYSILSGNDHKHFVIDSATGI
       2390      2400      2410      2420      2430      2440      

             750        760       770       780       790       800
pF1KA1 LTVAWPLARRA-NSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVP
       .:..  : :.: .   .:.... ::     . :..: .... :.   : : : .:   . 
CCDS47 ITLS-NLHRHALKPFYSLNLSVSDG---VFRSSTQVHVTVIGGNLHSPAFLQNEYEVELA
       2450       2460      2470         2480      2490      2500  

              810        820       830       840       850         
pF1KA1 EDVAPGTSVGIVQAHN-PPGRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGP
       :..   : :  :.. .   :  . ::  . .   .  : ..   : . ::. ::::  . 
CCDS47 ENAPLHTLVMEVKTTDGDSGIYGHVTYHIVNDFAKDRFYINE-RGQIFTLEKLDRETPAE
           2510      2520      2530      2540       2550      2560 

      860        870       880       890       900       910       
pF1KA1 -VLELEVRA-GSGVPPAFAVARVRVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLR
        :. ... :  .:   :: .  : :.: : :::.: : : .  : .  ..: :: .  . 
CCDS47 KVISVRLMAKDAGGKVAFCT--VNVILTDDNDNAPQFRATKYEVNIGSSAAKGTSVVKVL
            2570      2580        2590      2600      2610         

       920       930       940          950       960       970    
pF1KA1 ALDPDSGVNSRVTFTLLAGGGGA---FTVDPTTGHVRLMRPLGPSGGPAHELELEARDGG
       : : : : :. .:... : . ..   . ..  .: .   . :    .    . ..: :.:
CCDS47 ASDADEGSNADITYAIEADSESVKENLEINKLSGVITTKESLIGLENEFFTFFVRAVDNG
    2620      2630      2640      2650      2660      2670         

          980       990      1000      1010      1020      1030    
pF1KA1 SPPRTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPDGGPITY
       :: . :   . : :. .  .   :.:. : :   .   .  ::..  ..:.   .: . :
CCDS47 SPSKES--VVLVYVKILPPEMQLPKFSEPFYTFTVSEDVPIGTEIDLIRAE--HSGTVLY
    2680        2690      2700      2710      2720        2730     

         1040             1050      1060      1070      1080       
pF1KA1 HLAAEGASSP-------FGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTG
        :. .: ..:       : .. ::: : .. .::.:. . : ....:   .  .  ....
CCDS47 SLV-KG-NTPESNRDESFVIDRQSGRLKLEKSLDHETTKWYQFSILARCTQDDH--EMVA
         2740       2750      2760      2770      2780        2790 

      1090      1100      1110      1120      1130      1140       
pF1KA1 TATVRVSILNQNEHSPRLSEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQL
       .. : ... . :..:: .  .:    ..:: : :. : .. :.: ::: ::.. :::.: 
CCDS47 SVDVSIQVKDANDNSPVFESSPYEAFIVENLPGGSRVIQIRASDADSGTNGQVMYSLDQS
            2800      2810      2820      2830      2840      2850 

        1150      1160      1170      1180      1190       1200    
pF1KA1 S--EDSKAFRIHPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPR-STTGTVHVAVLDL
       .  :  ..: :. .:: .:::. ::.:....::. : ..: :   . :.:. : :.: :.
CCDS47 QSVEVIESFAINMETGWITTLKELDHEKRDNYQIKVVASDHGEKIQLSSTAIVDVTVTDV
            2860      2870      2880      2890      2900      2910 

         1210      1220      1230      1240       1250      1260   
pF1KA1 NDNSPTFLQASGAAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGE-NGTILYTLTGPGSEL
       ::. : :  :    :      : .  : : ... :.. : :  : :  . : .:: :. :
CCDS47 NDSPPRFT-AEIYKG-----TVSEDDPQGGVIAILSTTDADSEEINRQVTYFITG-GDPL
             2920           2930      2940      2950      2960     

            1270        1280      1290      1300      1310         
pF1KA1 --FSLHPHSGE--LLTAAPLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAE
         :...  ..:  . .  :: : .: .:.::..: : :.   .: ..  :.::       
CCDS47 GQFAVETIQNEWKVYVKKPLDREKRDNYLLTITATD-GTFSSKAIVE--VKVL-------
         2970      2980      2990      3000       3010             

    1320      1330      1340      1350      1360         1370      
pF1KA1 PPPDLAERDPAAPVPVVLTVTAAEGLRPGSLLGSVAAPEPAGV---GALTYTLVG-GADP
          :  . .:.    .. . :  : . ::.:. ...: . : .   . .::::.: ::. 
CCDS47 ---DANDNSPVCE-KTLYSDTIPEDVLPGKLIMQISATD-ADIRSNAEITYTLLGSGAEK
            3020       3030      3040       3050      3060         

        1380      1390      1400      1410      1420        1430   
pF1KA1 EGTFALDAASGRLYLARPLDFEAGPPWRALTVRAEGPGGAGARLLRVQV--QVQDENEHA
          : :.  .:.:  . ::: :    .. : :::   ::   :. ....   ..: :..:
CCDS47 ---FKLNPDTGELKTSTPLDREEQAVYH-LLVRATDGGG---RFCQASIVLTLEDVNDNA
       3070      3080      3090       3100         3110      3120  

          1440      1450      1460      1470      1480      1490   
pF1KA1 PAFARDPLALALPENPEPGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTG
       : :. :: :... :: :::. :   .:.:::. : :  . : :.  .     . ..  .:
CCDS47 PEFSADPYAITVFENTEPGTLLTRVQATDADA-GLNRKILYSLI--DSADGQFSINELSG
           3130      3140      3150       3160        3170         

          1500      1510      1520      1530      1540      1550   
pF1KA1 ALSAPRGLDRETTPALLLLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSR-V
        ..  . ::::   .  : ..:.:.  .  :: .:  .. : : : ::: :::      .
CCDS47 IIQLEKPLDRELQAVYTLSLKAVDQ--GLPRRLTATGTVIVSVLDINDNPPVFEYREYGA
    3180      3190      3200        3210      3220      3230       

           1560      1570      1580       1590      1600      1610 
pF1KA1 RLPEDQPPGPAALHVVARDPDLGEAARVSYRLASGGD-GHFRLHSSTGALSVVRPLDREQ
        . ::   :  .:.: : . :.   :...: . ::.. :.: . :.:::. ... :: :.
CCDS47 TVSEDILVGTEVLQVYAASRDIEANAEITYSIISGNEHGKFSIDSKTGAVFIIENLDYES
      3240      3250      3260      3270      3280      3290       

            1620      1630      1640      1650      1660      1670 
pF1KA1 RAEHVLTVVASDHGSPPRSATQVLTVSVADVNDEAPTFQQQEYSVLLRENNPPGTSLLTL
         :. ::: :.: :.:  : . ...:.:.:.::..:.:.:. :.... :.     :..:.
CCDS47 SHEYYLTVEATDGGTPSLSDVATVNVNVTDINDNTPVFSQDTYTTVISEDAVLEQSVITV
      3300      3310      3320      3330      3340      3350       

            1680         1690      1700      1710      1720        
pF1KA1 RATDPDVGANGQVTYG---GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGS
        : : :  .:... :.   : .. ::..::  : . . . ::::     .::: :.: ::
CCDS47 MADDADGPSNSHIHYSIIDGNQGSSFTIDPVRGEVKVTKLLDRETISGYTLTVQASDNGS
      3360      3370      3380      3390      3400      3410       

     1730      1740      1750      1760      1770        1780      
pF1KA1 PPQLTHVTVRVAVEDENDHAPTFGSAHLSLEVPEGQDPQTLTMLR--ASDPDVGANGQ-L
       ::... .:: . : : ::.::.:. .. :. . :.. :  ...:.  ..: : . ::  .
CCDS47 PPRVNTTTVNIDVSDVNDNAPVFSRGNYSVIIQENK-PVGFSVLQLVVTDEDSSHNGPPF
      3420      3430      3440      3450       3460      3470      

        1790      1800      1810      1820      1830      1840     
pF1KA1 QYRILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTV
        . :. :.   :: ..  .: . :   . :. .  . :.... :.:.: ::.   . . :
CCDS47 FFTIVTGNDEKAFEVN-PQGVLLTSSAIKRKEKDHYLLQVKVADNGKPQLSSLTYIDIRV
       3480      3490       3500      3510      3520      3530     

        1850       1860      1870      1880      1890      1900    
pF1KA1 LDANDHAPA-FPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAGTAGAFLL
       .. . . :: .:.  . .   :.  .:..    . :  :  .   .:: :     . : .
CCDS47 IEESIYPPAILPLEIFITSSGEEYSGGVIG---KIHATDQDVYDTLTYSLDPQMDNLFSV
        3540      3550      3560         3570      3580      3590  

         1910      1920      1930      1940      1950      1960    
pF1KA1 EPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVSVTITVRDVNDHAPTFPTSP
         ..:.: .   ::  :   : ..::..::     ..:....:. .:.:           
CCDS47 SSTGGKLIAHKKLDIGQ---YLLNVSVTDGK----FTTVADITVHIRQVTQEMLNHTIAI
           3600         3610      3620          3630      3640     

         1970      1980      1990      2000      2010      2020    
pF1KA1 LRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRLAGTPPPGTTVDSYTGEIRVAR
                                                                   
CCDS47 RFANLTPEEFVGDYWRNFQRALRNILGVRRNDIQIVSLQSSEPHPHLDVLLFVEKPGSAQ
        3650      3660      3670      3680      3690      3700     

>--
 initn: 446 init1: 322 opt: 1358  Z-score: 995.3  bits: 199.6 E(32554): 4.1e-49
Smith-Waterman score: 2468; 27.9% identity (56.1% similar) in 2362 aa overlap (430-2717:108-2294)

     400       410       420       430       440       450         
pF1KA1 HVNVSLEGGEGHFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFV
                                     :.:: .: :.: : : ....  ..:..   
CCDS47 DSENLFKAEEYILGDFCFLRIRTKGGNTAILNREVKDHYTLIVKALEKNTN-VEARTKVR
        80        90       100       110       120        130      

     460       470       480       490       500       510         
pF1KA1 LHVTDVNDNAPAFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGAHTH
       ..: :.::  : :.   :    ::: .   . ..::.: : : ::::.  ::.    .: 
CCDS47 VQVLDTNDLRPLFSPTSYSVS-LPENTAIRTSIARVSATDADIGTNGEFYYSFKD--RTD
        140       150        160       170       180       190     

     520       530       540       550       560            570    
pF1KA1 WFSIDPTSGIITTAASLDYELEPQPQLIVVATDGGLPPLASS-----ATVSVALQDVNDN
        :.: ::::.:. .. :::      .. ..:.: :.   .::     : ..: ....:. 
CCDS47 MFAIHPTSGVIVLTGRLDYLETKLYEMEILAADRGMKLYGSSGISSMAKLTVHIEQANEC
           200       210       220       230       240       250   

          580       590       600       610        620             
pF1KA1 EPQFQRTFYNASLPEGTQPGTCFLQVTATDADSGPFG-LLSYSLGAG---------LGSS
        : .  .  .   :   .    .  ::. : :.:  : . : :. ::          .  
CCDS47 APVITAVTLS---PSELDRDPAYAIVTVDDCDQGANGDIASLSIVAGDLLQQFRTVRSFP
           260          270       280       290       300       310

          630       640       650       660          670       680 
pF1KA1 GSPPFRIDAHSGDVCTTRTLDRDQGPSSFDFTVTAVDGGG---LKSMVYVKVFLSDENDN
       ::  ... : .:       .: :. : ....:. : : :    ..:.  ..:   . . .
CCDS47 GSKEYKVKAIGG-------IDWDSHPFGYNLTLQAKDKGTPPQFSSVKVIHVTSPQFKAG
              320              330       340       350       360   

             690       700       710       720       730       740 
pF1KA1 PPQFYPREYAASISAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGL
       : .:    : : ::  .::.: :. ..:  :   :: :  ..   :..   :.:. ..::
CCDS47 PVKFEKDVYRAEISEFAPPNTPVVMVKAI-PAY-SHLRYVFKSTPGKAK--FSLNYNTGL
           370       380       390         400       410           

             750       760       770       780       790       800 
pF1KA1 LTVAWPLARRANSVVQLEIGAEDGGGLQAEPSARVDISIVPGTPTPPIFEQLQYVFSVPE
       ...  :. :.  .  .::. . :      . :..: .... .. .:: : :  :  .  :
CCDS47 ISILEPVKRQQAAHFELEVTTSD-----RKASTKVLVKVLGANSNPPEFTQTAYKAAFDE
     420       430       440            450       460       470    

             810        820       830       840       850       860
pF1KA1 DVAPGTSVGIVQAHNPP-GRLAPVTLSLSGGDPRGLFSLDAVSGLLQTLRPLDRELLGPV
       .:  ::.:  ..: .:  :. . :: :... .    :..:  .: ..: . :: ::.  :
CCDS47 NVPIGTTVMSLSAVDPDEGENGYVTYSIANLNHVP-FAIDHFTGAVSTSENLDYELMPRV
          480       490       500        510       520       530   

               870       880        890       900       910        
pF1KA1 LELEVRAGS-GVPPAFAVARV-RVLLDDVNDNSPAFPAPEDTVLLPPNTAPGTPIYTLRA
         :..::.. :.:    :  .  . :...:::.: :   .    .: . . :  : :. :
CCDS47 YTLRIRASDWGLPYRREVEVLATITLNNLNDNTPLFEKINCEGTIPRDLGVGEQITTVSA
           540       550       560       570       580       590   

      920       930        940       950       960       970       
pF1KA1 LDPDSGVNSRVTFTLLAGGG-GAFTVDPTTGHVRLMRPLGPSGGPAHELELEARDGGSPP
       .: :    . : . . ::.    :...:..: . : : :  . :                
CCDS47 IDADEL--QLVQYQIEAGNELDFFSLNPNSGVLSLKRSLMDGLGA---------------
             600       610       620       630                     

       980       990      1000      1010      1020      1030       
pF1KA1 RTSHFRLRVVVQDVGTRGLAPRFNSPTYRVDLPSGTTAGTQVLQVQAQAPDGGPITYHLA
       ..:   ::... :      .  : .: : ...   :.:... : :. :  . :  . .. 
CCDS47 KVSFHSLRITATD------GENFATPLY-INI---TVAASHKL-VNLQCEETG--VAKML
        640             650        660           670         680   

      1040      1050      1060      1070      1080      1090       
pF1KA1 AEGASSPFGLEPQSGWLWVRAALDREAQELYILKVMAVSGSKAELGQQTGTATVRVSILN
       ::   .   :. :.           :......                  . .:      
CCDS47 AEKLLQANKLHNQG-----------EVEDIFF-----------------DSHSV------
           690                  700                                

      1100       1110      1120      1130      1140      1150      
pF1KA1 QNEHSPRL-SEDPTFLAVAENQPPGTSVGRVFATDRDSGPNGRLTYSLQQLSEDSKAFRI
        : : :.. :  :: . : :::: :.::  . .:: :.: ::.:.:...  .:::  : :
CCDS47 -NAHIPQFRSTLPTGIQVKENQPVGSSVIFMNSTDLDTGFNGKLVYAVSGGNEDS-CFMI
      710       720       730       740       750       760        

       1160      1170      1180      1190      1200      1210      
pF1KA1 HPQTGEVTTLQTLDREQQSSYQLLVQVQDGGSPPRSTTGTVHVAVLDLNDNSPTFLQASG
         .:: .  :. ::::  ..: : . : : : : ...   .::.:.: ::: : ::: : 
CCDS47 DMETGMLKILSPLDRETTDKYTLNITVYDLGIPQKAAWRLLHVVVVDANDNPPEFLQES-
       770       780       790       800       810       820       

       1220      1230      1240      1250      1260      1270      
pF1KA1 AAGGGLPIQVPDRVPPGTLVTTLQAKDPDEGENGTILYTLTGPGSELFSLHPHSGELLTA
              ..: .     . .  ..: : : : :: . :...   .. ::.   .: .  :
CCDS47 -----YFVEVSEDKEVHSEIIQVEATDKDLGPNGHVTYSIV-TDTDTFSIDSVTGVVNIA
             830       840       850       860        870       880

       1280      1290      1300      1310      1320      1330      
pF1KA1 APLIRAERPHYVLTLSAHDQGSPPRSASLQLLVQVLPSARLAEPPPDLAERDPAAPVPVV
        :: :  . .. : . :.::.   :    ::.  :. .. :     :. . .: . .:  
CCDS47 RPLDRELQHEHSLKIEARDQA---REEP-QLFSTVVVKVSLE----DVND-NPPTFIPPN
              890       900           910           920        930 

       1340      1350        1360      1370      1380      1390    
pF1KA1 LTVTAAEGLRPGSLLGSVAAPEP--AGVGALTYTLVGGADPEGTFALDAASGRLYLARPL
         : . : :  :...  . : .:  .  : . :.:.  .  ::.: .:  :: . ... :
CCDS47 YRVKVREDLPEGTVIMWLEAHDPDLGQSGQVRYSLLDHG--EGNFDVDKLSGAVRIVQQL
             940       950       960       970         980         

         1400      1410        1420      1430        1440      1450
pF1KA1 DFEAGPPWRALTVRAEGPGG--AGARLLRVQVQVQDENE--HAPAFARDPLALALPENPE
       :::    .  :::::.  :   . .    :.:.: : ::  : :.:.      .. :.  
CCDS47 DFEKKQVYN-LTVRAKDKGKPVSLSSTCYVEVEVVDVNENLHPPVFSSFVEKGTVKEDAP
     990       1000      1010      1020      1030      1040        

             1460      1470      1480      1490      1500      1510
pF1KA1 PGAALYTFRASDADGPGPNSDVRYRLLRQEPPVPALRLDARTGALSAPRGLDRETTPALL
        :. ..:  : : :.   ....:: . :.   : ....  .::.. .   ::::.:    
CCDS47 VGSLVMTVSAHDEDARR-DGEIRYSI-RDGSGVGVFKIGEETGVIETSDRLDRESTSHYW
     1050      1060       1070       1080      1090      1100      

             1520      1530      1540      1550         1560       
pF1KA1 LLVEATDRPANASRRRAARVSARVFVTDENDNAPVFASPSRVRLPE---DQPPGPAALHV
       : : :::. .      .. .   . : : :::::  . :  :  ::   ..:   .....
CCDS47 LTVFATDQGVVPL---SSFIEIYIEVEDVNDNAPQTSEP--VYYPEIMENSPKDVSVVQI
       1110         1120      1130      1140        1150      1160 

      1570      1580       1590      1600       1610      1620     
pF1KA1 VARDPDLGEAARVSYRLASGG-DGHFRLHSSTGALSVV-RPLDREQRAEHVLTVVASDHG
        : ::: .   .. :...::. .: : .: .:: .... : :::::. ::.: :...:.:
CCDS47 EAFDPDSSSNDKLMYKITSGNPQGFFSIHPKTGLITTTSRKLDREQQDEHILEVTVTDNG
            1170      1180      1190      1200      1210      1220 

        1630      1640      1650             1660      1670        
pF1KA1 SPPRSATQVLTVSVADVNDEAPTFQQQEYSVLL-------RENNPPGTSLLTLRATDPDV
       :::.:.   . :.. : ::. : : :. :.. :       :: :     :  . ::: : 
CCDS47 SPPKSTIARVIVKILDENDNKPQFLQKFYKIRLPEREKPDRERNARREPLYHVIATDKDE
            1230      1240      1250      1260      1270      1280 

     1680         1690      1700      1710      1720      1730     
pF1KA1 GANGQVTYG---GVSSESFSLDPDTGVLTTLRALDREEQEEINLTVYAQDRGSPPQLTHV
       : :....:.   :    .: ..: :::... : ..   . .: :.. : : : : . .  
CCDS47 GPNAEISYSIEDGNEHGKFFIEPKTGVVSSKR-FSAAGEYDI-LSIKAVDNGRPQKSS--
            1290      1300      1310       1320       1330         

        1740      1750           1760        1770      1780        
pF1KA1 TVRVAVEDENDHAPT-----FGSAHLSLEVPEGQDP--QTLTMLRASDPDVGANGQLQYR
       :.:. .:  .   :.     :  . ... : :. ::  . . .. .  : .     : . 
CCDS47 TTRLHIEWISKPKPSLEPISFEESFFTFTVMES-DPVAHMIGVISVEPPGI----PLWFD
      1340      1350      1360      1370       1380          1390  

     1790      1800      1810      1820      1830      1840        
pF1KA1 ILDGDPSGAFVLDLASGEFGTMRPLDREVEPAFQLRIEARDGGQPALSATLLLTVTVLDA
       :  :. .. : .: ..: . . .::: : .  ..: .:: ::    :. ..   . :.:.
CCDS47 ITGGNYDSHFDVDKGTGTIIVAKPLDAEQKSNYNLTVEATDGTTTILTQVF---IKVIDT
           1400      1410      1420      1430      1440            

     1850      1860      1870      1880      1890          1900    
pF1KA1 NDHAPAFPVPAYSVEVPEDVPAGTLLLQLQAHDPDAGANGHVTYYLGAG----TAGAFLL
       ::: : : .  : : .:::.   : .::..: : :   .... : : ..    .   : :
CCDS47 NDHRPQFSTSKYEVVIPEDTAPETEILQISAVDQD--EKNKLIYTLQSSRDPLSLKKFRL
    1450      1460      1470      1480        1490      1500       

         1910      1920      1930      1940       1950      1960   
pF1KA1 EPSSGELRTAAALDREQCPSYTFSVSAVDGAAAGPLSTTVS-VTITVRDVNDHAPTFPTS
       .:..: : :.  ::.:   ..:..: . :  .  :.. . . ....: :.::::: : .:
CCDS47 DPATGSLYTSEKLDHEAVHQHTLTVMVRDQDV--PVKRNFARIVVNVSDTNDHAPWFTAS
      1510      1520      1530        1540      1550      1560     

          1970      1980      1990      2000       2010      2020  
pF1KA1 PLRLRLPRPGPSFSTPTLALATLRAEDRDAGANASILYRL-AGTPPPGTTVDSYTGEIRV
         . :. .   : .. ...:  . : :.: : :: .:: . .:.   .  .:   : :..
CCDS47 SYKGRVYE---SAAVGSVVLQ-VTALDKDKGKNAEVLYSIESGNIGNSFMIDPVLGSIKT
        1570         1580       1590      1600      1610      1620 

           2030      2040      2050      2060      2070      2080  
pF1KA1 ARSPVALGPRDRVLFIVATDLGRPARSATGVIIVGLQGEAERGPRFPRASSEATIRENAP
       :.     .  .  :.. ::: : :  :    . . .    . .:.:      . . :.. 
CCDS47 AKELDRSNQAEYDLMVKATDKGSPPMSEITSVRIFVTIADNASPKFTSKEYSVELSETVS
            1630      1640      1650      1660      1670      1680 

           2090      2100      2110      2120      2130      2140  
pF1KA1 PGTPIVSPRAVHAGGTNGPITYSILSGNEKGTFSIQPSTGAITVRSAEGLDFEVSPRLRL
        :. .:.  ..:   ... ..: : .::   .:.:.: .:.: ...:  ::::. :   :
CCDS47 IGS-FVGMVTAH---SQSSVVYEIKDGNTGDAFDINPHSGTIITQKA--LDFETLPIYTL
             1690         1700      1710      1720        1730     

            2150      2160      2170      2180      2190           
pF1KA1 VLQAES-GGAFAFTVLTLTLQDANDNAPRFLRPHYVAFLPESRPLEGPLLQ-------VE
       ..:. . .:  . :.. . ::: ::::: :.. .:.... ::  ... .:        ..
CCDS47 IIQGTNMAGLSTNTTVLVHLQDENDNAPVFMQAEYTGLISESASINSVVLTDRNVPLVIR
        1740      1750      1760      1770      1780      1790     

         2200      2210       2220      2230      2240      2250   
pF1KA1 ADDLDQGSGGQISYSLAASQPA-RGLFHVDPTTGTITTTAILDREIWAETRLVLMATDRG
       : : :. :.. . : ..  .:. .  : .: .::.: :.  :: :  .  ...... : :
CCDS47 AADADKDSNALLVYHIV--EPSVHTYFAIDSSTGAIHTVLSLDYEETSIFHFTVQVHDMG
        1800      1810        1820      1830      1840      1850   

            2260      2270      2280       2290      2300          
pF1KA1 SPALVG--SATLTVMVIDTNDNRPTIPQP-WELRVSEDALLGSEIAQVTGNDVDSGPV--
       .: : .  .:..:: ::: ::  :.. .: .:  .   .  : ..  :...:.::.    
CCDS47 TPRLFAEYAANVTVHVIDINDCPPVFAKPLYEASLLLPTYKGVKVITVNATDADSSAFSQ
          1860      1870      1880      1890      1900      1910   

     2310      2320      2330      2340      2350      2360        
pF1KA1 LWYVLSPSGPQDPFSVGRYGGRVSLTGPLDFEQCDRYQLQLLAHDGPHEGRANLTVLVED
       : : .. ..  . ::.    : ... .  ....  ::.: . : ::   : ... . :..
CCDS47 LIYSITEGNIGEKFSMDYKTGALTVQNTTQLRS--RYELTVRASDGRFAGLTSVKINVKE
          1920      1930      1940        1950      1960      1970 

     2370      2380      2390      2400      2410      2420        
pF1KA1 VNDNAPAFSQSLYQVMLLEHTPPGSAILSVSATDRDSGANGHISYHLASPADGFSVDPNN
        ...   :.:..:.... :..  . ..  ..:    .  :  . ::. .:   :... ..
CCDS47 SKESHLKFTQDVYSAVVKENSTEAETLAVITAIG--NPINEPLFYHILNPDRRFKISRTS
            1980      1990      2000        2010      2020         

     2430      2440      2450      2460      2470      2480        
pF1KA1 GTLFTIVGTVALGHDGSGAVDVVLEARDHGAPGRAARATVHVQLQDQNDHAPSFTLSHYR
       :.: : .::  . .. . : :::.:. ..  :. .:...:.: ..::::.:: :.   : 
CCDS47 GVLST-TGT-PFDREQQEAFDVVVEVTEEHKPSAVAHVVVKVIVEDQNDNAPVFVNLPYY
    2030        2040      2050      2060      2070      2080       

     2490      2500      2510      2520      2530      2540        
pF1KA1 VAVTEDLPPGSTLLTLEATDADGSRSHAAVDYSIISGNWGRVFQLEPRLAEAGESAGPGP
       ..:  :   : ..  . :.: :..:. . : :                : :  :    ::
CCDS47 AVVKVDTEVGHVIRYVTAVDRDSGRN-GEVHY---------------YLKEHHEHFQIGP
      2090      2100      2110                      2120      2130 

     2550      2560       2570      2580      2590      2600       
pF1KA1 RALGCLVLLEPLDFESLTQ-YNLTVAAADRGQPPQSSVVPVTVTVLDVNDNPPVFTRASY
         :: . : . .....:.. : .::.: : :.:  :. : : .::.  :   ::: .  :
CCDS47 --LGEISLKKQFELDTLNKEYLVTVVAKDGGNPAFSAEVIVPITVM--NKAMPVFEKPFY
              2140      2150      2160      2170        2180       

      2610      2620      2630       2640      2650      2660      
pF1KA1 RVTVPEDTPVGAELLHVEASDADPGPHGL-VRFTVSSGDPSGLFELDESSGTLRLAHALD
        . . :.  : . ..::.:.    .:.:: : .....::: . : .. ..:.. .   ::
CCDS47 SAEIAESIQVHSPVVHVQAN----SPEGLKVFYSITDGDPFSQFTINFNTGVINVIAPLD
      2190      2200          2210      2220      2230      2240   

       2670      2680       2690      2700      2710      2720     
pF1KA1 CETQARHQLVVQAADP-AGAHFALAPVTIEVQDVNDHGPAFPLNLLSTSVAENQPPGTLV
        :..  ..: ..:.:  .::: : . : : :.:.::. :.:  .  .....:        
CCDS47 FEAHPAYKLSIRATDSLTGAH-AEVFVDIIVDDINDNPPVFAQQSYAVTLSEASVIGTSV
          2250      2260       2270      2280      2290      2300  

        2730      2740      2750      2760      2770      2780     
pF1KA1 TTLHAIDGDAGAFGRLRYSLLEAGPGPEGREAFALNSSTGELRARVPFDYEHTESFRLLV
                                                                   
CCDS47 VQVRATDSDSEPNRGISYQMFGNHSKSHDHFHVDSSTGLISLLRTLDYEQSRQHTIFVRA
           2310      2320      2330      2340      2350      2360  

>>CCDS75345.1 PCDHGA11 gene_id:56105|Hs108|chr5           (837 aa)
 initn: 1135 init1: 406 opt: 1121  Z-score: 831.2  bits: 166.8 E(32554): 5.6e-40
Smith-Waterman score: 1121; 35.2% identity (61.6% similar) in 679 aa overlap (25-677:13-667)

               10        20        30        40        50        60
pF1KA1 MQKELGIVPSCPGMKSPRPHLLLPLLLLLLLLLGAGVPGAWGQAGSLDLQIDEEQPAGTL
                               ::::: ..::. . :   .: ..  .. ::   :..
CCDS75             MANRLQRGDRSRLLLLLCIFLGT-LRGF--RARQIRYSVPEETEKGSF
                           10        20           30        40     

                  70        80        90       100       110       
pF1KA1 IGDISAGL---PAGTAAPLMYFISAQEGSGVGTDLAIDEHSGVVRTARVLDREQRDRYRF
       .:.::  :   :   :   . ..:     :    .:.. .:: . ::  .:::.  .   
CCDS75 VGNISKDLGLEPRELAKRGVRIVS----RGKTQLFAVNPRSGSLITAGRIDREELCETVS
          50        60            70        80        90       100 

       120              130       140       150       160       170
pF1KA1 TAVTPDGATVE-------VTVRVADINDHAPAFPQARAALQVPEHTAFGTRYPLEPARDA
       .        ::       : :.. ::::.::.: . .. ..: ::.  :.:. :  ::: 
CCDS75 SCFLNMELLVEDTLKIYGVEVEIIDINDNAPSFQEDEVEIKVSEHAIPGARFALPNARDP
             110       120       130       140       150       160 

              180       190       200       210       220       230
pF1KA1 DAGRLGTQGYALSGDGAGETFRLETRPGPDGTPVPELVVTGELDRENRSHYMLQLEAYDG
       :.:  . :.: :: ..    : :. :   ::.  ::::. : ::::... ..: : : ::
CCDS75 DVGVNSLQSYQLSPNNY---FSLQLRGRTDGAKNPELVLEGSLDREKEAAHLLLLTALDG
             170          180       190       200       210        

              240       250       260       270       280       290
pF1KA1 GSPPRRAQALLDVTLLDINDHAPAFNQSRYHAVVSESLAPGSPVLQVFASDADAGVNGAV
       :.: :.. . . :..::.::: : :.:: :.. : :... :. ::.: :.: : :.:: :
CCDS75 GDPIRKGAVPIRVVVLDVNDHIPMFTQSVYRVSVPENISSGTRVLMVNATDPDEGINGEV
      220       230       240       250       260       270        

              300       310       320       330       340       350
pF1KA1 TYEINRRQSEGDGPFSIDAHTGLLQLERPLDFEQRRVHELVVQARDGGAHPELGSAFVTV
        : .   .:...  :..:..:: .:..  ::::. : .:. .:..:::.     . ..::
CCDS75 MYSFRNMESKASEIFQLDSQTGEVQVRGSLDFEKYRFYEMEIQGQDGGGLFTTTTMLITV
      280       290       300       310       320       330        

              360       370       380       390       400       410
pF1KA1 HVRDANDNQPSMTVIFLSADGSPQVSEAAPPGQLVARISVSDPDDGDFAHVNVSLEGGEG
          :.::: : .:.   :. .:  . : .::: ..: ..:.: :.:. ..:.  . . . 
CCDS75 --VDVNDNAPEITIT--SSINS--ILENSPPGTVIALLNVQDQDSGENGQVSCFIPN-HL
        340       350           360       370       380        390 

              420       430       440       450       460       470
pF1KA1 HFALSTQDSVIYLVCVARRLDREERDAYNLRVTATDSGSPPLRAEAAFVLHVTDVNDNAP
        : :    .  : . ..: ::::  ..::. .::::.::::: ::.   :.:.: ::: :
CCDS75 PFKLEKTYGNYYKLITSRVLDRELVQSYNITLTATDQGSPPLSAETHVWLNVADDNDNPP
             400       410       420       430       440       450 

              480       490       500       510            520     
pF1KA1 AFDRQLYRPEPLPEVALPGSFVVRVTARDPDQGTNGQVTYSLAPGA-----HTHWFSIDP
       .: .. :    .::    :. .  ::: :::.  :. :::::.  .      . . ::. 
CCDS75 VFPHSSYSAY-IPENNPRGASIFSVTALDPDSKQNALVTYSLTDDTVQGVPLSSYVSINS
             460        470       480       490       500       510

         530       540       550       560       570         580   
pF1KA1 TSGIITTAASLDYELEPQPQLIVVATDGGLPPLASSATVSVALQDVNDNEPQ--FQRTFY
       ..:.. .  :.:::   . .: :.: :.: :::.:....:. . : ::: :.  .     
CCDS75 NTGVLYALQSFDYEQFRDLELRVIARDSGDPPLSSNVSLSLFVLDQNDNAPEILYPALPT
              520       530       540       550       560       570

                590       600       610       620       630        
pF1KA1 NASL-----PEGTQPGTCFLQVTATDADSGPFGLLSYSLGAGLGSSGSPPFRIDAHSGDV
       ..:      :....::    .:.:.: :::  . ::: :   : .:    : .  :.:.:
CCDS75 DGSTGVELAPRSAEPGYLVTKVVAVDKDSGQNAWLSYRL---LKASEPGLFAVGEHTGEV
              580       590       600          610       620       

      640        650       660          670       680       690    
pF1KA1 CTTRTL-DRDQGPSSFDFTVTAVDGGG---LKSMVYVKVFLSDENDNPPQFYPREYAASI
        :.:.: :::   .:.   :.::.  :   :.. : . : ..:                 
CCDS75 RTARALLDRDALKQSL---VVAVQDHGQPPLSATVTLTVAVADSIPEVLADLGSLESLAN
       630       640          650       660       670       680    

          700       710       720       730       740       750    
pF1KA1 SAQSPPGTAVLRLRAHDPDQGSHGRLSYHILAGNSPPLFTLDEQSGLLTVAWPLARRANS
                                                                   
CCDS75 SETSDLSLYLVVAVAAVSCIFLVFVIVLLALRLWRWHKSRLLQASEGGLAGMPTSHFVGV
          690       700       710       720       730       740    




3298 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Thu Nov  3 20:10:55 2016 done: Thu Nov  3 20:10:58 2016
 Total Scan time: 11.210 Total Display time:  3.230

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com