Result of FASTA (ccds) for pFN21AB6257
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB6257, 763 aa
  1>>>pF1KB6257 763 - 763 aa - 763 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.5822+/-0.000939; mu= 2.5774+/- 0.056
 mean_var=243.3522+/-50.682, 0's: 0 Z-trim(113.1): 86  B-trim: 390 in 2/53
 Lambda= 0.082216
 statistics sampled from 13695 (13781) to 13695 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.423), width:  16
 Scan time:  3.480

The best scores are:                                      opt bits E(32554)
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12           ( 763) 5046 611.9 1.2e-174
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12          ( 750) 4954 601.0 2.3e-171
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12          ( 753) 4954 601.0 2.3e-171
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12          ( 728) 4444 540.5 3.6e-153
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12          ( 377) 2490 308.5 1.3e-83
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12          ( 642) 2467 305.9 1.3e-82
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11          ( 808) 1436 183.7 9.9e-46
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11         ( 801) 1112 145.3 3.7e-34
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11         ( 804) 1112 145.3 3.7e-34
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1          ( 622)  836 112.5 2.1e-24


>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12                (763 aa)
 initn: 5046 init1: 5046 opt: 5046  Z-score: 3248.9  bits: 611.9 E(32554): 1.2e-174
Smith-Waterman score: 5046; 100.0% identity (100.0% similar) in 763 aa overlap (1-763:1-763)

               10        20        30        40        50        60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
              670       680       690       700       710       720

              730       740       750       760   
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::
CCDS86 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
              730       740       750       760   

>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12               (750 aa)
 initn: 4954 init1: 4954 opt: 4954  Z-score: 3190.1  bits: 601.0 E(32554): 2.3e-171
Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:1-750)

               10        20        30        40        50        60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                    :::::::::::::::::::::::::::::::::::::::::::::::
CCDS44              MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                            10        20        30        40       

               70        80        90       100       110       120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
        50        60        70        80        90       100       

              130       140       150       160       170       180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       110       120       130       140       150       160       

              190       200       210       220       230       240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       170       180       190       200       210       220       

              250       260       270       280       290       300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       230       240       250       260       270       280       

              310       320       330       340       350       360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       290       300       310       320       330       340       

              370       380       390       400       410       420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       350       360       370       380       390       400       

              430       440       450       460       470       480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
       410       420       430       440       450       460       

              490       500       510       520       530       540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
       470       480       490       500       510       520       

              550       560       570       580       590       600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       530       540       550       560       570       580       

              610       620       630       640       650       660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       590       600       610       620       630       640       

              670       680       690       700       710       720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       650       660       670       680       690       700       

              730       740       750       760   
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::
CCDS44 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       710       720       730       740       750

>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12               (753 aa)
 initn: 4954 init1: 4954 opt: 4954  Z-score: 3190.1  bits: 601.0 E(32554): 2.3e-171
Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:4-753)

               10        20        30        40        50        60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                    :::::::::::::::::::::::::::::::::::::::::::::::
CCDS58           MSVMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                         10        20        30        40        50

               70        80        90       100       110       120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
               60        70        80        90       100       110

              130       140       150       160       170       180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
              120       130       140       150       160       170

              190       200       210       220       230       240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
              180       190       200       210       220       230

              250       260       270       280       290       300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
              240       250       260       270       280       290

              310       320       330       340       350       360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
              300       310       320       330       340       350

              370       380       390       400       410       420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
              360       370       380       390       400       410

              430       440       450       460       470       480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
              420       430       440       450       460       470

              490       500       510       520       530       540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
              480       490       500       510       520       530

              550       560       570       580       590       600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
              540       550       560       570       580       590

              610       620       630       640       650       660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
              600       610       620       630       640       650

              670       680       690       700       710       720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
              660       670       680       690       700       710

              730       740       750       760   
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::
CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
              720       730       740       750   

>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12               (728 aa)
 initn: 4430 init1: 4430 opt: 4444  Z-score: 2863.3  bits: 540.5 E(32554): 3.6e-153
Smith-Waterman score: 4721; 95.4% identity (95.4% similar) in 763 aa overlap (1-763:1-728)

               10        20        30        40        50        60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::     
CCDS81 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLH-----
               10        20        30        40        50          

               70        80        90       100       110       120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
                                     ::::::::::::::::::::::::::::::
CCDS81 ------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
                                        60        70        80     

              130       140       150       160       170       180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
          90       100       110       120       130       140     

              190       200       210       220       230       240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
         150       160       170       180       190       200     

              250       260       270       280       290       300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
         210       220       230       240       250       260     

              310       320       330       340       350       360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
         270       280       290       300       310       320     

              370       380       390       400       410       420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
         330       340       350       360       370       380     

              430       440       450       460       470       480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
         390       400       410       420       430       440     

              490       500       510       520       530       540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
         450       460       470       480       490       500     

              550       560       570       580       590       600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
         510       520       530       540       550       560     

              610       620       630       640       650       660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
         570       580       590       600       610       620     

              670       680       690       700       710       720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
         630       640       650       660       670       680     

              730       740       750       760   
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::
CCDS81 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
         690       700       710       720        

>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12               (377 aa)
 initn: 2490 init1: 2490 opt: 2490  Z-score: 1614.8  bits: 308.5 E(32554): 1.3e-83
Smith-Waterman score: 2490; 100.0% identity (100.0% similar) in 375 aa overlap (389-763:3-377)

      360       370       380       390       400       410        
pF1KB6 GIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP
                                     ::::::::::::::::::::::::::::::
CCDS41                             MHDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP
                                           10        20        30  

      420       430       440       450       460       470        
pF1KB6 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
             40        50        60        70        80        90  

      480       490       500       510       520       530        
pF1KB6 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
            100       110       120       130       140       150  

      540       550       560       570       580       590        
pF1KB6 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
            160       170       180       190       200       210  

      600       610       620       630       640       650        
pF1KB6 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
            220       230       240       250       260       270  

      660       670       680       690       700       710        
pF1KB6 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE
            280       290       300       310       320       330  

      720       730       740       750       760   
pF1KB6 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
            340       350       360       370       

>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12               (642 aa)
 initn: 2590 init1: 2467 opt: 2467  Z-score: 1596.8  bits: 305.9 E(32554): 1.3e-82
Smith-Waterman score: 4036; 85.6% identity (85.6% similar) in 750 aa overlap (14-763:1-642)

               10        20        30        40        50        60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                    :::::::::::::::::::::::::::::::::::::::::::::::
CCDS58              MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
                            10        20        30        40       

               70        80        90       100       110       120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
        50        60        70        80        90       100       

              130       140       150       160       170       180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
       110       120       130       140       150       160       

              190       200       210       220       230       240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
       170       180       190       200       210       220       

              250       260       270       280       290       300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
       230       240       250       260       270       280       

              310       320       330       340       350       360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
       290       300       310       320       330       340       

              370       380       390       400       410       420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
       ::::::::::::::::::::::::::::                                
CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSK--------------------------------
       350       360       370                                     

              430       440       450       460       470       480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
                                                                   
CCDS58 ------------------------------------------------------------
                                                                   

              490       500       510       520       530       540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
                       ::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ----------------EKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
                         380       390       400       410         

              550       560       570       580       590       600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
     420       430       440       450       460       470         

              610       620       630       640       650       660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
     480       490       500       510       520       530         

              670       680       690       700       710       720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
     540       550       560       570       580       590         

              730       740       750       760   
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       :::::::::::::::::::::::::::::::::::::::::::
CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
     600       610       620       630       640  

>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11               (808 aa)
 initn: 2012 init1: 1053 opt: 1436  Z-score: 934.5  bits: 183.7 E(32554): 9.9e-46
Smith-Waterman score: 2822; 58.8% identity (78.0% similar) in 806 aa overlap (26-763:14-808)

               10        20        30           40        50       
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVS
                                :::: ::   .:::.:  :: ::   : :::::  
CCDS78             MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPI
                           10        20          30        40      

        60        70        80        90       100       110       
pF1KB6 FPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG
       . :::::::.  .    :.     .  :... :: ..::. : .. .:.::::.: .::.
CCDS78 MHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS
         50        60        70        80        90       100      

       120       130       140       150       160       170       
pF1KB6 RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKL
       :.  : ..:...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:.
CCDS78 RDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKM
         110       120       130       140       150       160     

       180        190       200       210       220       230      
pF1KB6 LAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQ
         ...... :::::::::::::::::  ::.:: ::::::::::::::::::::::::::
CCDS78 ERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQ
         170       180       190       200       210       220     

        240       250       260       270       280       290      
pF1KB6 QMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--
       ::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::  
CCDS78 QMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAA
         230       240       250       260       270       280     

          300       310       320       330                        
pF1KB6 QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQ---------------
       :::::.:::..:: :  : ::::.::.:::::::.  ::.:::::               
CCDS78 QQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQKGHVSHPQINQRLKG
         290       300         310         320       330       340 

                               340       350       360        370  
pF1KB6 --------------------------QLYAAQLAAMQVSPGGKLPGIPQG-NLGAAVSPT
                                 ::::::::.::::::.:.:. ::  : ...::::
CCDS78 LSDRFGRNLDTFEHGGGHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPT
             350       360       370       380       390       400 

            380       390        400        410       420       430
pF1KB6 SIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPALRINSGAGPLK
       .:...:  .::  . :::.: ::::::..:::..  :::::::.  .:: . .    : :
CCDS78 GIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNK
             410       420       430       440       450       460 

              440       450                460       470           
pF1KB6 ASVPAALASPSARVSTIGYLN---------DHDAVTKAIQEARQMKEQLRREQQV-----
       .:.:. ...  .: :..  :.         :.:.: :::::::.:.::..::::      
CCDS78 SSIPSPIGGSLGRGSSLDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHG
             470       480       490       500       510       520 

        480       490       500       510       520       530      
pF1KB6 LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAG
       .:::.. .:..:::.::.:::.: .:.:  ::. :.::.::.. ...:..   :..:.: 
CCDS78 VDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGGAT
             530       540       550       560       570       580 

        540       550       560       570       580       590      
pF1KB6 VSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKA
       :.:.:.::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.
CCDS78 VAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKS
             590       600       610       620       630       640 

        600       610       620       630       640       650      
pF1KB6 MTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEM
       :.: :::::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::
CCDS78 MSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEM
             650       660       670       680       690       700 

        660       670        680        690       700       710    
pF1KB6 RQYFNVGQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYG
       ::.:.:::: ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::
CCDS78 RQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYG
             710       720       730       740       750       760 

          720         730       740       750       760   
pF1KB6 VKGEEPHI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       .: .   .  .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS78 MKTDGGSLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
             770        780          790       800        

>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11              (801 aa)
 initn: 2204 init1: 867 opt: 1112  Z-score: 726.8  bits: 145.3 E(32554): 3.7e-34
Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:8-801)

               10        20         30           40        50      
pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
                           ::..  :::: ::   .:::.:  :: ::   : ::::: 
CCDS53              MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
                            10        20          30        40     

         60        70        80        90       100       110      
pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
        . :::::::.  .    :.     .  :... :: ..::. : .. .:.::::.: .::
CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
          50        60        70        80        90       100     

        120       130       140       150       160       170      
pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
       .:.  : ..:...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:
CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
          110       120       130       140       150       160    

        180        190       200       210       220       230     
pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
       .  ...... :::::::::::::::::  ::.:: :::::::::::::::::::::::::
CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
          170       180       190       200       210       220    

         240       250       260       270       280       290     
pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
       :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: 
CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
          230       240       250       260       270       280    

           300       310       320       330       340       350   
pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
        :::::.:::..:: :  : ::::.::.:::::::.  ::.:::::::::::::.:::::
CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
          290       300         310         320       330       340

           360        370       380       390        400        410
pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
       :.:.:. ::  : ...::::.:...:  .::  . :::.: ::::::..:::..  ::::
CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
              350       360       370       380       390       400

              420       430       440                        450   
pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
       :::.  .:: . .    : :.:.:. ...  .: :..:                  ::  
CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
              410       420       430       440       450       460

                 460       470            480       490       500  
pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
           :.:.: :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:
CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
              470       480       490       500       510       520

            510       520       530                           540  
pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
       .:  ::. :.::.::.. ...:..   :..::                    : :.:.:.
CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
              530       540       550       560       570       580

            550       560       570       580       590       600  
pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
       ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
              590       600       610       620       630       640

            610       620       630       640       650       660  
pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
       :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
              650       660       670       680       690       700

            670        680        690       700       710       720
pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::: ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::.: .  
CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
              710       720       730       740       750       760

                730       740       750       760   
pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
        .  .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
              770        780          790       800 

>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11              (804 aa)
 initn: 2204 init1: 867 opt: 1112  Z-score: 726.8  bits: 145.3 E(32554): 3.7e-34
Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:11-804)

               10        20         30           40        50      
pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
                           ::..  :::: ::   .:::.:  :: ::   : ::::: 
CCDS53           MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
                         10        20        30          40        

         60        70        80        90       100       110      
pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
        . :::::::.  .    :.     .  :... :: ..::. : .. .:.::::.: .::
CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
       50        60        70        80        90       100        

        120       130       140       150       160       170      
pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
       .:.  : ..:...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:
CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
      110        120       130       140       150       160       

        180        190       200       210       220       230     
pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
       .  ...... :::::::::::::::::  ::.:: :::::::::::::::::::::::::
CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
       170       180       190       200       210       220       

         240       250       260       270       280       290     
pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
       :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: 
CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
       230       240       250       260       270       280       

           300       310       320       330       340       350   
pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
        :::::.:::..:: :  : ::::.::.:::::::.  ::.:::::::::::::.:::::
CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
       290       300         310       320         330       340   

           360        370       380       390        400        410
pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
       :.:.:. ::  : ...::::.:...:  .::  . :::.: ::::::..:::..  ::::
CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
           350       360       370       380       390       400   

              420       430       440                        450   
pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
       :::.  .:: . .    : :.:.:. ...  .: :..:                  ::  
CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
           410       420       430       440       450       460   

                 460       470            480       490       500  
pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
           :.:.: :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:
CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
           470       480       490       500       510       520   

            510       520       530                           540  
pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
       .:  ::. :.::.::.. ...:..   :..::                    : :.:.:.
CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
           530       540       550       560       570       580   

            550       560       570       580       590       600  
pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
       ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
           590       600       610       620       630       640   

            610       620       630       640       650       660  
pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
       :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
           650       660       670       680       690       700   

            670        680        690       700       710       720
pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       ::: ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::.: .  
CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
           710       720       730       740       750       760   

                730       740       750       760   
pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
        .  .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
           770        780          790       800    

>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1               (622 aa)
 initn: 1270 init1: 679 opt: 836  Z-score: 551.4  bits: 112.5 E(32554): 2.1e-24
Smith-Waterman score: 1486; 43.6% identity (65.1% similar) in 685 aa overlap (75-755:30-616)

           50        60        70        80        90        100   
pF1KB6 DGLPAFHLPLHVSFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVD-GNKVMSSFAP
                                     .: : :..: .. .. : . :. . .:   
CCDS44  MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPC-HEAPQGSATAAEPQPGDPARAS---
                10        20        30         40        50        

           110        120       130       140       150       160  
pF1KB6 HNSSTSPQKAEEGG-RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEET
        ..:..::   .:. : : .  :  . :.:: .. .......  .:.:.. . .:  : .
CCDS44 -QDSADPQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASG-SQEKLD-FNRNLKEVV
           60        70        80        90        100        110  

            170       180       190       200       210       220  
pF1KB6 PSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDE
       :.::::::.:::...:. .: .  ..::: ::::::: ::. ::.::..::.:::.::.:
CCDS44 PAIEKLLSSDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSE
            120       130       140       150       160       170  

            230       240       250       260       270       280  
pF1KB6 QKKLAASQIEKQRQQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPV
       ::..::  .:::.::::::.:::::::.:::::.:::::::::::::: : ..: .:::.
CCDS44 QKNMAAMLFEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPA
            180       190       200       210       220        230 

            290       300       310       320       330       340  
pF1KB6 FPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLY
       :::... : .. .. . ::              .: ::          :   :::: .  
CCDS44 FPPSHQPLPVTPDSQLALP--------------IQPIPC--------KPVEYPLQLLHSP
             240       250                             260         

            350       360       370       380       390       400  
pF1KB6 AAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPK
        :        :  : ::                   .:. :     .: .:::::.::::
CCDS44 PA--------PVVKRPGA-----------------MATHHP----LQEPSQPLNLTAKPK
     270                                280           290       300

            410       420        430       440       450       460 
pF1KB6 TSDGKSPTSPTSPHMPALRINSGAG-PLKASVPAALASPSARVSTIGYLNDHDAVTKAIQ
            .:  :..   :.:...: .  : . . :.   . :     .:.:.. ::::::::
CCDS44 -----APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQ
                   310       320       330       340       350     

             470       480       490       500       510       520 
pF1KB6 EARQMKEQLRREQQVLDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHA
       .:::.   :. .. .:::.          :   .:.  .:.:      .:.  :    : 
CCDS44 DARQL---LHSHSGALDGS---------PNTPFRKDLISLDSSP----AKERLEDGCVHP
         360          370                380           390         

             530       540       550       560       570       580 
pF1KB6 MMDFNLSGDSDGSAGVSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDM
       . .  :: : :::    :::          :  :::::::::::::::::::::::::::
CCDS44 LEEAMLSCDMDGSRHFPESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDM
     400       410                 420       430       440         

             590       600       610       620       630       640 
pF1KB6 HNSNISKILGSRWKAMTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLR
       :::.::::::::::.::: :::::::::::::.:::::::::::::::::::.:.::.::
CCDS44 HNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLR
     450       460       470       480       490       500         

             650       660        670       680       690       700
pF1KB6 IGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSS
       .:::::.::.:::. :: . .  :: :. .... :.:: :   ::::  .   ::  :  
CCDS44 VGEYKALMRTRRQDARQSYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPR
     510       520       530       540          550       560      

              710       720       730       740       750       760
pF1KB6 SPEPGMPVIQSTYGVKGEEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAG
       : .:.:::: .: ... :     .. .. :  ::.: .:.:.::. . .  ::.:     
CCDS44 SLDPNMPVIVNTCSLREEGEGTDDRHSVAD--GEMY-RYSEDEDS-EGEEKSDGELVVLT
         570       580       590          600        610       620 

          
pF1KB6 QAN
          
CCDS44 D  
          




763 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Mon Nov  7 15:14:12 2016 done: Mon Nov  7 15:14:13 2016
 Total Scan time:  3.480 Total Display time:  0.230

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com