Result of FASTA (ccds) for pF1KB8405
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB8405, 804 aa
  1>>>pF1KB8405 804 - 804 aa - 804 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 11.5709+/-0.00113; mu= -8.5696+/- 0.067
 mean_var=287.9050+/-58.514, 0's: 0 Z-trim(111.8): 78  B-trim: 0 in 0/54
 Lambda= 0.075587
 statistics sampled from 12560 (12632) to 12560 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.388), width:  16
 Scan time:  4.780

The best scores are:                                      opt bits E(32554)
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11         ( 804) 5326 594.8 1.9e-169
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11         ( 801) 5304 592.4 9.9e-169
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11          ( 808) 3630 409.8 8.9e-114
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12          ( 750) 1112 135.2 3.8e-31
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12          ( 753) 1112 135.2 3.8e-31
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12           ( 763) 1112 135.2 3.9e-31
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12          ( 377) 1090 132.7 1.1e-30
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12          ( 642) 1091 132.9 1.6e-30
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12          ( 728) 1091 132.9 1.8e-30
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1          ( 622)  739 94.5 5.7e-19


>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11              (804 aa)
 initn: 5326 init1: 5326 opt: 5326  Z-score: 3155.7  bits: 594.8 E(32554): 1.9e-169
Smith-Waterman score: 5326; 100.0% identity (100.0% similar) in 804 aa overlap (1-804:1-804)

               10        20        30        40        50        60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
              550       560       570       580       590       600

              610       620       630       640       650       660
pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
              610       620       630       640       650       660

              670       680       690       700       710       720
pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
              670       680       690       700       710       720

              730       740       750       760       770       780
pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
              730       740       750       760       770       780

              790       800    
pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN
       ::::::::::::::::::::::::
CCDS53 DDYEDDPKSDYSSENEAPEAVSAN
              790       800    

>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11              (801 aa)
 initn: 5304 init1: 5304 opt: 5304  Z-score: 3142.8  bits: 592.4 E(32554): 9.9e-169
Smith-Waterman score: 5304; 100.0% identity (100.0% similar) in 801 aa overlap (4-804:1-801)

               10        20        30        40        50        60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
          :::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53    MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
                  10        20        30        40        50       

               70        80        90       100       110       120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
        60        70        80        90       100       110       

              130       140       150       160       170       180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
       120       130       140       150       160       170       

              190       200       210       220       230       240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
       180       190       200       210       220       230       

              250       260       270       280       290       300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
       240       250       260       270       280       290       

              310       320       330       340       350       360
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTPQPPNTAGTV
       300       310       320       330       340       350       

              370       380       390       400       410       420
pF1KB8 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNL
       360       370       380       390       400       410       

              430       440       450       460       470       480
pF1KB8 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEAR
       420       430       440       450       460       470       

              490       500       510       520       530       540
pF1KB8 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLG
       480       490       500       510       520       530       

              550       560       570       580       590       600
pF1KB8 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRP
       540       550       560       570       580       590       

              610       620       630       640       650       660
pF1KB8 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEK
       600       610       620       630       640       650       

              670       680       690       700       710       720
pF1KB8 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYP
       660       670       680       690       700       710       

              730       740       750       760       770       780
pF1KB8 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMY
       720       730       740       750       760       770       

              790       800    
pF1KB8 DDYEDDPKSDYSSENEAPEAVSAN
       ::::::::::::::::::::::::
CCDS53 DDYEDDPKSDYSSENEAPEAVSAN
       780       790       800 

>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11               (808 aa)
 initn: 3671 init1: 2133 opt: 3630  Z-score: 2156.1  bits: 409.8 E(32554): 8.9e-114
Smith-Waterman score: 4879; 91.1% identity (91.1% similar) in 842 aa overlap (4-804:1-808)

               10        20        30        40        50        60
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
          :::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78    MSSKQATSPFACAADGEDAMTQDLTSREKEEGSDQHVASHLPLHPIMHNKPHSEELP
                  10        20        30        40        50       

               70        80        90       100       110       120
pF1KB8 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 TLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDREIMTSVTF
        60        70        80        90       100       110       

              130       140       150       160       170       180
pF1KB8 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 GTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEI
       120       130       140       150       160       170       

              190       200       210       220       230       240
pF1KB8 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQI
       180       190       200       210       220       230       

              250       260       270       280       290       300
pF1KB8 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITY
       240       250       260       270       280       290       

              310       320                                        
pF1KB8 KPGDNYPVQFIPSTMAAAAASGLSPLQLQ-------------------------------
       :::::::::::::::::::::::::::::                               
CCDS78 KPGDNYPVQFIPSTMAAAAASGLSPLQLQKGHVSHPQINQRLKGLSDRFGRNLDTFEHGG
       300       310       320       330       340       350       

               330       340       350       360       370         
pF1KB8 ----------QLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK
                 ::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 GHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVK
       360       370       380       390       400       410       

     380       390       400       410       420       430         
pF1KB8 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 DEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSS
       420       430       440       450       460       470       

     440       450       460       470       480       490         
pF1KB8 LGKWKSQHQEETYELDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD
                     ::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 --------------LDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVD
                     480       490       500       510       520   

     500       510       520       530       540       550         
pF1KB8 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMN
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::     
CCDS78 GKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEG-----
           530       540       550       560       570             

     560       570       580       590       600       610         
pF1KB8 GSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF
                      :::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ---------------GATVAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAF
                     580       590       600       610       620   

     620       630       640       650       660       670         
pF1KB8 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 PDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGK
           630       640       650       660       670       680   

     680       690       700       710       720       730         
pF1KB8 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCS
           690       700       710       720       730       740   

     740       750       760       770       780       790         
pF1KB8 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 STSASPEPSLPVIQSTYGMKTDGGSLAGNEMINGEDEMEMYDDYEDDPKSDYSSENEAPE
           750       760       770       780       790       800   

     800    
pF1KB8 AVSAN
       :::::
CCDS78 AVSAN
            

>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12               (750 aa)
 initn: 2204 init1: 867 opt: 1112  Z-score: 672.6  bits: 135.2 E(32554): 3.8e-31
Smith-Waterman score: 2874; 59.5% identity (78.8% similar) in 812 aa overlap (4-804:1-750)

               10        20        30          40        50        
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
          ::::. .::..  :::: ::   .:::.:  :: ::   : :::::  . :::::::
CCDS44    MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
                  10            20        30        40        50   

       60        70        80        90       100       110        
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
       .  .    :.     .  :... :: ..::. : .. .:.::::.: .::.:.  : ..:
CCDS44 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
            60        70        80        90       100       110   

       120       130       140       150       160       170       
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
       ...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:.  ...... 
CCDS44 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
           120       130       140       150       160       170   

       180       190       200       210       220       230       
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
       :::::::::::::::::  ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS44 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
            180       190       200       210       220       230  

       240       250       260       270       280       290       
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
       ::::::::::::::::::::::::::::..::::::.:: ::::::::  ::::::.:::
CCDS44 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAA--AQQGFLLPPG
            240       250       260       270       280         290

       300         310       320         330       340       350   
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
       ..:: :  : ::::.::.:::::::.  ::.:::::::::::::.::::::.:.:. :: 
CCDS44 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
              300       310       320       330       340       350

           360       370       380       390       400       410   
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
        : ...::::.:...:  .::  . :::.: ::::::..:::..  :::::::.  .:: 
CCDS44 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL
               360       370        380       390        400       

           420       430       440       450       460       470   
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
       . .    : :.:.:. ...  .: :..:                  ::      :.:.: 
CCDS44 RINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------DHDAVT
       410       420       430                              440    

           480       490       500       510       520       530   
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
       :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:.:  ::. :.
CCDS44 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ
          450       460            470       480       490         

           540       550       560       570       580       590   
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
       ::.::.. ...:..   :..::                    : :.:.:.::..:::.:.
CCDS44 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
     500       510       520                           530         

           600       610       620       630       640       650   
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
       :::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS44 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
     540       550       560       570       580       590         

           660       670       680       690       700       710   
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
       :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS44 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
     600       610       620       630       640       650         

           720       730       740       750       760       770   
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
       . ::::::::.::   :::.. :. ::.:.::::..::::::::.: .   .  .: :..
CCDS44 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
     660        670        680       690       700         710     

            780          790       800    
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
       :: . :.::.:   ::::  ::.:..:   : .::
CCDS44 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
         720       730       740       750

>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12               (753 aa)
 initn: 2204 init1: 867 opt: 1112  Z-score: 672.6  bits: 135.2 E(32554): 3.8e-31
Smith-Waterman score: 2878; 59.5% identity (78.9% similar) in 815 aa overlap (1-804:1-753)

               10        20        30          40        50        
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
       :. ::::. .::..  :::: ::   .:::.:  :: ::   : :::::  . :::::::
CCDS58 MSVMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
               10         20           30        40        50      

       60        70        80        90       100       110        
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
       .  .    :.     .  :... :: ..::. : .. .:.::::.: .::.:.  : ..:
CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
         60        70        80        90       100       110      

       120       130       140       150       160       170       
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
       ...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:.  ...... 
CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
        120       130       140       150       160       170      

       180       190       200       210       220       230       
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
       :::::::::::::::::  ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
         180       190       200       210       220       230     

       240       250       260       270       280       290       
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
       ::::::::::::::::::::::::::::..::::::.:: :::::::::  :::::.:::
CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG
         240       250       260       270       280         290   

       300         310       320         330       340       350   
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
       ..:: :  : ::::.::.:::::::.  ::.:::::::::::::.::::::.:.:. :: 
CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
           300       310       320       330       340       350   

           360       370       380       390       400       410   
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
        : ...::::.:...:  .::  . :::.: ::::::..:::..  :::::::.  .:: 
CCDS58 -NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPAL
            360       370       380        390        400       410

           420       430       440       450       460       470   
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
       . .    : :.:.:. ...  .: :..:          :       ::      :.:.: 
CCDS58 RINSGAGPLKASVPAALASPSARVSTIG----------Y-------LN------DHDAVT
              420       430                        440             

           480       490       500       510       520       530   
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
       :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:.:  ::. :.
CCDS58 KAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQ
       450       460            470       480       490       500  

           540       550       560       570       580       590   
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
       ::.::.. ...:..   :..::                    : :.:.:.::..:::.:.
CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
            510       520                           530       540  

           600       610       620       630       640       650   
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
       :::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
            550       560       570       580       590       600  

           660       670       680       690       700       710   
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
       :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
            610       620       630       640       650       660  

           720       730       740       750       760       770   
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
       . ::::::::.::   :::.. :. ::.:.::::..::::::::.: .   .  .: :..
CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
             670        680       690       700       710          

            780          790       800    
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
       :: . :.::.:   ::::  ::.:..:   : .::
CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
      720       730       740       750   

>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12                (763 aa)
 initn: 2204 init1: 867 opt: 1112  Z-score: 672.5  bits: 135.2 E(32554): 3.9e-31
Smith-Waterman score: 2881; 59.5% identity (78.8% similar) in 813 aa overlap (3-804:13-763)

                         10        20        30          40        
pF1KB8           MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
                   :::::. .::..  :::: ::   .:::.:  :: ::   : ::::: 
CCDS86 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
               10        20         30           40        50      

       50        60        70        80        90       100        
pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
        . :::::::.  .    :.     .  :... :: ..::. : .. .:.::::.: .::
CCDS86 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
         60        70        80        90       100       110      

      110        120       130       140       150       160       
pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
       .:.  : ..:...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:
CCDS86 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
        120       130       140       150       160       170      

       170       180       190       200       210       220       
pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
       .  ...... :::::::::::::::::  ::.:: :::::::::::::::::::::::::
CCDS86 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
        180        190       200       210       220       230     

       230       240       250       260       270       280       
pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
       :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: 
CCDS86 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
         240       250       260       270       280       290     

       290       300         310       320         330       340   
pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
        :::::.:::..:: :  : ::::.::.:::::::.  ::.:::::::::::::.:::::
CCDS86 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
           300       310       320       330       340       350   

           350       360       370       380       390       400   
pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
       :.:.:. ::  : ...::::.:...:  .::  . :::.: ::::::..:::..  ::::
CCDS86 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
           360        370       380       390        400        410

           410       420       430       440       450       460   
pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
       :::.  .:: . .    : :.:.:. ...  .: :..:                  ::  
CCDS86 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
              420       430       440                        450   

           470       480       490       500       510       520   
pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
           :.:.: :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:
CCDS86 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
                 460       470            480       490       500  

           530       540       550       560       570       580   
pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
       .:  ::. :.::.::.. ...:..   :..::                    : :.:.:.
CCDS86 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
            510       520       530                           540  

           590       600       610       620       630       640   
pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
       ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS86 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
            550       560       570       580       590       600  

           650       660       670       680       690       700   
pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
       :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS86 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
            610       620       630       640       650       660  

           710       720       730       740       750       760   
pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
       ::: ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::.: .  
CCDS86 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
            670        680        690       700       710       720

           770        780          790       800    
pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
        .  .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS86 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
                730       740       750       760   

>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12               (377 aa)
 initn: 1071 init1: 867 opt: 1090  Z-score: 664.4  bits: 132.7 E(32554): 1.1e-30
Smith-Waterman score: 1412; 55.5% identity (75.6% similar) in 431 aa overlap (378-804:1-377)

       350       360       370       380       390       400       
pF1KB8 PSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQ
                                     ..::.: ::::::..:::..  :::::::.
CCDS41                               MHDEVA-QPLNLSAKPKTSDG-KSPTSPTS
                                              10        20         

       410       420       430       440       450       460       
pF1KB8 NLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFG
         .:: . .    : :.:.:. ...  .: :..:                  ::      
CCDS41 PHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN------
       30        40        50        60                            

       470       480       490       500       510       520       
pF1KB8 DQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGP
       :.:.: :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:.:  
CCDS41 DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLESLTQ
          70        80        90            100       110       120

       530       540       550       560       570       580       
pF1KB8 QLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDA
       ::. :.::.::.. ...:..   :..::                    : :.:.:.::..
CCDS41 QLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRES
              130       140                           150       160

       590       600       610       620       630       640       
pF1KB8 RGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYY
       :::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::::::
CCDS41 RGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYY
              170       180       190       200       210       220

       650       660       670       680       690       700       
pF1KB8 EEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP
       :::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: 
CCDS41 EEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA
              230       240       250       260       270       280

       710       720       730       740       750       760       
pF1KB8 QIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAG
       ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::.: .   .  
CCDS41 QIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--
               290       300        310       320       330        

       770        780          790       800    
pF1KB8 NEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
       .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS41 KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
        340       350       360       370       

>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12               (642 aa)
 initn: 1682 init1: 867 opt: 1091  Z-score: 661.3  bits: 132.9 E(32554): 1.6e-30
Smith-Waterman score: 2316; 52.7% identity (68.0% similar) in 812 aa overlap (4-804:1-642)

               10        20        30          40        50        
pF1KB8 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPIMHNKPHSEE
          ::::. .::..  :::: ::   .:::.:  :: ::   : :::::  . :::::::
CCDS58    MSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVSFPNKPHSEE
                  10            20        30        40        50   

       60        70        80        90       100       110        
pF1KB8 LPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGSRDR-EIMTS
       .  .    :.     .  :... :: ..::. : .. .:.::::.: .::.:.  : ..:
CCDS58 FQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQSGESLSS
            60        70        80        90       100       110   

       120       130       140       150       160       170       
pF1KB8 VTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELL
       ...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:.  ...... 
CCDS58 TALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNF-
           120       130       140       150       160       170   

       180       190       200       210       220       230       
pF1KB8 GEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQ
       :::::::::::::::::  ::.:: ::::::::::::::::::::::::::::.::.:::
CCDS58 GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQ
            180       190       200       210       220       230  

       240       250       260       270       280       290       
pF1KB8 EQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPG
       ::::::::::::::::::::::::::::..::::::.:: :::::::::  :::::.:::
CCDS58 EQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--QQGFLLPPG
            240       250       260       270       280         290

       300         310       320         330       340       350   
pF1KB8 ITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSPGAKMPSTPQP
       ..:: :  : ::::.::.:::::::.  ::.:::::::::::::.::::::.:.:. :: 
CCDS58 FSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQG
              300       310       320       330       340       350

           360       370       380       390       400       410   
pF1KB8 PNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPAS
        : ...::::.:...:  .::                                       
CCDS58 -NLGAAVSPTSIHTDKSTNSP---------------------------------------
               360       370                                       

           420       430       440       450       460       470   
pF1KB8 KTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSPALFGDQDTVM
              : ::                                                 
CCDS58 -------PPKS-------------------------------------------------
                                                                   

           480       490       500       510       520       530   
pF1KB8 KAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKS
                                                  ::.: .:.:  ::. :.
CCDS58 -------------------------------------------KEKTTLESLTQQLAVKQ
                                                     380       390 

           540       550       560       570       580       590   
pF1KB8 NEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASS
       ::.::.. ...:..   :..::                    : :.:.:.::..:::.:.
CCDS58 NEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRIYRESRGRGSN
             400       410                           420       430 

           600       610       620       630       640       650   
pF1KB8 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARL
       :::::::::::::::::::::::::::::::::::::::::::.:.: ::::::::::::
CCDS58 EPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARL
             440       450       460       470       480       490 

           660       670       680       690       700       710   
pF1KB8 SKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQPQIPITT
       :: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:::: ::::.:
CCDS58 SKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQAQIPIAT
             500       510       520       530       540       550 

           720       730       740       750       760       770   
pF1KB8 GTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGGSLAGNEMING
       . ::::::::.::   :::.. :. ::.:.::::..::::::::.: .   .  .: :..
CCDS58 A-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHI--KEEIQA
              560        570       580       590       600         

            780          790       800    
pF1KB8 ED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
       :: . :.::.:   ::::  ::.:..:   : .::
CCDS58 EDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
       610       620       630       640  

>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12               (728 aa)
 initn: 2156 init1: 867 opt: 1091  Z-score: 660.5  bits: 132.9 E(32554): 1.8e-30
Smith-Waterman score: 2755; 58.3% identity (76.6% similar) in 813 aa overlap (3-804:13-728)

                         10        20        30          40        
pF1KB8           MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
                   :::::. .::..  :::: ::   .:::.:  :: ::   : ::::: 
CCDS81 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLH-
               10        20         30           40        50      

       50        60        70        80        90       100        
pF1KB8 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
                                         : ..::. : .. .:.::::.: .::
CCDS81 ----------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEG
                                            60        70        80 

      110        120       130       140       150       160       
pF1KB8 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
       .:.  : ..:...:::::::::::::::::::.:.::. ..: :..  .:::::::::.:
CCDS81 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
              90       100       110       120       130       140 

       170       180       190       200       210       220       
pF1KB8 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
       .  ...... :::::::::::::::::  ::.:: :::::::::::::::::::::::::
CCDS81 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
             150        160       170       180       190       200

       230       240       250       260       270       280       
pF1KB8 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
       :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: 
CCDS81 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
              210       220       230       240       250          

       290       300         310       320         330       340   
pF1KB8 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
        :::::.:::..:: :  : ::::.::.:::::::.  ::.:::::::::::::.:::::
CCDS81 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
      260       270       280       290       300       310        

           350       360       370       380       390       400   
pF1KB8 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
       :.:.:. ::  : ...::::.:...:  .::  . :::.: ::::::..:::..  ::::
CCDS81 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
      320        330       340       350        360       370      

           410       420       430       440       450       460   
pF1KB8 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
       :::.  .:: . .    : :.:.:. ...  .: :..:                  ::  
CCDS81 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
         380       390       400       410                         

           470       480       490       500       510       520   
pF1KB8 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
           :.:.: :::::::.:.::..::::      .:::.. .:..:::.::.:::.: .:
CCDS81 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
            420       430       440            450       460       

           530       540       550       560       570       580   
pF1KB8 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
       .:  ::. :.::.::.. ...:..   :..::                    : :.:.:.
CCDS81 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
       470       480       490                           500       

           590       600       610       620       630       640   
pF1KB8 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
       ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS81 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
       510       520       530       540       550       560       

           650       660       670       680       690       700   
pF1KB8 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
       :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS81 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
       570       580       590       600       610       620       

           710       720       730       740       750       760   
pF1KB8 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
       ::: ::::.:. ::::::::.::   :::.. :. ::.:.::::..::::::::.: .  
CCDS81 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
       630        640       650        660       670       680     

           770        780          790       800    
pF1KB8 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
        .  .: :..:: . :.::.:   ::::  ::.:..:   : .::
CCDS81 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
           690       700       710       720        

>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1               (622 aa)
 initn: 1248 init1: 694 opt: 739  Z-score: 454.1  bits: 94.5 E(32554): 5.7e-19
Smith-Waterman score: 1237; 39.7% identity (58.7% similar) in 702 aa overlap (99-790:58-614)

       70        80        90       100        110       120       
pF1KB8 DADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS-RDREIMTSVTF-GTPERR
                                     :..:. : .:. :     .:    :.:: .
CCDS44 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
        30        40        50        60        70        80       

        130       140       150       160       170       180      
pF1KB8 KGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEIKGTPES
       . ...... . .:.::. ..:. .:    .:::::.::::..   :. :   ..::: ::
CCDS44 RPGVSEAA-SGSQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEA-KDVKGTQES
        90        100        110       120       130        140    

        190       200       210       220       230       240      
pF1KB8 LAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQIARQQQQ
       ::::: :: .:: :: .::.:::.::.:::..::  .:::.:::.::::::::::.::::
CCDS44 LAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQ
          150       160       170       180       190       200    

        250       260       270       280       290       300      
pF1KB8 LLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITYKPGDNY
       :.:::::::::::::: : .:: .::: :: ... : ..  .: .. . : :  :: . :
CCDS44 LIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALPIQP-IPCKPVE-Y
          210       220        230       240       250        260  

        310       320       330       340       350        360     
pF1KB8 PVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-QPPNTAGTVSPTGI
       :.:.. :  : ..                       :::     : : :.          
CCDS44 PLQLLHSPPAPVVKR---------------------PGAMATHHPLQEPS----------
             270                            280       290          

         370       380       390       400       410       420     
pF1KB8 KNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSS
                          :::::...::. :            .: ...:: .:  .: 
CCDS44 -------------------QPLNLTAKPKAPE------------LPNTSSSP-SLKMSSC
                                 300                   310         

         430       440       450       460         470       480   
pF1KB8 IPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-PALF-GDQDTVMKAIQEARKMR
       .: :                .:   :   :. ::  : :  : :. :.: ::::.::.. 
CCDS44 VPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGDAVTKAIQDARQL-
      320                      330         340       350       360 

           490       500       510       520       530       540   
pF1KB8 EQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGV
               ...  ..::. ..     : :  .   . :.:            :: . :  
CCDS44 -------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE------------DGCVHPL-
                     370       380       390                   400 

           550       560       570       580       590       600   
pF1KB8 IDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGRASSEPHIKRPMNA
             :.:  :  :.::                    : . ..:. .    ::::::::
CCDS44 ------EEAMLSCDMDGS--------------------RHFPESRNSS----HIKRPMNA
                    410                           420           430

           610       620       630       640       650       660   
pF1KB8 FMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSKIHLEKYPN
       ::::::::::::::::::::::.::::::::::::.:::::::::::::::. ::::::.
CCDS44 FMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPD
              440       450       460       470       480       490

           670       680       690       700        710       720  
pF1KB8 YKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QIPITTGTGVVYPGA
       :::::::::::::.::.::.:::: :::.:::. :: ...  :  :. ... . :.:: :
CCDS44 YKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSS-SDVLYPRA
              500       510       520       530       540          

            730       740       750       760        770       780 
pF1KB8 ITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGNEMINGEDEMEMYD
         :  . :  .       .  : .:..::: .: ... .: :.   . . .::  :  :.
CCDS44 AGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGE--MYRYS
     550       560            570       580       590         600  

                790       800    
pF1KB8 DYED---DPKSDYSSENEAPEAVSAN
       . ::   . :::              
CCDS44 EDEDSEGEEKSDGELVVLTD      
            610       620        




804 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 12:39:29 2016 done: Fri Nov  4 12:39:30 2016
 Total Scan time:  4.780 Total Display time:  0.250

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com