Result of FASTA (ccds) for pF1KB3072
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB3072, 622 aa
  1>>>pF1KB3072 622 - 622 aa - 622 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.5046+/-0.000997; mu= -2.5081+/- 0.060
 mean_var=313.9237+/-64.070, 0's: 0 Z-trim(114.7): 77  B-trim: 524 in 1/55
 Lambda= 0.072387
 statistics sampled from 15181 (15254) to 15181 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.469), width:  16
 Scan time:  4.240

The best scores are:                                      opt bits E(32554)
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1          ( 622) 4224 454.8 1.5e-127
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12          ( 728)  836 101.1 5.6e-21
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12          ( 750)  836 101.1 5.7e-21
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12          ( 753)  836 101.1 5.8e-21
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12           ( 763)  836 101.1 5.8e-21
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12          ( 642)  820 99.3 1.6e-20
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12          ( 377)  813 98.4 1.8e-20
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11         ( 801)  739 91.0 6.8e-18
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11         ( 804)  739 91.0 6.8e-18
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11          ( 808)  739 91.0 6.8e-18


>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1               (622 aa)
 initn: 4224 init1: 4224 opt: 4224  Z-score: 2403.2  bits: 454.8 E(32554): 1.5e-127
Smith-Waterman score: 4224; 100.0% identity (100.0% similar) in 622 aa overlap (1-622:1-622)

               10        20        30        40        50        60
pF1KB3 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPCHEAPQGSATAAEPQPGDPARASQDSAD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPCHEAPQGSATAAEPQPGDPARASQDSAD
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB3 PQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB3 SDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAML
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAML
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB3 FEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQQVNMPYVMIPAFPPSHQPLP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQQVNMPYVMIPAFPPSHQPLP
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB3 VTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB3 APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB3 LHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCVHPLEEAMLSCDMDGSRHFPESRN
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCVHPLEEAMLSCDMDGSRHFPESRN
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB3 SSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARL
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB3 SRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMS
              490       500       510       520       530       540

              550       560       570       580       590       600
pF1KB3 SSDVLYPRAAGMPLAQPLVEHYVPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGEMYR
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSDVLYPRAAGMPLAQPLVEHYVPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADGEMYR
              550       560       570       580       590       600

              610       620  
pF1KB3 YSEDEDSEGEEKSDGELVVLTD
       ::::::::::::::::::::::
CCDS44 YSEDEDSEGEEKSDGELVVLTD
              610       620  

>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12               (728 aa)
 initn: 1270 init1: 679 opt: 836  Z-score: 490.1  bits: 101.1 E(32554): 5.6e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:72-720)

        30        40        50        60        70        80       
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
                                     :..::   .:. : : .  :  . :.:: .
CCDS81 EESDGLPAFHLPLHEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
              50        60        70        80         90       100

        90        100        110       120       130       140     
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
       . .......  .:.:.. . .:  : .:.::::::.:::...:. .: .  ..::: :::
CCDS81 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
              110       120       130       140       150       160

         150       160       170       180       190       200     
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
       :::: ::. ::.::..::.:::.::.:::..::  .:::.::::::.:::::::.:::::
CCDS81 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
              170       180       190       200       210       220

         210       220        230       240       250              
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
       .:::::::::::::: : ..: .:::.:::... : .. .. . ::              
CCDS81 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
              230       240       250       260       270       280

                      260       270                                
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
       .: ::          :   :::: .   :        :  : ::                
CCDS81 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
              290       300       310       320       330       340

       280           290       300            310       320        
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
          .:. :     .: .:::::.::::     .:  :..   :.:...: .  : . . :
CCDS81 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
              350       360       370       380       390          

      330       340       350       360          370               
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
       .   . :     .:.:.. ::::::::.:::.   :. .. .:::.          :   
CCDS81 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
     400       410       420       430       440       450         

        380           390       400       410                 420  
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
       .:.  .:.:      .:.  :    : . .  :: : :::    :::          :  
CCDS81 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
     460       470       480       490       500       510         

            430       440       450       460       470       480  
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
       ::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS81 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
     520       530       540       550       560       570         

            490       500       510       520       530       540  
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
       :::::::::::::::::::.:.::.::.:::::.::.:::. :: . .  :: :. ....
CCDS81 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
     580       590       600       610       620       630         

               550       560        570       580       590        
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
        :.:: :   ::::  .   ::  :  : .:.:::: .: ... :     .. .. :  :
CCDS81 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
      640       650       660       670       680       690        

         600        610       620    
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD  
       :.: .:.:.::.   .  ::.:        
CCDS81 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
      700       710       720        

>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12               (750 aa)
 initn: 1270 init1: 679 opt: 836  Z-score: 489.9  bits: 101.1 E(32554): 5.7e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:94-742)

        30        40        50        60        70        80       
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
                                     :..::   .:. : : .  :  . :.:: .
CCDS44 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
            70        80        90       100        110       120  

        90        100        110       120       130       140     
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
       . .......  .:.:.. . .:  : .:.::::::.:::...:. .: .  ..::: :::
CCDS44 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
            130       140       150       160       170       180  

         150       160       170       180       190       200     
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
       :::: ::. ::.::..::.:::.::.:::..::  .:::.::::::.:::::::.:::::
CCDS44 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
            190       200       210       220       230       240  

         210       220        230       240       250              
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
       .:::::::::::::: : ..: .:::.:::... : .. .. . ::              
CCDS44 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
            250       260       270       280       290       300  

                      260       270                                
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
       .: ::          :   :::: .   :        :  : ::                
CCDS44 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
            310       320       330       340       350       360  

       280           290       300            310       320        
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
          .:. :     .: .:::::.::::     .:  :..   :.:...: .  : . . :
CCDS44 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
            370       380       390       400       410        420 

      330       340       350       360          370               
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
       .   . :     .:.:.. ::::::::.:::.   :. .. .:::.          :   
CCDS44 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
             430       440       450       460       470       480 

        380           390       400       410                 420  
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
       .:.  .:.:      .:.  :    : . .  :: : :::    :::          :  
CCDS44 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
             490       500       510       520       530       540 

            430       440       450       460       470       480  
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
       ::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS44 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
             550       560       570       580       590       600 

            490       500       510       520       530       540  
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
       :::::::::::::::::::.:.::.::.:::::.::.:::. :: . .  :: :. ....
CCDS44 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
             610       620       630       640       650        660

               550       560        570       580       590        
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
        :.:: :   ::::  .   ::  :  : .:.:::: .: ... :     .. .. :  :
CCDS44 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
              670       680       690       700       710       720

         600        610       620    
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD  
       :.: .:.:.::.   .  ::.:        
CCDS44 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
              730       740       750

>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12               (753 aa)
 initn: 1270 init1: 679 opt: 836  Z-score: 489.9  bits: 101.1 E(32554): 5.8e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:97-745)

        30        40        50        60        70        80       
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
                                     :..::   .:. : : .  :  . :.:: .
CCDS58 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
         70        80        90       100        110       120     

        90        100        110       120       130       140     
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
       . .......  .:.:.. . .:  : .:.::::::.:::...:. .: .  ..::: :::
CCDS58 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
         130       140       150       160       170       180     

         150       160       170       180       190       200     
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
       :::: ::. ::.::..::.:::.::.:::..::  .:::.::::::.:::::::.:::::
CCDS58 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
         190       200       210       220       230       240     

         210       220        230       240       250              
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
       .:::::::::::::: : ..: .:::.:::... : .. .. . ::              
CCDS58 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
         250       260       270       280       290       300     

                      260       270                                
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
       .: ::          :   :::: .   :        :  : ::                
CCDS58 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
         310       320       330       340       350       360     

       280           290       300            310       320        
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
          .:. :     .: .:::::.::::     .:  :..   :.:...: .  : . . :
CCDS58 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
         370       380       390       400       410        420    

      330       340       350       360          370               
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
       .   . :     .:.:.. ::::::::.:::.   :. .. .:::.          :   
CCDS58 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
          430       440       450       460       470       480    

        380           390       400       410                 420  
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
       .:.  .:.:      .:.  :    : . .  :: : :::    :::          :  
CCDS58 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
          490       500       510       520       530       540    

            430       440       450       460       470       480  
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
       ::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS58 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
          550       560       570       580       590       600    

            490       500       510       520       530       540  
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
       :::::::::::::::::::.:.::.::.:::::.::.:::. :: . .  :: :. ....
CCDS58 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
          610       620       630       640       650        660   

               550       560        570       580       590        
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
        :.:: :   ::::  .   ::  :  : .:.:::: .: ... :     .. .. :  :
CCDS58 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
           670       680       690       700       710       720   

         600        610       620    
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD  
       :.: .:.:.::.   .  ::.:        
CCDS58 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
           730       740       750   

>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12                (763 aa)
 initn: 1270 init1: 679 opt: 836  Z-score: 489.8  bits: 101.1 E(32554): 5.8e-21
Smith-Waterman score: 1476; 44.8% identity (65.2% similar) in 652 aa overlap (58-616:107-755)

        30        40        50        60        70        80       
pF1KB3 EKKEPCHEAPQGSATAAEPQPGDPARASQDSADPQAPAQGNFRGSWDCSSPEGNGSPEPK
                                     :..::   .:. : : .  :  . :.:: .
CCDS86 TCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG-RQSGESLSSTALGTPERR
         80        90       100       110        120       130     

        90        100        110       120       130       140     
pF1KB3 RPGVSEAASG-SQEKLD-FNRNLKEVVPAIEKLLSSDWKERFLGRNSMEAKDVKGTQESL
       . .......  .:.:.. . .:  : .:.::::::.:::...:. .: .  ..::: :::
CCDS86 KGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESL
         140       150       160       170       180       190     

         150       160       170       180       190       200     
pF1KB3 AEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQQL
       :::: ::. ::.::..::.:::.::.:::..::  .:::.::::::.:::::::.:::::
CCDS86 AEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMELAKQQQEQIARQQQQL
         200       210       220       230       240       250     

         210       220        230       240       250              
pF1KB3 IQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP--------------
       .:::::::::::::: : ..: .:::.:::... : .. .. . ::              
CCDS86 LQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYP
         260       270       280       290       300       310     

                      260       270                                
pF1KB3 IQPIPCK--------PVEYPLQLLHSPPA--------PVVKRPGA---------------
       .: ::          :   :::: .   :        :  : ::                
CCDS86 VQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIH
         320       330       340       350       360       370     

       280           290       300            310       320        
pF1KB3 --MATHHP----LQEPSQPLNLTAKPK-----APELPNTSSSPSLKMSSCVPRPPSHGGP
          .:. :     .: .:::::.::::     .:  :..   :.:...: .  : . . :
CCDS86 TDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPALRINSGAG-PLKASVP
         380       390       400       410       420        430    

      330       340       350       360          370               
pF1KB3 TRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALDGS---------PNTPF
       .   . :     .:.:.. ::::::::.:::.   :. .. .:::.          :   
CCDS86 AALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGKVAVVNSLGLNNCRT
          440       450       460       470       480       490    

        380           390       400       410                 420  
pF1KB3 RKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFPESR----------NSS
       .:.  .:.:      .:.  :    : . .  :: : :::    :::          :  
CCDS86 EKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSESRIYRESRGRGSNEP
          500       510       520       530       540       550    

            430       440       450       460       470       480  
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
       ::::::::::::::::::::::::::::::.::::::::::.::: :::::::::::::.
CCDS86 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEKQPYYEEQARLSK
          560       570       580       590       600       610    

            490       500       510       520       530       540  
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSSS
       :::::::::::::::::::.:.::.::.:::::.::.:::. :: . .  :: :. ....
CCDS86 QHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATA
          620       630       640       650       660        670   

               550       560        570       580       590        
pF1KB3 DVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVAD--G
        :.:: :   ::::  .   ::  :  : .:.:::: .: ... :     .. .. :  :
CCDS86 GVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEPHIKEEIQAEDING
           680       690       700       710       720       730   

         600        610       620    
pF1KB3 EMY-RYSEDEDSEG-EEKSDGELVVLTD  
       :.: .:.:.::.   .  ::.:        
CCDS86 EIYDEYDEEEDDPDVDYGSDSENHIAGQAN
           740       750       760   

>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12               (642 aa)
 initn: 1160 init1: 679 opt: 820  Z-score: 481.8  bits: 99.3 E(32554): 1.6e-20
Smith-Waterman score: 1421; 44.5% identity (67.1% similar) in 614 aa overlap (30-616:62-634)

                10        20        30         40        50        
pF1KB3  MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPC-HEAPQGSATAAEPQPGDPARAS---
                                     .: : :..: .. .. : . :. . .:   
CCDS58 DGLPAFHLPLHVSFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVD-GNKVMSSFAP
              40        50        60        70        80         90

           60        70        80        90        100        110  
pF1KB3 -QDSADPQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASG-SQEKLD-FNRNLKEVV
        ..:..::   .:. : : .  :  . :.:: .. .......  .:.:.. . .:  : .
CCDS58 HNSSTSPQKAEEGG-RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEET
              100        110       120       130       140         

            120       130       140       150       160       170  
pF1KB3 PAIEKLLSSDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSE
       :.::::::.:::...:. .: .  ..::: ::::::: ::. ::.::..::.:::.::.:
CCDS58 PSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDE
     150       160       170       180       190       200         

            180       190       200       210       220        230 
pF1KB3 QKNMAAMLFEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPA
       ::..::  .:::.::::::.:::::::.:::::.:::::::::::::: : ..: .:::.
CCDS58 QKKLAASQIEKQRQQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPV
     210       220       230       240       250       260         

             240       250       260       270       280       290 
pF1KB3 FPPSHQPLPVTPDSQLALPIQPIPCKPVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQ
       :::... : .. .. . ::       :  .  .   : : ::   : .::.         
CCDS58 FPPDQRTLAAAAQQGFLLP-------P-GFSYKAGCSDPYPVQLIPTTMAAAAAATPGLG
     270       280               290       300       310       320 

             300       310       320       330       340       350 
pF1KB3 PLNLTAKPKAPELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVT
       ::.:  .  : .:   . ::. :.                     :..: : :: . . :
CCDS58 PLQLQ-QLYAAQLAAMQVSPGGKL---------------------PGIPQGNLGAAVSPT
              330       340                            350         

             360       370       380       390        400       410
pF1KB3 KAIQDARQLLHSHSGALDGSPNTPFRKDLISLDSSPAKERLEDGCV-HPLEEAMLSCDMD
       .        .:. ... .  :..  .  : :: .. : .. :.:   : . .  :: : :
CCDS58 S--------IHTDKSTNSPPPKSKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSD
     360               370       380       390       400       410 

                        420       430       440       450       460
pF1KB3 GSRHFPESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGS
       ::    :::          :  ::::::::::::::::::::::::::::::.:::::::
CCDS58 GSAGVSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGS
             420       430       440       450       460       470 

              470       480       490       500       510       520
pF1KB3 RWKSMTNQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTR
       :::.::: :::::::::::::.:::::::::::::::::::.:.::.::.:::::.::.:
CCDS58 RWKAMTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNR
             480       490       500       510       520       530 

              530       540          550       560        570      
pF1KB3 RQDARQSYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVN
       ::. :: . .  :: :. .... :.:: :   ::::  .   ::  :  : .:.:::: .
CCDS58 RQEMRQYFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQS
             540        550       560       570       580       590

        580       590          600        610       620    
pF1KB3 TCSLREEGEGTDDRHSVAD--GEMY-RYSEDEDSEG-EEKSDGELVVLTD  
       : ... :     .. .. :  ::.: .:.:.::.   .  ::.:        
CCDS58 TYGVKGEEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
              600       610       620       630       640  

>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12               (377 aa)
 initn: 817 init1: 679 opt: 813  Z-score: 481.0  bits: 98.4 E(32554): 1.8e-20
Smith-Waterman score: 946; 48.1% identity (66.8% similar) in 368 aa overlap (288-616:4-369)

       260       270       280       290       300            310  
pF1KB3 PVEYPLQLLHSPPAPVVKRPGAMATHHPLQEPSQPLNLTAKPK-----APELPNTSSSPS
                                     : .:::::.::::     .:  :..   :.
CCDS41                            MHDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPA
                                          10        20        30   

            320       330       340       350       360            
pF1KB3 LKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQDARQL---LHSHSGALD
       :...: .  : . . :.   . :     .:.:.. ::::::::.:::.   :. .. .::
CCDS41 LRINSGAG-PLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
            40         50        60        70        80        90  

     370                380           390       400       410      
pF1KB3 GS---------PNTPFRKDLISLDSSP----AKERLEDGCVHPLEEAMLSCDMDGSRHFP
       :.          :   .:.  .:.:      .:.  :    : . .  :: : :::    
CCDS41 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
            100       110       120       130       140       150  

                  420       430       440       450       460      
pF1KB3 ESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMT
       :::          :  ::::::::::::::::::::::::::::::.::::::::::.::
CCDS41 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
            160       170       180       190       200       210  

        470       480       490       500       510       520      
pF1KB3 NQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQ
       : :::::::::::::.:::::::::::::::::::.:.::.::.:::::.::.:::. ::
CCDS41 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
            220       230       240       250       260       270  

        530       540          550       560        570       580  
pF1KB3 SYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPRSLDPNMPVIVNTCSLRE
        . .  :: :. .... :.:: :   ::::  .   ::  :  : .:.:::: .: ... 
CCDS41 YFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKG
            280        290       300       310       320       330 

            590          600        610       620    
pF1KB3 EGEGTDDRHSVAD--GEMY-RYSEDEDSEG-EEKSDGELVVLTD  
       :     .. .. :  ::.: .:.:.::.   .  ::.:        
CCDS41 EEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
             340       350       360       370       

>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11              (801 aa)
 initn: 1248 init1: 694 opt: 739  Z-score: 434.8  bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1208; 40.6% identity (58.6% similar) in 655 aa overlap (103-614:141-787)

             80        90       100       110       120       130  
pF1KB3 WDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNS
                                     ...:. .:    .:::::.::::..   :.
CCDS53 IMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNT
              120       130       140       150       160       170

             140       150       160       170       180       190 
pF1KB3 MEA-KDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELA
        :   ..::: ::::::: :: .:: :: .::.:::.::.:::..::  .:::.:::.::
CCDS53 SELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLA
              180       190       200       210       220       230

             200       210       220        230       240       250
pF1KB3 RQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP
       ::::::::.:::::.:::::::::::::: : .:: .::: :: ... : ..  .: .. 
CCDS53 RQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFL
              240       250       260       270       280       290

               260        270                            280       
pF1KB3 IQP-IPCKPVE-YPLQLLHSPPAPVVKR---------------------PGAMATHHPLQ
       . : :  :: . ::.:.. :  : ..                       :::     : :
CCDS53 FPPGITYKPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-Q
              300       310       320       330       340          

       290                                    300                  
pF1KB3 EPS-----------------------------QPLNLTAKPKAPE------------LPN
        :.                             :::::...::. :            .: 
CCDS53 PPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPA
     350       360       370       380       390       400         

        310        320                      330         340        
pF1KB3 TSSSP-SLKMSSCVPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGD
       ...:: .:  .: .: :                .:   :   :. ::  : : ...:. :
CCDS53 SKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-P-ALFGDQD
     410       420       430       440       450        460        

      350       360               370       380       390          
pF1KB3 AVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE-------
       .: ::::.::..         ...  ..::. ..     : :  .   . :.:       
CCDS53 TVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLT
       470       480       490       500       510       520       

                400              410                           420 
pF1KB3 -----DGCVHPL-------EEAMLSCDMDGS--------------------RHFPESRNS
            :: . :        :.:  :  :.::                    : . ..:. 
CCDS53 GKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGR
       530       540       550       560       570       580       

                 430       440       450       460       470       
pF1KB3 S----HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQ
       .    ::::::::::::::::::::::::::::::.::::::::::::.:::::::::::
CCDS53 ASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQ
       590       600       610       620       630       640       

       480       490       500       510       520       530       
pF1KB3 ARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQV
       ::::. ::::::.:::::::::::::.::.::.:::: :::.:::. :: ...  :  :.
CCDS53 ARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QI
       650       660       670       680       690       700       

       540        550       560            570       580       590 
pF1KB3 QMSS-SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRH
        ... . :.:: :  :  . :  .       .  : .:..::: .: ... .: :.   .
CCDS53 PITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGN
        710       720       730       740       750        760     

               600       610       620        
pF1KB3 SVADGE--MYRYSEDEDSEGEEKSDGELVVLTD      
        . .::  :  :.. ::   . :::              
CCDS53 EMINGEDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
         770       780          790       800 

>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11              (804 aa)
 initn: 1248 init1: 694 opt: 739  Z-score: 434.8  bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1208; 40.6% identity (58.6% similar) in 655 aa overlap (103-614:144-790)

             80        90       100       110       120       130  
pF1KB3 WDCSSPEGNGSPEPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNS
                                     ...:. .:    .:::::.::::..   :.
CCDS53 IMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNT
           120       130       140       150       160       170   

             140       150       160       170       180       190 
pF1KB3 MEA-KDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELA
        :   ..::: ::::::: :: .:: :: .::.:::.::.:::..::  .:::.:::.::
CCDS53 SELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLA
           180       190       200       210       220       230   

             200       210       220        230       240       250
pF1KB3 RQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALP
       ::::::::.:::::.:::::::::::::: : .:: .::: :: ... : ..  .: .. 
CCDS53 RQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFL
           240       250       260       270       280       290   

               260        270                            280       
pF1KB3 IQP-IPCKPVE-YPLQLLHSPPAPVVKR---------------------PGAMATHHPLQ
       . : :  :: . ::.:.. :  : ..                       :::     : :
CCDS53 FPPGITYKPGDNYPVQFIPSTMAAAAASGLSPLQLQQLYAAQLASMQVSPGAKMPSTP-Q
           300       310       320       330       340       350   

       290                                    300                  
pF1KB3 EPS-----------------------------QPLNLTAKPKAPE------------LPN
        :.                             :::::...::. :            .: 
CCDS53 PPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPA
            360       370       380       390       400       410  

        310        320                      330         340        
pF1KB3 TSSSP-SLKMSSCVPRP---------------PSHGGPTR--DLQSSPPSLPLGFLGEGD
       ...:: .:  .: .: :                .:   :   :. ::  : : ...:. :
CCDS53 SKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNS-P-ALFGDQD
            420       430       440       450       460         470

      350       360               370       380       390          
pF1KB3 AVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDSSPAKERLE-------
       .: ::::.::..         ...  ..::. ..     : :  .   . :.:       
CCDS53 TVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFENLGPQLT
              480       490       500       510       520       530

                400              410                           420 
pF1KB3 -----DGCVHPL-------EEAMLSCDMDGS--------------------RHFPESRNS
            :: . :        :.:  :  :.::                    : . ..:. 
CCDS53 GKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARVYRDARGR
              540       550       560       570       580       590

                 430       440       450       460       470       
pF1KB3 S----HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQ
       .    ::::::::::::::::::::::::::::::.::::::::::::.:::::::::::
CCDS53 ASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQ
              600       610       620       630       640       650

       480       490       500       510       520       530       
pF1KB3 ARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQV
       ::::. ::::::.:::::::::::::.::.::.:::: :::.:::. :: ...  :  :.
CCDS53 ARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QI
              660       670       680       690       700          

       540        550       560            570       580       590 
pF1KB3 QMSS-SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRH
        ... . :.:: :  :  . :  .       .  : .:..::: .: ... .: :.   .
CCDS53 PITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGN
     710       720       730       740       750       760         

               600       610       620        
pF1KB3 SVADGE--MYRYSEDEDSEGEEKSDGELVVLTD      
        . .::  :  :.. ::   . :::              
CCDS53 EMINGEDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
      770       780          790       800    

>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11               (808 aa)
 initn: 1144 init1: 694 opt: 739  Z-score: 434.7  bits: 91.0 E(32554): 6.8e-18
Smith-Waterman score: 1184; 40.6% identity (57.8% similar) in 650 aa overlap (115-614:153-794)

           90       100       110       120       130        140   
pF1KB3 EPKRPGVSEAASGSQEKLDFNRNLKEVVPAIEKLLSSDWKERFLGRNSMEA-KDVKGTQE
                                     .:::::.::::..   :. :   ..::: :
CCDS78 RKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKMERLNTSELLGEIKGTPE
            130       140       150       160       170       180  

           150       160       170       180       190       200   
pF1KB3 SLAEKELQLLVMIHQLSTLRDQLLTAHSEQKNMAAMLFEKQQQQMELARQQQEQIAKQQQ
       :::::: :: .:: :: .::.:::.::.:::..::  .:::.:::.::::::::::.:::
CCDS78 SLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQQMDLARQQQEQIARQQQ
            190       200       210       220       230       240  

           210       220        230       240       250        260 
pF1KB3 QLIQQQHKINLLQQQIQ-QVNMPYVMIPAFPPSHQPLPVTPDSQLALPIQP-IPCKPVE-
       ::.:::::::::::::: : .:: .::: :: ... : ..  .: .. . : :  :: . 
CCDS78 QLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAAQQGFLFPPGITYKPGDN
            250       260       270       280       290       300  

              270                                                  
pF1KB3 YPLQLLHSPPA-------------------PVVKR-------------------------
       ::.:.. :  :                   : ...                         
CCDS78 YPVQFIPSTMAAAAASGLSPLQLQKGHVSHPQINQRLKGLSDRFGRNLDTFEHGGGHSYN
            310       320       330       340       350       360  

                          280       290                            
pF1KB3 ------------------PGAMATHHPLQEPS----------------------------
                         :::     : : :.                            
CCDS78 HKQIEQLYAAQLASMQVSPGAKMPSTP-QPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAA
            370       380        390       400       410       420 

               300                   310        320          330   
pF1KB3 -QPLNLTAKPKAPE------------LPNTSSSP-SLKMSSCVPRP--PSHG-GPTRDLQ
        :::::...::. :            .: ...:: .:  .: .: :   : : : . :. 
CCDS78 AQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLDIL
             430       440       450       460       470       480 

           340       350       360               370       380     
pF1KB3 SSPPSLPLGFLGEGDAVTKAIQDARQL--------LHSHSGALDGSPNTPFRKDLISLDS
       ::  : : ...:. :.: ::::.::..         ...  ..::. ..     : :  .
CCDS78 SSLNS-P-ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRN
               490       500       510       520       530         

         390                    400       410               420    
pF1KB3 SPAKERLE------------DGCVHP-LEEAMLSCDMDGSRHFPESR--------NSS--
          . :.:            :: . : . .     : .:.    :.:         ::  
CCDS78 EKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGGATVAEARVYRDARGRASSEP
     540       550       560       570       580       590         

            430       440       450       460       470       480  
pF1KB3 HIKRPMNAFMVWAKDERRKILQAFPDMHNSSISKILGSRWKSMTNQEKQPYYEEQARLSR
       ::::::::::::::::::::::::::::::.::::::::::::.:::::::::::::::.
CCDS78 HIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEKQPYYEEQARLSK
     600       610       620       630       640       650         

            490       500       510       520       530       540  
pF1KB3 QHLEKYPDYKYKPRPKRTCIVEGKRLRVGEYKALMRTRRQDARQSYVIPPQAGQVQMSS-
        ::::::.:::::::::::::.::.::.:::: :::.:::. :: ...  :  :. ... 
CCDS78 IHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTVGQQP-QIPITTG
     660       670       680       690       700       710         

             550       560            570       580       590      
pF1KB3 SDVLYPRAAGMPLAQPLVEHY-----VPRSLDPNMPVIVNTCSLREEGEGTDDRHSVADG
       . :.:: :  :  . :  .       .  : .:..::: .: ... .: :.   . . .:
CCDS78 TGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDG-GSLAGNEMING
      720       730       740       750       760        770       

          600       610       620        
pF1KB3 E--MYRYSEDEDSEGEEKSDGELVVLTD      
       :  :  :.. ::   . :::              
CCDS78 EDEMEMYDDYED---DPKSDYSSENEAPEAVSAN
       780          790       800        




622 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 22:01:58 2016 done: Sat Nov  5 22:01:58 2016
 Total Scan time:  4.240 Total Display time:  0.170

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com