Result of FASTA (ccds) for pF1KB5906
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB5906, 526 aa
  1>>>pF1KB5906 526 - 526 aa - 526 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 10.0556+/-0.00137; mu= 0.6969+/- 0.083
 mean_var=460.3733+/-95.446, 0's: 0 Z-trim(113.1): 117  B-trim: 0 in 0/52
 Lambda= 0.059775
 statistics sampled from 13710 (13813) to 13710 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.424), width:  16
 Scan time:  3.350

The best scores are:                                      opt bits E(32554)
CCDS10707.1 FUS gene_id:2521|Hs108|chr16           ( 526) 3790 341.5 1.4e-93
CCDS58454.1 FUS gene_id:2521|Hs108|chr16           ( 525) 3767 339.5 5.6e-93
CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17         ( 592) 1214 119.4 1.1e-26
CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17         ( 589) 1202 118.4 2.3e-26
CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22         ( 600) 1132 112.4 1.6e-24
CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22         ( 655) 1060 106.2 1.2e-22
CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22         ( 661) 1060 106.2 1.2e-22
CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22         ( 656) 1059 106.1 1.3e-22


>>CCDS10707.1 FUS gene_id:2521|Hs108|chr16                (526 aa)
 initn: 3790 init1: 3790 opt: 3790  Z-score: 1793.4  bits: 341.5 E(32554): 1.4e-93
Smith-Waterman score: 3790; 100.0% identity (100.0% similar) in 526 aa overlap (1-526:1-526)

               10        20        30        40        50        60
pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
              430       440       450       460       470       480

              490       500       510       520      
pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
       ::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
              490       500       510       520      

>>CCDS58454.1 FUS gene_id:2521|Hs108|chr16                (525 aa)
 initn: 3353 init1: 3353 opt: 3767  Z-score: 1782.7  bits: 339.5 E(32554): 5.6e-93
Smith-Waterman score: 3767; 99.6% identity (99.8% similar) in 526 aa overlap (1-526:1-525)

               10        20        30        40        50        60
pF1KB5 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MASNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSYSSYGQ
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB5 SQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
       :::. :::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SQNS-YGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGSSSQSS
                70        80        90       100       110         

              130       140       150       160       170       180
pF1KB5 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGGGNYGQD
     120       130       140       150       160       170         

              190       200       210       220       230       240
pF1KB5 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNRSSGGYE
     180       190       200       210       220       230         

              250       260       270       280       290       300
pF1KB5 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHDSEQDNSDNNTIFVQGLGENVTIES
     240       250       260       270       280       290         

              310       320       330       340       350       360
pF1KB5 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFS
     300       310       320       330       340       350         

              370       380       390       400       410       420
pF1KB5 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPSGGGGGGGQ
     360       370       380       390       400       410         

              430       440       450       460       470       480
pF1KB5 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 QRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDGPGGGPGGSHMGGNYGDDRRGGRGGYD
     420       430       440       450       460       470         

              490       500       510       520      
pF1KB5 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
       ::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RGGYRGRGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY
     480       490       500       510       520     

>>CCDS32623.1 TAF15 gene_id:8148|Hs108|chr17              (592 aa)
 initn: 693 init1: 693 opt: 1214  Z-score: 592.2  bits: 119.4 E(32554): 1.1e-26
Smith-Waterman score: 1429; 51.0% identity (66.8% similar) in 533 aa overlap (3-521:4-459)

                10          20        30        40        50       
pF1KB5  MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY
          :..: :..   :::..: .  .:::.: :      ::::::.:.::.: :::  :.:
CCDS32 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY
               10        20        30              40         50   

          60        70        80        90       100       110     
pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS
       ::::::: .::.     :.:   ::: ...  ::::.::  : . :::    : ::: : 
CCDS32 SSYGQSQ-SGYS-----QSY---GGYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG-
            60                 70          80         90           

         120       130       140       150        160       170    
pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG
        ... ::         .::.:: ::.:: ::..:.  :: : .:..:...          
CCDS32 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------
      100                110        120       130       140        

          180       190       200       210       220       230    
pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR
        .:.:.:.:. :   .  .:... :.     . ::...   :: ::: :::        :
CCDS32 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R
               150          160       170          180             

          240       250       260       270         280       290  
pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL
       . :::.  :::   :. ::    :::::..::: :: : : :  ::.:::::::::::::
CCDS32 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL
         190       200           210       220       230       240 

            300       310       320       330       340       350  
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
       ::.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::
CCDS32 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID
             250       260       270       280       290       300 

            360       370       380       390       400       410  
pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS
       ::::::: :: ::::::::: .: ::::.: : :::::  ::::. :       ::: : 
CCDS32 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP-
             310       320       330       340              350    

            420       430       440       450          460         
pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG
                ..::: ::::.: ::::. :: ::::. :.:.   :.::   :  .::. :
CCDS32 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG
                    360       370       380       390       400    

     470       480         490       500         510       520     
pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP
          :::::: ::::: :   ::  :: :.. ::  :::.: : :   : : .  ::    
CCDS32 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY
          410        420       430       440       450       460   

                                                                   
pF1KB5 Y                                                           
                                                                   
CCDS32 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG
           470       480       490       500       510       520   

>>CCDS59279.1 TAF15 gene_id:8148|Hs108|chr17              (589 aa)
 initn: 699 init1: 699 opt: 1202  Z-score: 586.7  bits: 118.4 E(32554): 2.3e-26
Smith-Waterman score: 1410; 50.3% identity (65.9% similar) in 533 aa overlap (3-521:4-456)

                10          20        30        40        50       
pF1KB5  MASNDYTQQA--TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQ--SSY
          :..: :..   :::..: .  .:::.: :      ::::::.:.::.: :::  :.:
CCDS59 MSDSGSYGQSGGEQQSYSTYGNPGSQGYGQAS------QSYSGYGQTTDSS-YGQNYSGY
               10        20        30              40         50   

          60        70        80        90       100       110     
pF1KB5 SSYGQSQNTGYGTQSTPQGYGSTGGYGSSQSSQSSYGQQSSYPGYGQQPAPSSTSGSYGS
       :::::: . .::            :: ...  ::::.::  : . :::    : ::: : 
CCDS59 SSYGQSYSQSYG------------GYENQK--QSSYSQQP-YNNQGQQQNMES-SGSQG-
            60                    70           80        90        

         120       130       140       150        160       170    
pF1KB5 SSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNPPQG-YGQQNQYNSSSGGGGGGGGG
        ... ::         .::.:: ::.:: ::..:.  :: : .:..:...          
CCDS59 -GRAPSY---------DQPDYG-QQDSYDQQSGYDQHQGSYDEQSNYDQQHD--------
         100                 110       120       130               

          180       190       200       210       220       230    
pF1KB5 GNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRGGRGRGGSGGGGGGGGGGYNR
        .:.:.:.:. :   .  .:... :.     . ::...   :: ::: :::        :
CCDS59 -SYSQNQQSYHS---QRENYSHHTQDDRRDVSRYGEDN---RGYGGSQGGG--------R
        140          150       160       170          180          

          240       250       260       270         280       290  
pF1KB5 SSGGYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD--SEQDNSDNNTIFVQGL
       . :::.  :::   :. ::    :::::..::: :: : : :  ::.:::::::::::::
CCDS59 GRGGYDKDGRGPMTGSSGG----DRGGFKNFGGHRDYGPRTDADSESDNSDNNTIFVQGL
            190       200           210       220       230        

            300       310       320       330       340       350  
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
       ::.:. ..:...::::::::::::::.::::::::..::: :::::::::::::::::::
CCDS59 GEGVSTDQVGEFFKQIGIIKTNKKTGKPMINLYTDKDTGKPKGEATVSFDDPPSAKAAID
      240       250       260       270       280       290        

            360       370       380       390       400       410  
pF1KB5 WFDGKEFSGNPIKVSFATRRADFNRGGGNGRGGRGRGGPMGRGGYGGGGSGGGGRGGFPS
       ::::::: :: ::::::::: .: ::::.: : :::::  ::::. :       ::: : 
CCDS59 WFDGKEFHGNIIKVSFATRRPEFMRGGGSGGGRRGRGGYRGRGGFQG-------RGGDP-
      300       310       320       330       340              350 

            420       430       440       450          460         
pF1KB5 GGGGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG--PGGGP-GGSHMGGNYG
                ..::: ::::.: ::::. :: ::::. :.:.   :.::   :  .::. :
CCDS59 ---------KSGDWVCPNPSCGNMNFARRNSCNQCNEPRPEDSRPSGGDFRGRGYGGERG
                       360       370       380       390       400 

     470       480         490       500         510       520     
pF1KB5 DDRRGGRGGYDRGGYRG--RGGDRGGFRGGRGG--GDRGGFGPGKMDSRGEHRQDRRERP
          :::::: ::::: :   ::  :: :.. ::  :::.: : :   : : .  ::    
CCDS59 YRGRGGRGG-DRGGYGGDRSGGGYGGDRSSGGGYSGDRSGGGYGGDRSGGGYGGDRGGGY
             410        420       430       440       450       460

                                                                   
pF1KB5 Y                                                           
                                                                   
CCDS59 GGDRGGGYGGDRGGGYGGDRGGYGGDRGGGYGGDRGGYGGDRGGYGGDRGGYGGDRGGYG
              470       480       490       500       510       520

>>CCDS54514.1 EWSR1 gene_id:2130|Hs108|chr22              (600 aa)
 initn: 684 init1: 529 opt: 1132  Z-score: 554.0  bits: 112.4 E(32554): 1.6e-24
Smith-Waterman score: 1593; 48.5% identity (68.3% similar) in 586 aa overlap (1-515:1-563)

                   10        20        30        40                
pF1KB5 MASNDYTQQ----ATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTD--------TS
       :::.::.      : :.:.:: .:: :::.: ..: ::::::. :.: ::        :.
CCDS54 MASTDYSTYSQAAAQQGYSAYTAQPTQGYAQ-TTQAYGQQSYGTYGQPTDVSYTQAQTTA
               10        20        30         40        50         

       50         60        70         80                       90 
pF1KB5 GYGQSSY-SSYGQSQNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSY
        :::..: .::::   ::: : ..::.:.. . :::.               : ..::.:
CCDS54 TYGQTAYATSYGQPP-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAY
      60        70         80        90       100       110        

             100       110       120       130       140       150 
pF1KB5 GQQSSYPGYGQQPAPSSTSGSYGSSSQSSSYGQPQSGSYSQQPSYGGQQQSYGQQQSYNP
       : : .::.:::::: .. . :: ::.: .:: :   .::::: .:: : .:::::.::. 
CCDS54 GTQPAYPAYGQQPAATAPT-SY-SSTQPTSYDQ---SSYSQQNTYG-QPSSYGQQSSYGQ
      120       130         140          150        160       170  

               160       170       180       190       200         
pF1KB5 PQGYGQQ--NQYNSSSGGGGGGGGGGNYGQDQSSMSSGGGSGGGYGNQDQSGGGGSGGYG
        ..::::  ..:  ..:         .:.:  :..:. ..: :  ..  :.  .. : ::
CCDS54 QSSYGQQPPTSYPPQTG---------SYSQAPSQYSQQSSSYGQQSSFRQDHPSSMGVYG
            180                190       200       210       220   

     210           220        230       240       250       260    
pF1KB5 QQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGYEPRGRGGGRGGRGGMGGSDRGGFNK
       :.. :    :..:. ::  . : : ::..:  ::.   :::::::: :. :  .::::::
CCDS54 QESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGMSRGGRGGGRGGMGSAG--ERGGFNK
           230       240       250         260       270           

          270            280       290       300       310         
pF1KB5 FGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGENVTIESVADYFKQIGIIKTNKKTGQ
        ::: :.:   :     . ...:::..:.::::...::....::.::: :..: ::.:::
CCDS54 PGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLNDSVTLDDLADFFKQCGVVKMNKRTGQ
     280       290       300       310       320       330         

     320       330       340       350       360       370         
pF1KB5 PMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWFDGKEFSGNPIKVSFATRRADFN--R
       :::..: :.:::: ::.::::..:::.::::..:::::.:.:. .:::.: ..  .:  :
CCDS54 PMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWFDGKDFQGSKLKVSLARKKPPMNSMR
     340       350       360       370       380       390         

       380            390       400           410                  
pF1KB5 GGGNGRGGRG-----RGGPMGRGGYGGG----GSGGGGRGGFPSGG---------GGGGG
       ::   : :::     :::: : :: ::     :. :: :::::  :         :::. 
CCDS54 GGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGRGGDRGGFPPRGPRGSRGNPSGGGNV
     400       410       420       430       440       450         

     420       430       440       450           460       470     
pF1KB5 QQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG----PGGGPGGSHMGGNYGDDRRGG
       :.:::::.:::: : :.::.::.::::::::::.:    :   :::..  :. :   :::
CCDS54 QHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEGFLPPPFPPPGGDRGRGGPGG-MRGG
     460       470       480       490       500       510         

          480            490       500       510       520         
pF1KB5 RGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRGGFGPGKMDSRGEHRQDRRERPY   
       ::: .::::    .:: :::::::::::::  :::::: :.  . :              
CCDS54 RGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRGGFGGGRRGGPGGPPGPLMEQMGGRR
      520       530       540        550       560       570       

CCDS54 GGRGGPGKMDKGEHRQERRDRPY
       580       590       600

>>CCDS54513.1 EWSR1 gene_id:2130|Hs108|chr22              (655 aa)
 initn: 717 init1: 562 opt: 1060  Z-score: 520.0  bits: 106.2 E(32554): 1.2e-22
Smith-Waterman score: 1461; 45.3% identity (66.4% similar) in 583 aa overlap (33-515:44-618)

             10        20        30        40        50         60 
pF1KB5 SNDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQS
                                     ::: .  .:.:.  :. :::..: .:::: 
CCDS54 AQQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQP
            20        30        40        50        60        70   

              70         80                       90       100     
pF1KB5 QNTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA
         ::: : ..::.:.. . :::.               : ..::.:: : .::.::::::
CCDS54 P-TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPA
             80        90       100       110       120       130  

                           110          120        130             
pF1KB5 ------------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP---------
                         :.:..:.:.. : .   :.:. ::  ::: .::         
CCDS54 ATAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPP
            140       150       160       170       180       190  

                 140       150       160       170            180  
pF1KB5 -SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQS
        ::..      .:.::.::..:. :..::::..:...:. :     .     :.:.:  :
CCDS54 TSYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPS
            200       210       220       230       240       250  

            190       200       210           220        230       
pF1KB5 SMSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSG
       ..:. ..: :  ..  :.  .. : :::.. :    :..:. ::  . : : ::..:  :
CCDS54 QYSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--G
            260       270       280       290       300         310

       240       250       260       270            280       290  
pF1KB5 GYEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGL
       :.   .:::  :::::::...:::::: ::: :.:   :     . ...:::..:.::::
CCDS54 GM---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGL
                 320       330       340       350       360       

            300       310       320       330       340       350  
pF1KB5 GENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAID
       ...::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..
CCDS54 NDSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVE
       370       380       390       400       410       420       

            360       370         380            390       400     
pF1KB5 WFDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----G
       :::::.:.:. .:::.: ..  .:  :::   : :::     :::: : :: ::     :
CCDS54 WFDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMG
       430       440       450       460       470       480       

             410                420       430       440       450  
pF1KB5 SGGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKP
       . :: :::::  :         :::. :.:::::.:::: : :.::.::.::::::::::
CCDS54 GRGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKP
       490       500       510       520       530       540       

                460       470        480            490       500  
pF1KB5 DG----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGD
       .:    :   :::..  :. :   :::::: .::::    .:: :::::::::::::  :
CCDS54 EGFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-D
       550       560        570       580       590       600      

            510       520                                
pF1KB5 RGGFGPGKMDSRGEHRQDRRERPY                          
       ::::: :.  . :                                     
CCDS54 RGGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
         610       620       630       640       650     

>>CCDS13852.2 EWSR1 gene_id:2130|Hs108|chr22              (661 aa)
 initn: 717 init1: 562 opt: 1060  Z-score: 520.0  bits: 106.2 E(32554): 1.2e-22
Smith-Waterman score: 1436; 45.3% identity (65.9% similar) in 581 aa overlap (41-515:52-624)

               20        30        40        50         60         
pF1KB5 TQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQ-----SQNT
                                     :.:.  :. :::..: .::::     . .:
CCDS13 TAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPPTVEGTST
              30        40        50        60        70        80 

           70               80                  90       100       
pF1KB5 GYGTQSTPQ-------GYGSTGGYGS----------SQSSQSSYGQQSSYPGYGQQPA--
       :: : ..::       ::: ::.: .          : ..::.:: : .::.::::::  
CCDS13 GYTTPTAPQAYSQPVQGYG-TGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAAT
              90       100        110       120       130       140

                         110          120        130               
pF1KB5 ----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP----------S
                       :.:..:.:.. : .   :.:. ::  ::: .::          :
CCDS13 APTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPTS
              150       160       170       180       190       200

               140       150       160       170            180    
pF1KB5 YGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSSM
       :..      .:.::.::..:. :..::::..:...:. :     .     :.:.:  :..
CCDS13 YSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQY
              210       220       230       240       250       260

          190       200       210           220        230         
pF1KB5 SSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGGY
       :. ..: :  ..  :.  .. : :::.. :    :..:. ::  . : : ::..:  ::.
CCDS13 SQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GGM
              270       280       290       300       310          

     240       250       260       270            280       290    
pF1KB5 EPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLGE
          .:::  :::::::...:::::: ::: :.:   :     . ...:::..:.::::..
CCDS13 ---SRGGRGGGRGGMGAGERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLND
         320       330       340       350       360       370     

          300       310       320       330       340       350    
pF1KB5 NVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDWF
       .::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..::
CCDS13 SVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEWF
         380       390       400       410       420       430     

          360       370         380            390       400       
pF1KB5 DGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GSG
       :::.:.:. .:::.: ..  .:  :::   : :::     :::: : :: ::     :. 
CCDS13 DGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGGR
         440       450       460       470       480       490     

           410                420       430       440       450    
pF1KB5 GGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPDG
       :: :::::  :         :::. :.:::::.:::: : :.::.::.::::::::::.:
CCDS13 GGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPEG
         500       510       520       530       540       550     

              460       470        480            490       500    
pF1KB5 ----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDRG
           :   :::..  :. :   :::::: .::::    .:: :::::::::::::  :::
CCDS13 FLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DRG
         560       570        580       590       600       610    

          510       520                                
pF1KB5 GFGPGKMDSRGEHRQDRRERPY                          
       ::: :.  . :                                     
CCDS13 GFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
           620       630       640       650       660 

>>CCDS13851.1 EWSR1 gene_id:2130|Hs108|chr22              (656 aa)
 initn: 684 init1: 529 opt: 1059  Z-score: 519.5  bits: 106.1 E(32554): 1.3e-22
Smith-Waterman score: 1452; 45.2% identity (66.0% similar) in 582 aa overlap (34-515:45-619)

            10        20        30        40        50         60  
pF1KB5 NDYTQQATQSYGAYPTQPGQGYSQQSSQPYGQQSYSGYSQSTDTSGYGQSSY-SSYGQSQ
                                     :: .  .:.:.  :. :::..: .::::  
CCDS13 QQGYSAYTAQPTQGYAQTTQAYGQQSYGTYGQPTDVSYTQAQTTATYGQTAYATSYGQPP
           20        30        40        50        60        70    

             70         80                       90       100      
pF1KB5 NTGYGTQSTPQGYGS-TGGYGS---------------SQSSQSSYGQQSSYPGYGQQPA-
        ::: : ..::.:.. . :::.               : ..::.:: : .::.:::::: 
CCDS13 -TGYTTPTAPQAYSQPVQGYGTGAYDTTTATVTTTQASYAAQSAYGTQPAYPAYGQQPAA
            80        90       100       110       120       130   

                          110          120        130              
pF1KB5 -----------------PSSTSGSYGSSSQS---SSYGQPQ-SGSYSQQP----------
                        :.:..:.:.. : .   :.:. ::  ::: .::          
CCDS13 TAPTRPQDGNKPTETSQPQSSTGGYNQPSLGYGQSNYSYPQVPGSYPMQPVTAPPSYPPT
           140       150       160       170       180       190   

                140       150       160       170            180   
pF1KB5 SYGG------QQQSYGQQQSYNPPQGYGQQNQYNSSSGGGGGGGGG-----GNYGQDQSS
       ::..      .:.::.::..:. :..::::..:...:. :     .     :.:.:  :.
CCDS13 SYSSTQPTSYDQSSYSQQNTYGQPSSYGQQSSYGQQSSYGQQPPTSYPPQTGSYSQAPSQ
           200       210       220       230       240       250   

           190       200       210           220        230        
pF1KB5 MSSGGGSGGGYGNQDQSGGGGSGGYGQQDRG----GRGRGGSGGGGGGGG-GGYNRSSGG
       .:. ..: :  ..  :.  .. : :::.. :    :..:. ::  . : : ::..:  ::
CCDS13 YSQQSSSYGQQSSFRQDHPSSMGVYGQESGGFSGPGENRSMSGPDNRGRGRGGFDR--GG
           260       270       280       290       300         310 

      240       250       260       270            280       290   
pF1KB5 YEPRGRGGGRGGRGGMGGSDRGGFNKFGGPRDQGSRHD-----SEQDNSDNNTIFVQGLG
       .   :::::::: :. :  .:::::: ::: :.:   :     . ...:::..:.::::.
CCDS13 MSRGGRGGGRGGMGSAG--ERGGFNKPGGPMDEGPDLDLGPPVDPDEDSDNSAIYVQGLN
             320         330       340       350       360         

           300       310       320       330       340       350   
pF1KB5 ENVTIESVADYFKQIGIIKTNKKTGQPMINLYTDRETGKLKGEATVSFDDPPSAKAAIDW
       ..::....::.::: :..: ::.::::::..: :.:::: ::.::::..:::.::::..:
CCDS13 DSVTLDDLADFFKQCGVVKMNKRTGQPMIHIYLDKETGKPKGDATVSYEDPPTAKAAVEW
     370       380       390       400       410       420         

           360       370         380            390       400      
pF1KB5 FDGKEFSGNPIKVSFATRRADFN--RGGGNGRGGRG-----RGGPMGRGGYGGG----GS
       ::::.:.:. .:::.: ..  .:  :::   : :::     :::: : :: ::     :.
CCDS13 FDGKDFQGSKLKVSLARKKPPMNSMRGGLPPREGRGMPPPLRGGPGGPGGPGGPMGRMGG
     430       440       450       460       470       480         

            410                420       430       440       450   
pF1KB5 GGGGRGGFPSGG---------GGGGGQQRAGDWKCPNPTCENMNFSWRNECNQCKAPKPD
        :: :::::  :         :::. :.:::::.:::: : :.::.::.::::::::::.
CCDS13 RGGDRGGFPPRGPRGSRGNPSGGGNVQHRAGDWQCPNPGCGNQNFAWRTECNQCKAPKPE
     490       500       510       520       530       540         

               460       470        480            490       500   
pF1KB5 G----PGGGPGGSHMGGNYGDDRRGGRGG-YDRGG----YRG-RGGDRGGFRGGRGGGDR
       :    :   :::..  :. :   :::::: .::::    .:: :::::::::::::  ::
CCDS13 GFLPPPFPPPGGDRGRGGPGG-MRGGRGGLMDRGGPGGMFRGGRGGDRGGFRGGRGM-DR
     550       560       570        580       590       600        

           510       520                                
pF1KB5 GGFGPGKMDSRGEHRQDRRERPY                          
       :::: :.  . :                                     
CCDS13 GGFGGGRRGGPGGPPGPLMEQMGGRRGGRGGPGKMDKGEHRQERRDRPY
       610       620       630       640       650      




526 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Sat Nov  5 15:30:42 2016 done: Sat Nov  5 15:30:42 2016
 Total Scan time:  3.350 Total Display time:  0.090

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com