Result of FASTA (ccds) for pF1KB8362
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB8362, 443 aa
  1>>>pF1KB8362 443 - 443 aa - 443 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 9.7969+/-0.000894; mu= -2.2156+/- 0.054
 mean_var=228.1141+/-47.195, 0's: 0 Z-trim(115.3): 18  B-trim: 770 in 1/51
 Lambda= 0.084918
 statistics sampled from 15802 (15818) to 15802 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.797), E-opt: 0.2 (0.486), width:  16
 Scan time:  3.100

The best scores are:                                      opt bits E(32554)
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10          ( 443) 3145 397.7 1.2e-110
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10         ( 444) 3133 396.2 3.4e-110
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3           ( 480) 1342 176.8   4e-44
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX          ( 413)  776 107.5 2.7e-23
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20       ( 397)  747 103.9   3e-22
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8           ( 442)  727 101.5 1.8e-21
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8          ( 443)  724 101.1 2.3e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8          ( 236)  715 99.9   3e-21
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18         ( 595)  672 94.8 2.5e-19
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3          ( 466)  664 93.8   4e-19


>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10               (443 aa)
 initn: 3145 init1: 3145 opt: 3145  Z-score: 2099.9  bits: 397.7 E(32554): 1.2e-110
Smith-Waterman score: 3145; 99.8% identity (100.0% similar) in 443 aa overlap (1-443:1-443)

               10        20        30        40        50        60
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB8 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB8 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEG
       :::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::
CCDS70 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEG
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB8 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT
              370       380       390       400       410       420

              430       440   
pF1KB8 PMHPPSSLSFGPHHPSSMVTAMG
       :::::::::::::::::::::::
CCDS70 PMHPPSSLSFGPHHPSSMVTAMG
              430       440   

>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10              (444 aa)
 initn: 2010 init1: 1849 opt: 3133  Z-score: 2091.9  bits: 396.2 E(32554): 3.4e-110
Smith-Waterman score: 3133; 99.5% identity (99.8% similar) in 444 aa overlap (1-443:1-444)

               10        20        30        40        50        60
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
              190       200       210       220       230       240

              250        260       270       280       290         
pF1KB8 GGSPTGFGCKSRPKARSST-GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP
       ::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS31 GGSPTGFGCKSRPKARSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP
              250       260       270       280       290       300

     300       310       320       330       340       350         
pF1KB8 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKE
       ::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
CCDS31 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKE
              310       320       330       340       350       360

     360       370       380       390       400       410         
pF1KB8 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP
              370       380       390       400       410       420

     420       430       440   
pF1KB8 TPMHPPSSLSFGPHHPSSMVTAMG
       ::::::::::::::::::::::::
CCDS31 TPMHPPSSLSFGPHHPSSMVTAMG
              430       440    

>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3                (480 aa)
 initn: 1477 init1: 814 opt: 1342  Z-score: 905.6  bits: 176.8 E(32554): 4e-44
Smith-Waterman score: 1918; 62.3% identity (77.7% similar) in 485 aa overlap (1-443:1-480)

               10        20        30        40        50          
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
       :::. .::::..:  :::::.::::.:::::.:.::. ::   :.::::.:: .:.::: 
CCDS30 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
               10          20        30        40        50        

      60        70         80           90        100          110 
pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP
         :::.: ..: ..  : :.:    :.:.::: :::. .:::::::::  :    :  .:
CCDS30 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP
          60        70        80        90       100       110     

             120           130       140                   150     
pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP
       :..:::::: .:    :.:: :::::: :...: .:.            :.. ::: :::
CCDS30 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP
         120       130       140       150       160       170     

         160          170           180       190       200        
pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL
       ::::.:::::: .   .:.:.   ::: : ..:. .:::: : .:::.::.       : 
CCDS30 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT
         180       190       200       210       220       230     

      210       220           230       240       250        260   
pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC
        :.. .::::: ::: :::    .:::::: :...:::  ..:  :.: :::: : ::::
CCDS30 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC
         240       250       260       270       280       290     

           270       280       290       300       310       320   
pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT
       ::::::.::::::::::::::::::::::::::::::::::::::::::::: :::::::
CCDS30 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTT
         300       310       320       330       340       350     

           330       340       350       360       370       380   
pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE
       ::::::::::::::::::::::.:::.:::::::::::::::::::.:::: ::  . .:
CCDS30 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE
         360       370       380       390       400       410     

                390       400       410       420       430        
pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM
       .. :     .: :. :::. ::. ..:. :::::.:.: ::::.:: ::::::  :::::
CCDS30 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM
         420       430       440       450       460       470     

      440   
pF1KB8 VTAMG
       :::::
CCDS30 VTAMG
         480

>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX               (413 aa)
 initn: 766 init1: 714 opt: 776  Z-score: 531.8  bits: 107.5 E(32554): 2.7e-23
Smith-Waterman score: 782; 40.7% identity (60.9% similar) in 381 aa overlap (105-442:51-408)

           80        90       100       110       120       130    
pF1KB8 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
                                     :  ::.   :. .  .  .. ::  ..:::
CCDS14 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
               30        40        50        60        70          

           140       150           160       170           180     
pF1KB8 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
         .   .. ::  ::.  ...  :   : . : :    : : ..    :..  .  : ::
CCDS14 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
      80        90         100       110       120       130       

         190       200       210        220       230       240    
pF1KB8 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
        .   ::            . .:: :  ::   : ..:    :..:: .: :.    :::
CCDS14 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
       140                   150       160         170             

          250             260       270       280       290        
pF1KB8 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
        . .  : :: :..       .:::::::::.::::::: ::::::::::::::::::::
CCDS14 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
     180       190       200       210       220       230         

      300       310       320       330       340       350        
pF1KB8 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKK
       :::.::.:: ...::::.:.::::::::::::::.::::::::::::.::..::::::.:
CCDS14 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
     240       250       260       270       280       290         

      360       370       380                                390   
pF1KB8 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
       .:::::::: :.:.:  ::  .::      . : ..                    ...:
CCDS14 DGIQTRNRKASGKGK--KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
     300       310         320       330       340       350       

           400       410       420         430       440       
pF1KB8 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG    
        . .. ...:. .   .  ::..  : :.   : .:.  ::  :.. .:..     
CCDS14 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
       360       370       380       390       400       410   

>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20            (397 aa)
 initn: 889 init1: 651 opt: 747  Z-score: 512.9  bits: 103.9 E(32554): 3e-22
Smith-Waterman score: 747; 41.8% identity (61.8% similar) in 361 aa overlap (98-434:18-359)

        70        80        90       100       110             120 
pF1KB8 VRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSP------FSKTS
                                     :.:. : .  ..::  . :      .:  :
CCDS13              MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSMLSYLS
                            10        20        30        40       

               130           140       150        160          170 
pF1KB8 IHHGSPGP--LSVYP----PASSSSLSGGHASPHLFTFPPTP-PKDVSPDP---SLSTPG
         . :: :  :.. :     :...: . : .:::    ::.  :  ..  :   : : ::
CCDS13 GCEPSPQPPELAARPGWAQTATADSSAFGPGSPH----PPAAHPPGATAFPFAHSPSGPG
        50        60        70        80            90       100   

             180       190       200       210       220       230 
pF1KB8 SAGSARQDEKECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSS
       :.:::    ..   ::  :    .. .  .:       :.: :. .:  . :  .  ...
CCDS13 SGGSA--GGRDGSAYQGALLPREQFAAPLGRPV-----GTSYSATYPAYVSPDVAQSWTA
             110       120       130            140       150      

             240         250       260       270       280         
pF1KB8 GLFPPSSLLG--GSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGL
       : :  : : :  :    :  ..  .   . ::::::::: ::::::::::::::::::::
CCDS13 GPFDGSVLHGLPGRRPTF-VSDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNACGL
        160       170        180       190       200       210     

     290       300       310       320       330       340         
pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN
       :::::: ::::..:..:::..::::  :.::.::.:::::::..:.:::::::::..::.
CCDS13 YHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKLHG
         220       230       240       250       260       270     

     350       360       370       380       390       400         
pF1KB8 INRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSS--LSHIS
       . :::.::::.::::.:    : :   :.. :     .:.: .:.:..   ::   :. .
CCDS13 VPRPLAMKKESIQTRKR----KPKTIAKARGS-SGSTRNASASPSAVASTDSSAATSKAK
         280       290           300        310       320       330

       410       420           430       440                       
pF1KB8 PFSHSSHMLTTPTPMHPPSSL----SFGPHHPSSMVTAMG                    
       : : .: .   :. : : .:     :..: :                             
CCDS13 P-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQ
               340        350       360       370       380        

CCDS13 EAWCALALA
      390       

>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8                (442 aa)
 initn: 690 init1: 690 opt: 727  Z-score: 498.9  bits: 101.5 E(32554): 1.8e-21
Smith-Waterman score: 748; 40.6% identity (62.4% similar) in 362 aa overlap (94-436:51-395)

            70        80        90       100       110       120   
pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH
                                     : .:.:: : ::   ::    .  :  .  
CCDS59 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS
               30        40        50         60           70      

           130       140       150       160       170       180   
pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC
        ..::  .  :  :... .:.  .:     ::. :.   :  . :  ..:..:    .: 
CCDS59 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA
         80        90       100            110       120           

           190       200       210       220       230       240   
pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG-
         :.     .    ... . . ....:. ::   :   :: :. . ...    ..  .: 
CCDS59 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP
     130       140       150       160             170       180   

              250                  260       270       280         
pF1KB8 --SPTGFGCKSR--PKARS---------STGRECVNCGATSTPLWRRDGTGHYLCNACGL
         ::.  .  .:  : ::          : ::::::::: ::::::::::::::::::::
CCDS59 FDSPVLHSLPGRANPAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGL
           190       200       210       220       230       240   

     290       300       310       320       330       340         
pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN
       :::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..::.
CCDS59 YHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHG
           250       260       270       280       290       300   

     350       360       370        380       390       400        
pF1KB8 INRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISP
       . :::.:.:::::::.:: .. .: :   . .. :..:  :. .  . .   ::  .. :
CCDS59 VPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRP
           310       320       330       340       350       360   

      410           420       430       440                        
pF1KB8 FSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG                     
       ..     :::.  . .  .  :  ... : ::                            
CCDS59 IKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSK
           370       380       390       400       410       420   

CCDS59 QDSWNSLVLADSHGDIITA
           430       440  

>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8               (443 aa)
 initn: 690 init1: 690 opt: 724  Z-score: 496.9  bits: 101.1 E(32554): 2.3e-21
Smith-Waterman score: 746; 40.5% identity (62.3% similar) in 363 aa overlap (94-436:51-396)

            70        80        90       100       110       120   
pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH
                                     : .:.:: : ::   ::    .  :  .  
CCDS78 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS
               30        40        50         60           70      

           130       140       150       160       170       180   
pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC
        ..::  .  :  :... .:.  .:     ::. :.   :  . :  ..:..:    .: 
CCDS78 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA
         80        90       100            110       120           

           190       200       210       220       230       240   
pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG-
         :.     .    ... . . ....:. ::   :   :: :. . ...    ..  .: 
CCDS78 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP
     130       140       150       160             170       180   

              250                   260       270       280        
pF1KB8 --SPTGFGCKSR--PKARS----------STGRECVNCGATSTPLWRRDGTGHYLCNACG
         ::.  .  .:  : ::           : ::::::::: :::::::::::::::::::
CCDS78 FDSPVLHSLPGRANPAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG
           190       200       210       220       230       240   

      290       300       310       320       330       340        
pF1KB8 LYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELH
       ::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..::
CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH
           250       260       270       280       290       300   

      350       360       370        380       390       400       
pF1KB8 NINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHIS
       .. :::.:.:::::::.:: .. .: :   . .. :..:  :. .  . .   ::  .. 
CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMR
           310       320       330       340       350       360   

       410           420       430       440                       
pF1KB8 PFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG                    
       :..     :::.  . .  .  :  ... : ::                           
CCDS78 PIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSS
           370       380       390       400       410       420   

CCDS78 KQDSWNSLVLADSHGDIITA
           430       440   

>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8               (236 aa)
 initn: 690 init1: 690 opt: 715  Z-score: 495.1  bits: 99.9 E(32554): 3e-21
Smith-Waterman score: 715; 58.7% identity (77.7% similar) in 184 aa overlap (258-436:6-189)

       230       240       250       260       270       280       
pF1KB8 EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNAC
                                     : ::::::::: ::::::::::::::::::
CCDS78                          MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC
                                        10        20        30     

       290       300       310       320       330       340       
pF1KB8 GLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYEL
       :::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..:
CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL
          40        50        60        70        80        90     

       350       360       370        380       390       400      
pF1KB8 HNINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHI
       :.. :::.:.:::::::.:: .. .: :   . .. :..:  :. .  . .   ::  ..
CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM
         100       110       120       130       140       150     

        410           420       430       440                      
pF1KB8 SPFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG                   
        :..     :::.  . .  .  :  ... : ::                          
CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS
         160       170       180       190       200       210     

CCDS78 SKQDSWNSLVLADSHGDIITA
         220       230      

>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18              (595 aa)
 initn: 726 init1: 634 opt: 672  Z-score: 460.6  bits: 94.8 E(32554): 2.5e-19
Smith-Waterman score: 711; 35.9% identity (57.2% similar) in 437 aa overlap (6-417:142-547)

                                        10        20           30  
pF1KB8                          MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
                                     .::. . ..  :.:..: :   :    :. 
CCDS11 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
             120       130       140        150       160       170

             40        50        60          70        80        90
pF1KB8 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRPPLL
       ::   ::         :       :. .:  ::. ..  .     : .: :.   .:   
CCDS11 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
              180       190       200       210           220      

                 100       110       120       130       140       
pF1KB8 HGSL---PWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
       ..:    :. .:: : :.  .:.: . .   ... : ..  : :  :: ....    ::.
CCDS11 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
        230       240        250          260       270       280  

         150       160       170       180       190       200     
pF1KB8 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
       :.             ::   : :  . .:  :. .   :.   ::  ... .  : .   
CCDS11 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
                 290        300         310       320       330    

         210       220            230          240       250       
pF1KB8 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKARS
                 ::: . : :::     : . .: :  :   :: . . . .     :.:  
CCDS11 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
                        340       350       360       370       380

           260       270       280       290       300       310   
pF1KB8 ----STGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
           : .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: 
CCDS11 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
              390       400       410       420       430       440

           320       330       340       350       360       370   
pF1KB8 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSS--K
       : :::::.:::::::::::.:.:::::::::..::.. :::.:::::::::.:: ..  :
CCDS11 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
              450       460       470       480       490       500

              380       390       400       410       420       430
pF1KB8 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
       :: :. . ..:.   : ..: :    :.. :  .. .  . .. ..:             
CCDS11 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
              510       520       530       540       550       560

              440                         
pF1KB8 GPHHPSSMVTAMG                      
                                          
CCDS11 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
              570       580       590     

>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3               (466 aa)
 initn: 1117 init1: 365 opt: 664  Z-score: 456.9  bits: 93.8 E(32554): 4e-19
Smith-Waterman score: 1789; 59.6% identity (75.1% similar) in 485 aa overlap (1-443:1-466)

               10        20        30        40        50          
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
       :::. .::::..:  :::::.::::.:::::.:.::. ::   :.::::.:: .:.::: 
CCDS46 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
               10          20        30        40        50        

      60        70         80           90        100          110 
pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP
         :::.: ..: ..  : :.:    :.:.::: :::. .:::::::::  :    :  .:
CCDS46 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP
          60        70        80        90       100       110     

             120           130       140                   150     
pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP
       :..:::::: .:    :.:: :::::: :...: .:.            :.. ::: :::
CCDS46 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP
         120       130       140       150       160       170     

         160          170           180       190       200        
pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL
       ::::.:::::: .   .:.:.   ::: : ..:. .:::: : .:::.::.       : 
CCDS46 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT
         180       190       200       210       220       230     

      210       220           230       240       250        260   
pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC
        :.. .::::: ::: :::    .:::::: :...:::  ..:  :.: :::: : ::::
CCDS46 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC
         240       250       260       270       280       290     

           270       280       290       300       310       320   
pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT
       ::::::.:::::::::::::::::::::::::::::::::::::              ::
CCDS46 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TT
         300       310       320       330                     340 

           330       340       350       360       370       380   
pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE
       ::::::::::::::::::::::.:::.:::::::::::::::::::.:::: ::  . .:
CCDS46 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE
             350       360       370       380       390       400 

                390       400       410       420       430        
pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM
       .. :     .: :. :::. ::. ..:. :::::.:.: ::::.:: ::::::  :::::
CCDS46 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM
             410       420       430       440       450       460 

      440   
pF1KB8 VTAMG
       :::::
CCDS46 VTAMG
            




443 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Fri Nov  4 12:09:39 2016 done: Fri Nov  4 12:09:39 2016
 Total Scan time:  3.100 Total Display time:  0.070

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com