Result of FASTA (ccds) for pFN21AB9437
FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448

Query: pF1KB9437, 595 aa
  1>>>pF1KB9437 595 - 595 aa - 595 aa
Library: human.CCDS.faa
  18511270 residues in 32554 sequences

Statistics:  Expectation_n fit: rho(ln(x))= 11.2810+/- 0.001; mu= -5.9162+/- 0.060
 mean_var=397.9538+/-83.464, 0's: 0 Z-trim(116.2): 40  B-trim: 0 in 0/51
 Lambda= 0.064292
 statistics sampled from 16734 (16767) to 16734 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
 ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.515), width:  16
 Scan time:  3.870

The best scores are:                                      opt bits E(32554)
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18         ( 595) 4132 397.3 2.8e-110
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8           ( 442) 1032 109.7 8.2e-24
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8          ( 443) 1014 108.0 2.6e-23
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20       ( 397)  929 100.1 5.7e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8          ( 236)  834 91.1 1.7e-18
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3           ( 480)  768 85.2   2e-16
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10         ( 444)  682 77.2 4.9e-14
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10          ( 443)  677 76.8 6.7e-14
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX          ( 413)  639 73.2 7.3e-13


>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18              (595 aa)
 initn: 4132 init1: 4132 opt: 4132  Z-score: 2093.3  bits: 397.3 E(32554): 2.8e-110
Smith-Waterman score: 4132; 100.0% identity (100.0% similar) in 595 aa overlap (1-595:1-595)

               10        20        30        40        50        60
pF1KB9 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC
               10        20        30        40        50        60

               70        80        90       100       110       120
pF1KB9 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ
               70        80        90       100       110       120

              130       140       150       160       170       180
pF1KB9 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA
              130       140       150       160       170       180

              190       200       210       220       230       240
pF1KB9 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG
              190       200       210       220       230       240

              250       260       270       280       290       300
pF1KB9 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL
              250       260       270       280       290       300

              310       320       330       340       350       360
pF1KB9 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH
              310       320       330       340       350       360

              370       380       390       400       410       420
pF1KB9 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM
              370       380       390       400       410       420

              430       440       450       460       470       480
pF1KB9 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP
              430       440       450       460       470       480

              490       500       510       520       530       540
pF1KB9 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG
              490       500       510       520       530       540

              550       560       570       580       590     
pF1KB9 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
       :::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
              550       560       570       580       590     

>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8                (442 aa)
 initn: 1160 init1: 814 opt: 1032  Z-score: 541.0  bits: 109.7 E(32554): 8.2e-24
Smith-Waterman score: 1256; 49.8% identity (68.1% similar) in 476 aa overlap (147-595:1-433)

        120       130       140       150         160        170   
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA
                                     :::.::  ...::  .::. :.::.:.:.:
CCDS59                               MYQSLAMAANHGPPPGAYEAGGPGAFMHGA
                                             10        20        30

           180       190       200       210       220       230   
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP
       .       :::::::::: :: : . :: : :::.:.: :.  :::..  .   ::. .:
CCDS59 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP
                      40        50         60          70        80

           240       250       260        270       280       290  
pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG
         :.  :. : . ::  ::. .   :: :: . . .  .: .::      :::.  .:. 
CCDS59 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY
                 90       100       110       120             130  

            300       310       320       330       340            
pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW
        ::::.. :...::: ::.  . :    :.:           :::  :   :::  . : 
CCDS59 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA
            140        150                     160       170       

     350         360       370       380       390       400       
pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTG
        :  :::..:::::: .::.   :. : :. :...:.::.:::::::...::::::::::
CCDS59 AASAGPFDSPVLHSLPGRAN---PAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTG
       180       190          200       210       220       230    

       410       420       430       440       450       460       
pF1KB9 HYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNA
       :::::::::: ::::..:::::::.:. .:::.:::::::.:::::::::::::::::::
CCDS59 HYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNA
          240       250       260       270       280       290    

       470       480       490       500       510         520     
pF1KB9 CGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDD
       ::::::::::::::::.:::::::::::::.::::: .. :.. :.:  :.: .::::..
CCDS59 CGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSN
          300       310       320       330       340         350  

         530       540                       550       560         
pF1KB9 CSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLY
        . ..:   .:  .  :                . .:.: : : .:  : :: : : :  
CCDS59 ATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYA
            360       370       380       390       400        410 

     570       580       590              
pF1KB9 IGVSLASPAEVTSSVRPDSWCALALA         
         ::  ::    .: . ::: .:.::         
CCDS59 SPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA
                 420       430       440  

>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8               (443 aa)
 initn: 1160 init1: 814 opt: 1014  Z-score: 532.0  bits: 108.0 E(32554): 2.6e-23
Smith-Waterman score: 1246; 49.7% identity (68.1% similar) in 477 aa overlap (147-595:1-434)

        120       130       140       150         160        170   
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA
                                     :::.::  ...::  .::. :.::.:.:.:
CCDS78                               MYQSLAMAANHGPPPGAYEAGGPGAFMHGA
                                             10        20        30

           180       190       200       210       220       230   
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP
       .       :::::::::: :: : . :: : :::.:.: :.  :::..  .   ::. .:
CCDS78 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP
                      40        50         60          70        80

           240       250       260        270       280       290  
pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG
         :.  :. : . ::  ::. .   :: :: . . .  .: .::      :::.  .:. 
CCDS78 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY
                 90       100       110       120             130  

            300       310       320       330       340            
pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW
        ::::.. :...::: ::.  . :    :.:           :::  :   :::  . : 
CCDS78 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA
            140        150                     160       170       

     350         360       370        380       390       400      
pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPS-ADLLEDLSESRECVNCGSIQTPLWRRDGT
        :  :::..:::::: .::.   :. : :. .:...:.::.:::::::...:::::::::
CCDS78 AASAGPFDSPVLHSLPGRAN---PAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGT
       180       190          200       210       220       230    

        410       420       430       440       450       460      
pF1KB9 GHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCN
       ::::::::::: ::::..:::::::.:. .:::.:::::::.::::::::::::::::::
CCDS78 GHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCN
          240       250       260       270       280       290    

        470       480       490       500       510         520    
pF1KB9 ACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSD
       :::::::::::::::::.:::::::::::::.::::: .. :.. :.:  :.: .::::.
CCDS78 ACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSS
          300       310       320       330       340         350  

          530       540                       550       560        
pF1KB9 DCSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGL
       . . ..:   .:  .  :                . .:.: : : .:  : :: : : : 
CCDS78 NATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GY
            360       370       380       390       400        410 

      570       580       590              
pF1KB9 YIGVSLASPAEVTSSVRPDSWCALALA         
          ::  ::    .: . ::: .:.::         
CCDS78 ASPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA
                 420       430       440   

>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20            (397 aa)
 initn: 1143 init1: 739 opt: 929  Z-score: 490.0  bits: 100.1 E(32554): 5.7e-21
Smith-Waterman score: 1113; 43.8% identity (65.6% similar) in 454 aa overlap (147-595:1-397)

        120       130       140       150       160       170      
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAA
                                     :::.::  .:   :::  . :.:.:     
CCDS13                               MYQSLALAASPRQAAYADS-GSFLH-----
                                             10         20         

        180       190       200       210       220        230     
pF1KB9 AAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQ-ASADSPPY
          : .:.::..:: .:: :::  :      ::  :. .    .:.::: : :.:::  .
CCDS13 ---APGAGSPMFVPPARVPSMLSYL------SGCEPSPQPPELAARPGWAQTATADSSAF
              30        40              50        60        70     

         240       250       260       270       280       290     
pF1KB9 GSGGGAAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSG
       :   :.    :: : :: .        ::.. ::             .. ::::..:   
CCDS13 GP--GSPHPPAAHPPGATA--------FPFAHSP-------------SGPGSGGSAGGRD
            80        90                            100       110  

         300       310       320       330       340       350     
pF1KB9 GGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFE
       :..  .:.  :: :...   .::.. .:           . :  ::.  .. .: ::::.
CCDS13 GSAYQGALLPRE-QFAA-PLGRPVGTSYS----------ATYPAYVSPDVAQSWTAGPFD
            120         130                 140       150       160

         360       370       380        390       400       410    
pF1KB9 TPVLHSLQSRAGAPLPVPRGPSADLLEDL-SESRECVNCGSIQTPLWRRDGTGHYLCNAC
         :::.: .:   :  :     .:.::.. .:.:::::::...:::::::::::::::::
CCDS13 GSVLHGLPGRR--PTFV-----SDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNAC
              170              180       190       200       210   

          420       430       440       450       460       470    
pF1KB9 GLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKL
       ::: ::::..:::..::::. :::: :: :.:::::.:::::::.:::::::::::::::
CCDS13 GLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKL
           220       230       240       250       260       270   

          480       490       500       510       520       530    
pF1KB9 HGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPT-
       ::::::::::::.:::::::::.: :..  ::.. :.     . .:..:.  .....:. 
CCDS13 HGVPRPLAMKKESIQTRKRKPKTIAKARGSSGSTRNASASPSAVASTDSSAATSKAKPSL
           280       290       300       310       320       330   

           540         550       560       570       580       590 
pF1KB9 TQPTASGAG-APVMTGA-GESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCA
       ..:.  : . ::  .:   .:  : . :.:.  .:  . ... .  : . ...: ..:::
CCDS13 ASPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQEAWCA
           340       350       360       370       380       390   

           
pF1KB9 LALA
       ::::
CCDS13 LALA
           

>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8               (236 aa)
 initn: 1016 init1: 814 opt: 834  Z-score: 445.3  bits: 91.1 E(32554): 1.7e-18
Smith-Waterman score: 868; 59.4% identity (76.1% similar) in 234 aa overlap (380-595:1-227)

     350       360       370       380       390       400         
pF1KB9 PAGPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHY
                                     ...:.::.:::::::...::::::::::::
CCDS78                               MFDDFSEGRECVNCGAMSTPLWRRDGTGHY
                                             10        20        30

     410       420       430       440       450       460         
pF1KB9 LCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACG
       :::::::: ::::..:::::::.:. .:::.:::::::.:::::::::::::::::::::
CCDS78 LCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACG
               40        50        60        70        80        90

     470       480       490       500       510         520       
pF1KB9 LYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDDCS
       ::::::::::::::.:::::::::::::.::::: .. :.. :.:  :.: .::::.. .
CCDS78 LYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSNAT
              100       110       120       130         140        

       530       540                       550       560       570 
pF1KB9 KNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLYIG
        ..:   .:  .  :                . .:.: : : .:  : :: : : :    
CCDS78 TSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYASP
      150       160       170       180       190       200        

             580       590              
pF1KB9 VSLASPAEVTSSVRPDSWCALALA         
       ::  ::    .: . ::: .:.::         
CCDS78 VS-QSPQ---TSSKQDSWNSLVLADSHGDIITA
        210          220       230      

>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3                (480 aa)
 initn: 722 init1: 648 opt: 768  Z-score: 408.2  bits: 85.2 E(32554): 2e-16
Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (144-506:42-410)

           120       130       140       150       160       170   
pF1KB9 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA
                                     :.:.   .  :.:::   :          :
CCDS30 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A
              20        30        40        50        60           

           180       190              200       210       220      
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGWP
         : : : .. ::...  :  :.:        ::::. :.:. .  :  :..:  :  : 
CCDS30 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT
              70        80         90        100         110       

         230       240             250                260          
pF1KB9 QAS-ADSPPYGSGGGAAGG------GAAGPGGAGSA---------AAHVSAR-FPYSPSP
        .  . .: . :..:. ::      ::.: .:.::.         ::: ... : . :.:
CCDS30 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP
       120       130       140       150       160       170       

     270       280       290       300       310         320       
pF1KB9 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH
       :   .      : :. .:..::: .. : .  ..  .     :..  .. ::  :     
CCDS30 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG
       180       190       200       210       220       230       

        330        340       350       360          370       380  
pF1KB9 HHHHHHHPSPYSP-YVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE
        .   ::: :  : ::     ::  :  . . ..:    : . :..  :  :. .    .
CCDS30 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R
       240       250             260       270       280           

            390       400       410       420       430       440  
pF1KB9 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL
       . ::.:::::::.  :::::::::::::::::::: :::: .::::::..:. ..:: : 
CCDS30 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT
       290       300       310       320       330       340       

            450       460       470       480       490       500  
pF1KB9 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK
        ::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: :
CCDS30 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K
       350       360       370       380       390       400       

            510       520       530       540       550       560  
pF1KB9 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY
       . .:                                                        
CCDS30 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS
        410       420       430       440       450       460      

>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10              (444 aa)
 initn: 735 init1: 643 opt: 682  Z-score: 365.5  bits: 77.2 E(32554): 4.9e-14
Smith-Waterman score: 724; 36.4% identity (57.9% similar) in 437 aa overlap (142-547:6-418)

             120       130       140        150       160       170
pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
                                     .::. . ..  :.:..: :   :    :. 
CCDS31                          MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
                                        10        20           30  

              180       190       200       210           220      
pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
       ::   ::         :       :. .:  ::. ..  .     : .: :.   .:  :
CCDS31 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P
             40        50        60          70        80          

        230       240        250          260       270       280  
pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
          . : :. .:: : :.  .:.: . .   ... : ..  : :  :: ....    ::.
CCDS31 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
       90        100       110       120       130       140       

                 290        300         310       320       330    
pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
       :.             ::   : :  . .:  :. .   :.   ::  ... .  : .   
CCDS31 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
         150       160       170       180       190       200     

                        340       350       360       370       380
pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
                 ::: . : :::     : . .: :  :   :: . . . .     :.:  
CCDS31 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA--
         210       220            230          240       250       

              390       400       410       420       430       440
pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
        .. .:.:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: 
CCDS31 -RSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
          260       270       280       290       300       310    

              450       460       470       480       490       500
pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
       : :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: ..  :
CCDS31 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K
          320       330       340       350       360       370    

              510       520       530       540       550       560
pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
       :: :. . ..:.   : ..: :    :.. :  .. .  . .. ..:             
CCDS31 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
             380       390       400       410       420       430 

              570       580       590     
pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
                                          
CCDS31 GPHHPSSMVTAMG                      
             440                          

>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10               (443 aa)
 initn: 731 init1: 639 opt: 677  Z-score: 363.0  bits: 76.8 E(32554): 6.7e-14
Smith-Waterman score: 716; 36.4% identity (57.2% similar) in 437 aa overlap (142-547:6-417)

             120       130       140        150       160       170
pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
                                     .::. . ..  :.:..: :   :    :. 
CCDS70                          MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
                                        10        20           30  

              180       190       200       210           220      
pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
       ::   ::         :       :. .:  ::. ..  .     : .: :.   .:  :
CCDS70 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P
             40        50        60          70        80          

        230       240        250          260       270       280  
pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
          . : :. .:: : :.  .:.: . .   ... : ..  : :  :: ....    ::.
CCDS70 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
       90        100       110       120       130       140       

                 290        300         310       320       330    
pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
       :.             ::   : :  . .:  :. .   :.   ::  ... .  : .   
CCDS70 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
         150       160       170       180       190       200     

                        340       350       360       370       380
pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
                 ::: . : :::     : . .: :  :   :: . . . .     :.:  
CCDS70 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA--
         210       220            230          240       250       

              390       400       410       420       430       440
pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
           : .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: 
CCDS70 --RSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
           260       270       280       290       300       310   

              450       460       470       480       490       500
pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
       : :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: ..  :
CCDS70 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K
           320       330       340       350       360       370   

              510       520       530       540       550       560
pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
       :: :. . ..:.   : ..: :    :.. :  .. .  . .. ..:             
CCDS70 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
              380       390       400       410       420       430

              570       580       590     
pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
                                          
CCDS70 GPHHPSSMVTAMG                      
              440                         

>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX               (413 aa)
 initn: 777 init1: 608 opt: 639  Z-score: 344.4  bits: 73.2 E(32554): 7.3e-13
Smith-Waterman score: 678; 37.5% identity (57.3% similar) in 384 aa overlap (234-588:35-412)

           210       220       230       240       250       260   
pF1KB9 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF
                                     : :  :  :......:. : .::: ..   
CCDS14 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR
           10        20        30        40        50        60    

                   270       280       290       300       310     
pF1KB9 P---YSPSP-----PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLSA
           :  ::     :. :     :::   ::   : : .:   . ..   ::   :  .:
CCDS14 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAG--WAYGKTGLYPASTVCPTRED--SPPQA
           70        80        90         100       110         120

         320           330       340       350       360        370
pF1KB9 ARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAPL
       .. :.:    .. .  . ..  :.  .   . : .   : . .  : . : . : .:.::
CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
              130       140       150       160       170       180

              380           390       400       410       420      
pF1KB9 PVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRP
             :  :   :     :.:::::::.  ::::::: :::::::::::: :::: .::
CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
              190       200       210       220       230       240

        430       440       450       460       470       480      
pF1KB9 LIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKE
       ::.:.::.  :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.:.
CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
              250       260       270       280       290       300

        490       500       510             520       530          
pF1KB9 GIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PTT
       :::::.:: .. .:.:  :. ....    :.      . .:.: .:.. .:      : :
CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
              310       320       330       340       350       360

          540       550       560       570       580       590    
pF1KB9 QPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALAL
           .: :  :..:      :  . :  :   ..  :     :.  :. : : :      
CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS     
              370       380       390         400       410        

        
pF1KB9 A




595 residues in 1 query   sequences
18511270 residues in 32554 library sequences
 Tcomplib [36.3.4 Apr, 2011] (8 proc)
 start: Tue Nov  8 03:18:50 2016 done: Tue Nov  8 03:18:50 2016
 Total Scan time:  3.870 Total Display time:  0.070

Function used was FASTA [36.3.4 Apr, 2011]
Inquiries or Suggestions ?
Send a message to flexiclone AT kazusagt.com