FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7694, 413 aa
1>>>pF1KB7694 413 - 413 aa - 413 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2028+/-0.000762; mu= 5.9120+/- 0.046
mean_var=176.4014+/-36.795, 0's: 0 Z-trim(115.2): 18 B-trim: 0 in 0/52
Lambda= 0.096566
statistics sampled from 15692 (15707) to 15692 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.799), E-opt: 0.2 (0.482), width: 16
Scan time: 3.060
The best scores are: opt bits E(32554)
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 2847 408.2 7.4e-114
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 830 127.2 3.2e-29
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 789 121.5 1.6e-27
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 781 120.4 3.4e-27
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 701 109.2 7.1e-24
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 694 108.3 1.5e-23
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 687 107.1 1.8e-23
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 691 107.8 2e-23
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 639 100.7 3.9e-21
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 440 72.9 7.1e-13
>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa)
initn: 2847 init1: 2847 opt: 2847 Z-score: 2157.6 bits: 408.2 E(32554): 7.4e-114
Smith-Waterman score: 2847; 100.0% identity (100.0% similar) in 413 aa overlap (1-413:1-413)
10 20 30 40 50 60
pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MEFPGLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAAL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
310 320 330 340 350 360
370 380 390 400 410
pF1KB7 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
370 380 390 400 410
>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa)
initn: 956 init1: 724 opt: 830 Z-score: 638.0 bits: 127.2 E(32554): 3.2e-29
Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (16-407:115-479)
10 20 30 40
pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
: :.: :.:: :.. :.:: ..
CCDS30 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
90 100 110 120 130 140
50 60 70 80 90 100
pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
.:.. . . . ...:.:. . :. : .: .: : : : .: :
CCDS30 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
150 160 170 180 190
110 120 130 140 150
pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
:::. . : .. :: :: : ..:. :..: : : : : :.: . :.:
CCDS30 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
200 210 220 230 240
160 170 180 190 200 210
pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
. : :.:: .: : : . :. .:: :. : :.:::::::::::::
CCDS30 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
250 260 270 280 290 300
220 230 240 250 260 270
pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
:::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::.
CCDS30 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
310 320 330 340 350 360
280 290 300 310 320 330
pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
:::::::::::::::.:::::::.:.:::::::: :.:.:: :.: :
CCDS30 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
370 380 390 400 410
340 350 360 370 380 390
pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP
: .. .: . :. : ..: : ..:: : :: ..: : :. :
CCDS30 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
420 430 440 450 460
400 410
pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS
..:. : : : . :..
CCDS30 SSSLSFGHPHPSSMVTAMG
470 480
>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa)
initn: 777 init1: 725 opt: 789 Z-score: 607.6 bits: 121.5 E(32554): 1.6e-27
Smith-Waterman score: 795; 41.2% identity (61.2% similar) in 381 aa overlap (51-408:105-443)
30 40 50 60 70
pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
: ::. :. . . .. :: ..:::
CCDS31 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
80 90 100 110 120 130
80 90 100 110 120 130
pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
. .. :: ::. ... : : . : : : : .. :.. . : ::
CCDS31 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
140 150 160 170 180
140 150 160 170
pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
. :: . .:: : :: : ..: :..:: .: :. :::
CCDS31 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
190 200 210 220 230 240
180 190 200 210 220 230
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
. . : :: :.. :.:::::::::.::::::: ::::::::::::::::::::
CCDS31 TGFGCKSRPKARSST-----EGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
250 260 270 280 290
240 250 260 270 280 290
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
:::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.:
CCDS31 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
.:::::::: :.:.:: : .:: . : .. ...:
CCDS31 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
360 370 380 390
360 370 380 390 400 410
pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
. .. ...:. . . ::.. : :. : .:. :: :.. .:..
CCDS31 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG
400 410 420 430 440
>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa)
initn: 771 init1: 719 opt: 781 Z-score: 601.6 bits: 120.4 E(32554): 3.4e-27
Smith-Waterman score: 787; 40.9% identity (60.9% similar) in 381 aa overlap (51-408:105-442)
30 40 50 60 70
pF1KB7 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
: ::. :. . . .. :: ..:::
CCDS70 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
80 90 100 110 120 130
80 90 100 110 120 130
pF1KB7 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
. .. :: ::. ... : : . : : : : .. :.. . : ::
CCDS70 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
140 150 160 170 180
140 150 160 170
pF1KB7 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
. :: . .:: : :: : ..: :..:: .: :. :::
CCDS70 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
190 200 210 220 230 240
180 190 200 210 220 230
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
. . : :: :.. .:::::::::.::::::: ::::::::::::::::::::
CCDS70 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
250 260 270 280 290
240 250 260 270 280 290
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
:::.::.:: ...::::.:.::::::::::::::.:::::::::::::::..::::::.:
CCDS70 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKK
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB7 DGIQTRNRKASGKGKK--KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
.:::::::: :.:.:: : .:: . : .. ...:
CCDS70 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
360 370 380 390
360 370 380 390 400 410
pF1KB7 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
. .. ...:. . . ::.. : :. : .:. :: :.. .:..
CCDS70 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG
400 410 420 430 440
>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa)
initn: 720 init1: 633 opt: 701 Z-score: 542.1 bits: 109.2 E(32554): 7.1e-24
Smith-Waterman score: 721; 39.8% identity (58.7% similar) in 402 aa overlap (4-400:26-378)
10 20 30
pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSS--TPESGVFFPS
:: :: :.:: :: : : . :: ::
CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGS-------PMFVPPARVPSMLSYLSGCE-PS
10 20 30 40 50
40 50 60 70 80 90
pF1KB7 GPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGW
:. . :: .:::: ..:.. : : ..:. . : ::.. ::
CCDS13 -PQPPELAARPGWAQTATADSSAFGPGSPHPPAAHPPGATAFPFAHSPSG-PGSGGSAG-
60 70 80 90 100
100 110 120 130 140 150
pF1KB7 AYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSL
:. : ... : .. . : : .::. : . .:::
CCDS13 --GRDGSAYQGALLPREQFAAP-----LGRPVGTSYSATYPA-YVSPD------------
110 120 130 140
160 170 180 190 200 210
pF1KB7 PVPNSAYGGPDFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWR
: .: .:: :... . : : .. : :. : :.:::::::: .:::::
CCDS13 -VAQSWTAGP-FDGSVLH--GLPGRRPTFVSDFLEEF----PGEGRECVNCGALSTPLWR
150 160 170 180 190 200
220 230 240 250 260 270
pF1KB7 RDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGD
:: ::::::::::::::::: ::::.::.::: :.::: ::::.::.:::::::. :.
CCDS13 RDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGE
210 220 230 240 250 260
280 290 300 310 320 330
pF1KB7 PVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMV
:::::::::.::: : :::.:.:..::::.:: . .: :::: . .:. .:..
CCDS13 PVCNACGLYMKLHGVPRPLAMKKESIQTRKRKPKTIAKA-RGSSGSTRNASASPSA----
270 280 290 300 310
340 350 360 370 380 390
pF1KB7 VAGGSGSGNCGEVASGLTLGP--PGTAHLYQGLGPVVLSGPVSHL-MPFPGPLLGSPTGS
::. ..:. ... .:. .: :: . :. : : .:: . : .. :.
CCDS13 VASTDSSAATSKAKPSLA-SPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPS--
320 330 340 350 360 370
400 410
pF1KB7 FPTGPMPPTTSTTVVAPLSS
:.: :
CCDS13 --TAPSPQAGLRGALRQEAWCALALA
380 390
>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa)
initn: 820 init1: 644 opt: 694 Z-score: 536.1 bits: 108.3 E(32554): 1.5e-23
Smith-Waterman score: 700; 36.4% identity (56.8% similar) in 426 aa overlap (39-404:3-423)
10 20 30 40 50 60
pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA
..: ::. : : :.. :... : :
CCDS78 MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA
10 20 30
70 80 90 100 110 120
pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA
:::. : :. ..: .:: .: . :..: :: . : :.. :: .
CCDS78 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS
40 50 60 70 80 90
130 140 150 160
pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY
:: :: . . . : . . : : ..: . :
CCDS78 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY
100 110 120 130 140
170 180 190
pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC---------
: :.... :: .:. .:: ..:: :. .:: :
CCDS78 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLVDM
150 160 170 180 190 200
200 210 220 230 240 250
pF1KB7 -----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRA
:.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:.
CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
210 220 230 240 250 260
260 270 280 290 300 310
pF1KB7 GTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGK
: .:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .:
CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
270 280 290 300 310 320
320 330 340 350 360
pF1KB7 KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGP
.: .. .:. . ::.: .... ... :. ::. .. . : ..
CCDS78 SKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSV
330 340 350 360 370 380
370 380 390 400 410
pF1KB7 VVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS
..:: . : . : :: : . :.. : :.:
CCDS78 SAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
390 400 410 420 430 440
>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa)
initn: 852 init1: 644 opt: 687 Z-score: 534.7 bits: 107.1 E(32554): 1.8e-23
Smith-Waterman score: 687; 50.7% identity (73.0% similar) in 211 aa overlap (200-404:7-216)
170 180 190 200 210 220
pF1KB7 STFFSPTGSPLNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACG
:.:::::::: .::::::: ::::::::::
CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG
10 20 30
230 240 250 260 270 280
pF1KB7 LYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLH
::::::: :::::.:..:: .:.:.: .:.:::::::::::::: :.:::::::::.:::
CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH
40 50 60 70 80 90
290 300 310 320 330 340
pF1KB7 QVNRPLTMRKDGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV
: :::.:::.:::::.:: .. .:.: .. .:. . ::.: .... ... :.
CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGS-ESLPPASGASSNSSNATTSSSEEM
100 110 120 130 140 150
350 360 370 380 390 400
pF1KB7 -----ASGLTLGPPGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTT
::. .. . : .. ..:: . : . : :: : . :.. : :.
CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS
160 170 180 190 200 210
410
pF1KB7 STTVVAPLSS
:
CCDS78 SKQDSWNSLVLADSHGDIITA
220 230
>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa)
initn: 820 init1: 644 opt: 691 Z-score: 533.9 bits: 107.8 E(32554): 2e-23
Smith-Waterman score: 702; 36.5% identity (56.9% similar) in 425 aa overlap (39-404:3-422)
10 20 30 40 50 60
pF1KB7 LGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEA
..: ::. : : :.. :... : :
CCDS59 MYQSLAMAANHGPPPGAYEAGGPGAFMHGAGA
10 20 30
70 80 90 100 110 120
pF1KB7 YRHSPVFQVYPL-------LNCMEGIPGGSPYAGWAYGKTGLYPASTVCP-TREDSPPQA
:::. : :. ..: .:: .: . :..: :: . : :.. :: .
CCDS59 AS-SPVYVPTPRVPSSVLGLSYLQGGGAGSASGGASGGSSG-GAASGAGPGTQQGSPGWS
40 50 60 70 80 90
130 140 150 160
pF1KB7 VEDLDGK-----------------GSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAY
:: :: . . . : . . : : ..: . :
CCDS59 QAGADGAAYTPPPVSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL-AGREQY
100 110 120 130 140
170 180 190
pF1KB7 GGPDFSSTFFSP-------TGSPLNSAA------YSSPKLRGTLP--LPPC---------
: :.... :: .:. .:: ..:: :. .:: :
CCDS59 GRAGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLH-SLPGRANPAARHPNLDMF
150 160 170 180 190 200
200 210 220 230 240 250
pF1KB7 ----EARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAG
:.:::::::: .::::::: ::::::::::::::::: :::::.:..:: .:.:.:
CCDS59 DDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVG
210 220 230 240 250 260
260 270 280 290 300 310
pF1KB7 TQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK
.:.:::::::::::::: :.:::::::::.::: : :::.:::.:::::.:: .. .:.
CCDS59 LSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKS
270 280 290 300 310 320
320 330 340 350 360 370
pF1KB7 KRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEV-----ASGLTLGPPGTAHLYQGLGPV
: .. .:. . ::.: .... ... :. ::. .. . : ..
CCDS59 KTPAAPSGS-ESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVS
330 340 350 360 370 380
380 390 400 410
pF1KB7 VLSGPVSHLMPFPGPLLGSPTG-SFPTGPMPPTTSTTVVAPLSS
..:: . : . : :: : . :.. : :.:
CCDS59 AMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
390 400 410 420 430 440
>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa)
initn: 777 init1: 608 opt: 639 Z-score: 492.9 bits: 100.7 E(32554): 3.9e-21
Smith-Waterman score: 678; 36.9% identity (56.9% similar) in 385 aa overlap (35-412:234-588)
10 20 30 40 50 60
pF1KB7 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR
: : : :......:. : .::: ..
CCDS11 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF
210 220 230 240 250 260
70 80 90 100 110
pF1KB7 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGLYPASTVCPTREDSPPQ-----
: :: :. : ::: :: . : :. ... . ::
CCDS11 P---YSPSP-----PMANGAAREPGGYAAAG-SGGAGGVSGGGSSLAAMGGREPQYSSLS
270 280 290 300 310
120 130 140 150 160 170
pF1KB7 AVEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSP
:.. :.: .. . . .. :. . . : . : . . : . : . : .:.:
CCDS11 AARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAP
320 330 340 350 360
180 190 200 210 220 230
pF1KB7 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
: : : : :.:::::::. ::::::: :::::::::::: :::: .:
CCDS11 LPVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSR
370 380 390 400 410 420
240 250 260 270 280 290
pF1KB7 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
:::.:.::. :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.:
CCDS11 PLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKK
430 440 450 460 470 480
300 310 320 330 340 350
pF1KB7 DGIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPG
.:::::.:: .. .:.: :. .... :. . .:.: .:.. .: :
CCDS11 EGIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PT
490 500 510 520 530
360 370 380 390 400 410
pF1KB7 TAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS
: .: : :..: : . : : .. : :. :. : : :
CCDS11 TQPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALA
540 550 560 570 580 590
CCDS11 LA
>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa)
initn: 685 init1: 343 opt: 440 Z-score: 344.6 bits: 72.9 E(32554): 7.1e-13
Smith-Waterman score: 745; 41.2% identity (58.3% similar) in 408 aa overlap (16-407:115-465)
10 20 30 40
pF1KB7 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
: :.: :.:: :.. :.:: ..
CCDS46 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
90 100 110 120 130 140
50 60 70 80 90 100
pF1KB7 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
.:.. . . . ...:.:. . :. : .: .: : : : .: :
CCDS46 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
150 160 170 180 190
110 120 130 140 150
pF1KB7 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
:::. . : .. :: :: : ..:. :..: : : : : :.: . :.:
CCDS46 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
200 210 220 230 240
160 170 180 190 200 210
pF1KB7 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
. : :.:: .: : : . :. .:: :. : :.:::::::::::::
CCDS46 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
250 260 270 280 290 300
220 230 240 250 260 270
pF1KB7 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
:::: :::::::::::::::::::::::.::.:: :::::::::::.
CCDS46 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLWRRNAN
310 320 330 340 350
280 290 300 310 320 330
pF1KB7 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
:::::::::::::::.:::::::.:.:::::::: :.:.:: :.: :
CCDS46 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
360 370 380 390
340 350 360 370 380 390
pF1KB7 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVSH---LMPFPGPLLGSP
: .. .: . :. : ..: : ..:: : :: ..: : :. :
CCDS46 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
400 410 420 430 440
400 410
pF1KB7 TGSFPTG-PMPPTTSTTVVAPLSS
..:. : : : . :..
CCDS46 SSSLSFGHPHPSSMVTAMG
450 460
413 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 21:36:01 2016 done: Fri Nov 4 21:36:02 2016
Total Scan time: 3.060 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]