FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8362, 443 aa
1>>>pF1KB8362 443 - 443 aa - 443 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.7969+/-0.000894; mu= -2.2156+/- 0.054
mean_var=228.1141+/-47.195, 0's: 0 Z-trim(115.3): 18 B-trim: 770 in 1/51
Lambda= 0.084918
statistics sampled from 15802 (15818) to 15802 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.797), E-opt: 0.2 (0.486), width: 16
Scan time: 3.100
The best scores are: opt bits E(32554)
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 3145 397.7 1.2e-110
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 3133 396.2 3.4e-110
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 1342 176.8 4e-44
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 776 107.5 2.7e-23
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 747 103.9 3e-22
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 727 101.5 1.8e-21
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 724 101.1 2.3e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 715 99.9 3e-21
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 672 94.8 2.5e-19
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 664 93.8 4e-19
>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa)
initn: 3145 init1: 3145 opt: 3145 Z-score: 2099.9 bits: 397.7 E(32554): 1.2e-110
Smith-Waterman score: 3145; 99.8% identity (100.0% similar) in 443 aa overlap (1-443:1-443)
10 20 30 40 50 60
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB8 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 GGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB8 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEG
:::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::
CCDS70 IKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB8 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS70 IQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPT
370 380 390 400 410 420
430 440
pF1KB8 PMHPPSSLSFGPHHPSSMVTAMG
:::::::::::::::::::::::
CCDS70 PMHPPSSLSFGPHHPSSMVTAMG
430 440
>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa)
initn: 2010 init1: 1849 opt: 3133 Z-score: 2091.9 bits: 396.2 E(32554): 3.4e-110
Smith-Waterman score: 3133; 99.5% identity (99.8% similar) in 444 aa overlap (1-443:1-444)
10 20 30 40 50 60
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFNIDGQGNHV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PPYYGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SIHHGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLL
190 200 210 220 230 240
250 260 270 280 290
pF1KB8 GGSPTGFGCKSRPKARSST-GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP
::::::::::::::::::: ::::::::::::::::::::::::::::::::::::::::
CCDS31 GGSPTGFGCKSRPKARSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRP
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB8 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKE
::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
CCDS31 LIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKE
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB8 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTP
370 380 390 400 410 420
420 430 440
pF1KB8 TPMHPPSSLSFGPHHPSSMVTAMG
::::::::::::::::::::::::
CCDS31 TPMHPPSSLSFGPHHPSSMVTAMG
430 440
>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa)
initn: 1477 init1: 814 opt: 1342 Z-score: 905.6 bits: 176.8 E(32554): 4e-44
Smith-Waterman score: 1918; 62.3% identity (77.7% similar) in 485 aa overlap (1-443:1-480)
10 20 30 40 50
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
:::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.:::
CCDS30 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP
:::.: ..: .. : :.: :.:.::: :::. .::::::::: : : .:
CCDS30 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP
60 70 80 90 100 110
120 130 140 150
pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP
:..:::::: .: :.:: :::::: :...: .:. :.. ::: :::
CCDS30 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP
120 130 140 150 160 170
160 170 180 190 200
pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL
::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. :
CCDS30 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT
180 190 200 210 220 230
210 220 230 240 250 260
pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC
:.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : ::::
CCDS30 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT
::::::.::::::::::::::::::::::::::::::::::::::::::::: :::::::
CCDS30 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTT
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE
::::::::::::::::::::::.:::.:::::::::::::::::::.:::: :: . .:
CCDS30 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE
360 370 380 390 400 410
390 400 410 420 430
pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM
.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: :::::
CCDS30 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM
420 430 440 450 460 470
440
pF1KB8 VTAMG
:::::
CCDS30 VTAMG
480
>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa)
initn: 766 init1: 714 opt: 776 Z-score: 531.8 bits: 107.5 E(32554): 2.7e-23
Smith-Waterman score: 782; 40.7% identity (60.9% similar) in 381 aa overlap (105-442:51-408)
80 90 100 110 120 130
pF1KB8 YPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYP
: ::. :. . . .. :: ..:::
CCDS14 PALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYRDAEAYRHSP-VFQVYP
30 40 50 60 70
140 150 160 170 180
pF1KB8 PASS-SSLSGGHASPHL-FTFPPT---PPKDVSPDPSLSTPGSA----GSARQDEKECLK
. .. :: ::. ... : : . : : : : .. :.. . : ::
CCDS14 LLNCMEGIPGG--SPYAGWAYGKTGLYPASTVCPTREDSPPQAVEDLDGKGSTSFLETLK
80 90 100 110 120 130
190 200 210 220 230 240
pF1KB8 YQVPLPDSMKLESSHSRGSMTALGGA-SSSTHHPITTYPPYVPEYSSGLFPPSSLLGGSP
. :: . .:: : :: : ..: :..:: .: :. :::
CCDS14 TERLSPD------------LLTLGPALPSSLPVPNSAYGG--PDFSSTFFSPT----GSP
140 150 160 170
250 260 270 280 290
pF1KB8 TGFGCKSRPKARSST------GRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNR
. . : :: :.. .:::::::::.::::::: ::::::::::::::::::::
CCDS14 LNSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNR
180 190 200 210 220 230
300 310 320 330 340 350
pF1KB8 PLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKK
:::.::.:: ...::::.:.::::::::::::::.::::::::::::.::..::::::.:
CCDS14 PLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRK
240 250 260 270 280 290
360 370 380 390
pF1KB8 EGIQTRNRKMSSKSKKCKKVHDSL-----EDFPKNS--------------------SFNP
.:::::::: :.:.: :: .:: . : .. ...:
CCDS14 DGIQTRNRKASGKGK--KKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGP
300 310 320 330 340 350
400 410 420 430 440
pF1KB8 AALSRHMSSLSHISPFSHSSHMLTTPTPM--HPPSSLSFGPHHPSSMVTAMG
. .. ...:. . . ::.. : :. : .:. :: :.. .:..
CCDS14 PGTAHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGPMPPTTSTTVVAPLSS
360 370 380 390 400 410
>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa)
initn: 889 init1: 651 opt: 747 Z-score: 512.9 bits: 103.9 E(32554): 3e-22
Smith-Waterman score: 747; 41.8% identity (61.8% similar) in 361 aa overlap (98-434:18-359)
70 80 90 100 110 120
pF1KB8 VRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSP------FSKTS
:.:. : . ..:: . : .: :
CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSMLSYLS
10 20 30 40
130 140 150 160 170
pF1KB8 IHHGSPGP--LSVYP----PASSSSLSGGHASPHLFTFPPTP-PKDVSPDP---SLSTPG
. :: : :.. : :...: . : .::: ::. : .. : : : ::
CCDS13 GCEPSPQPPELAARPGWAQTATADSSAFGPGSPH----PPAAHPPGATAFPFAHSPSGPG
50 60 70 80 90 100
180 190 200 210 220 230
pF1KB8 SAGSARQDEKECLKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSS
:.::: .. :: : .. . .: :.: :. .: . : . ...
CCDS13 SGGSA--GGRDGSAYQGALLPREQFAAPLGRPV-----GTSYSATYPAYVSPDVAQSWTA
110 120 130 140 150
240 250 260 270 280
pF1KB8 GLFPPSSLLG--GSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNACGL
: : : : : : : .. . . ::::::::: ::::::::::::::::::::
CCDS13 GPFDGSVLHGLPGRRPTF-VSDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNACGL
160 170 180 190 200 210
290 300 310 320 330 340
pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN
:::::: ::::..:..:::..:::: :.::.::.:::::::..:.:::::::::..::.
CCDS13 YHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKLHG
220 230 240 250 260 270
350 360 370 380 390 400
pF1KB8 INRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLEDFPKNSSFNPAALSRHMSS--LSHIS
. :::.::::.::::.: : : :.. : .:.: .:.:.. :: :. .
CCDS13 VPRPLAMKKESIQTRKR----KPKTIAKARGS-SGSTRNASASPSAVASTDSSAATSKAK
280 290 300 310 320 330
410 420 430 440
pF1KB8 PFSHSSHMLTTPTPMHPPSSL----SFGPHHPSSMVTAMG
: : .: . :. : : .: :..: :
CCDS13 P-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQ
340 350 360 370 380
CCDS13 EAWCALALA
390
>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa)
initn: 690 init1: 690 opt: 727 Z-score: 498.9 bits: 101.5 E(32554): 1.8e-21
Smith-Waterman score: 748; 40.6% identity (62.4% similar) in 362 aa overlap (94-436:51-395)
70 80 90 100 110 120
pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH
: .:.:: : :: :: . : .
CCDS59 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS
30 40 50 60 70
130 140 150 160 170 180
pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC
..:: . : :... .:. .: ::. :. : . : ..:..: .:
CCDS59 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA
80 90 100 110 120
190 200 210 220 230 240
pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG-
:. . ... . . ....:. :: : :: :. . ... .. .:
CCDS59 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP
130 140 150 160 170 180
250 260 270 280
pF1KB8 --SPTGFGCKSR--PKARS---------STGRECVNCGATSTPLWRRDGTGHYLCNACGL
::. . .: : :: : ::::::::: ::::::::::::::::::::
CCDS59 FDSPVLHSLPGRANPAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGL
190 200 210 220 230 240
290 300 310 320 330 340
pF1KB8 YHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHN
:::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..::.
CCDS59 YHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHG
250 260 270 280 290 300
350 360 370 380 390 400
pF1KB8 INRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHISP
. :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: .. :
CCDS59 VPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRP
310 320 330 340 350 360
410 420 430 440
pF1KB8 FSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG
.. :::. . . . : ... : ::
CCDS59 IKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSSK
370 380 390 400 410 420
CCDS59 QDSWNSLVLADSHGDIITA
430 440
>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa)
initn: 690 init1: 690 opt: 724 Z-score: 496.9 bits: 101.1 E(32554): 2.3e-21
Smith-Waterman score: 746; 40.5% identity (62.3% similar) in 363 aa overlap (94-436:51-396)
70 80 90 100 110 120
pF1KB8 YGNSVRATVQRYPPTHHGSQVCRPPLLHGSLPWLDGGKALGSHHTASPWNLSPFSKTSIH
: .:.:: : :: :: . : .
CCDS78 GGPGAFMHGAGAASSPVYVPTPRVPSSVLGLSYLQGGGA-GS---ASGGASGGSSGGAAS
30 40 50 60 70
130 140 150 160 170 180
pF1KB8 HGSPGPLSVYPPASSSSLSGGHASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKEC
..:: . : :... .:. .: ::. :. : . : ..:..: .:
CCDS78 GAGPGTQQGSPGWSQAGADGAAYTP-----PPVSPRFSFPGTTGSLAAAAAAAAA--REA
80 90 100 110 120
190 200 210 220 230 240
pF1KB8 LKYQVPLPDSMKLESSHSRGSMTALGGASSSTHHPITTYPPYVPEYSSGLFPPSSLLGG-
:. . ... . . ....:. :: : :: :. . ... .. .:
CCDS78 AAYSSGGGAAGAGLAGREQYGRAGFAGSYSS---P---YPAYMADVGASWAAAAAASAGP
130 140 150 160 170 180
250 260 270 280
pF1KB8 --SPTGFGCKSR--PKARS----------STGRECVNCGATSTPLWRRDGTGHYLCNACG
::. . .: : :: : ::::::::: :::::::::::::::::::
CCDS78 FDSPVLHSLPGRANPAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACG
190 200 210 220 230 240
290 300 310 320 330 340
pF1KB8 LYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYELH
::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..::
CCDS78 LYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLH
250 260 270 280 290 300
350 360 370 380 390 400
pF1KB8 NINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHIS
.. :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: ..
CCDS78 GVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEMR
310 320 330 340 350 360
410 420 430 440
pF1KB8 PFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG
:.. :::. . . . : ... : ::
CCDS78 PIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTSS
370 380 390 400 410 420
CCDS78 KQDSWNSLVLADSHGDIITA
430 440
>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa)
initn: 690 init1: 690 opt: 715 Z-score: 495.1 bits: 99.9 E(32554): 3e-21
Smith-Waterman score: 715; 58.7% identity (77.7% similar) in 184 aa overlap (258-436:6-189)
230 240 250 260 270 280
pF1KB8 EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTGRECVNCGATSTPLWRRDGTGHYLCNAC
: ::::::::: ::::::::::::::::::
CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC
10 20 30
290 300 310 320 330 340
pF1KB8 GLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTTTTTLWRRNANGDPVCNACGLYYEL
:::::::: :::::::.:::::.::.: :::::::::::::::::.:.:::::::::..:
CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL
40 50 60 70 80 90
350 360 370 380 390 400
pF1KB8 HNINRPLTMKKEGIQTRNRKMSSKSK-KCKKVHDSLEDFPKNSSFNPAALSRHMSSLSHI
:.. :::.:.:::::::.:: .. .: : . .. :..: :. . . . :: ..
CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM
100 110 120 130 140 150
410 420 430 440
pF1KB8 SPFSH----SSHMLTTPTPMHPPSSLSFGPHHPSSMVTAMG
:.. :::. . . . : ... : ::
CCDS78 RPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQGYASPVSQSPQTS
160 170 180 190 200 210
CCDS78 SKQDSWNSLVLADSHGDIITA
220 230
>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa)
initn: 726 init1: 634 opt: 672 Z-score: 460.6 bits: 94.8 E(32554): 2.5e-19
Smith-Waterman score: 711; 35.9% identity (57.2% similar) in 437 aa overlap (6-417:142-547)
10 20 30
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
.::. . .. :.:..: : : :.
CCDS11 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
120 130 140 150 160 170
40 50 60 70 80 90
pF1KB8 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRPPLL
:: :: : :. .: ::. .. . : .: :. .:
CCDS11 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
180 190 200 210 220
100 110 120 130 140
pF1KB8 HGSL---PWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
..: :. .:: : :. .:.: . . ... : .. : : :: .... ::.
CCDS11 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
230 240 250 260 270 280
150 160 170 180 190 200
pF1KB8 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
:. :: : : . .: :. . :. :: ... . : .
CCDS11 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
290 300 310 320 330
210 220 230 240 250
pF1KB8 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKARS
::: . : ::: : . .: : : :: . . . . :.:
CCDS11 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
340 350 360 370 380
260 270 280 290 300 310
pF1KB8 ----STGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
: .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..::
CCDS11 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
390 400 410 420 430 440
320 330 340 350 360 370
pF1KB8 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSS--K
: :::::.:::::::::::.:.:::::::::..::.. :::.:::::::::.:: .. :
CCDS11 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
450 460 470 480 490 500
380 390 400 410 420 430
pF1KB8 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
:: :. . ..:. : ..: : :.. : .. . . .. ..:
CCDS11 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
510 520 530 540 550 560
440
pF1KB8 GPHHPSSMVTAMG
CCDS11 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
570 580 590
>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa)
initn: 1117 init1: 365 opt: 664 Z-score: 456.9 bits: 93.8 E(32554): 4e-19
Smith-Waterman score: 1789; 59.6% identity (75.1% similar) in 485 aa overlap (1-443:1-466)
10 20 30 40 50
pF1KB8 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
:::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.:::
CCDS46 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
10 20 30 40 50
60 70 80 90 100 110
pF1KB8 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGSH---HTASP
:::.: ..: .. : :.: :.:.::: :::. .::::::::: : : .:
CCDS46 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNP
60 70 80 90 100 110
120 130 140 150
pF1KB8 WNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFPP
:..:::::: .: :.:: :::::: :...: .:. :.. ::: :::
CCDS46 WTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPP
120 130 140 150 160 170
160 170 180 190 200
pF1KB8 TPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTAL
::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. :
CCDS46 TPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLAT
180 190 200 210 220 230
210 220 230 240 250 260
pF1KB8 GGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGREC
:.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : ::::
CCDS46 MGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGREC
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB8 VNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQTT
::::::.::::::::::::::::::::::::::::::::::::: ::
CCDS46 VNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TT
300 310 320 330 340
330 340 350 360 370 380
pF1KB8 TTTLWRRNANGDPVCNACGLYYELHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSLE
::::::::::::::::::::::.:::.:::::::::::::::::::.:::: :: . .:
CCDS46 TTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFE
350 360 370 380 390 400
390 400 410 420 430
pF1KB8 DFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSSM
.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: :::::
CCDS46 ELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSM
410 420 430 440 450 460
440
pF1KB8 VTAMG
:::::
CCDS46 VTAMG
443 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 12:09:39 2016 done: Fri Nov 4 12:09:39 2016
Total Scan time: 3.100 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]