FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9437, 595 aa
1>>>pF1KB9437 595 - 595 aa - 595 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.2810+/- 0.001; mu= -5.9162+/- 0.060
mean_var=397.9538+/-83.464, 0's: 0 Z-trim(116.2): 40 B-trim: 0 in 0/51
Lambda= 0.064292
statistics sampled from 16734 (16767) to 16734 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.515), width: 16
Scan time: 3.870
The best scores are: opt bits E(32554)
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 4132 397.3 2.8e-110
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 1032 109.7 8.2e-24
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 1014 108.0 2.6e-23
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 929 100.1 5.7e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 834 91.1 1.7e-18
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 768 85.2 2e-16
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 682 77.2 4.9e-14
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 677 76.8 6.7e-14
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 639 73.2 7.3e-13
>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa)
initn: 4132 init1: 4132 opt: 4132 Z-score: 2093.3 bits: 397.3 E(32554): 2.8e-110
Smith-Waterman score: 4132; 100.0% identity (100.0% similar) in 595 aa overlap (1-595:1-595)
10 20 30 40 50 60
pF1KB9 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG
490 500 510 520 530 540
550 560 570 580 590
pF1KB9 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
550 560 570 580 590
>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa)
initn: 1160 init1: 814 opt: 1032 Z-score: 541.0 bits: 109.7 E(32554): 8.2e-24
Smith-Waterman score: 1256; 49.8% identity (68.1% similar) in 476 aa overlap (147-595:1-433)
120 130 140 150 160 170
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA
:::.:: ...:: .::. :.::.:.:.:
CCDS59 MYQSLAMAANHGPPPGAYEAGGPGAFMHGA
10 20 30
180 190 200 210 220 230
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP
. :::::::::: :: : . :: : :::.:.: :. :::.. . ::. .:
CCDS59 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP
40 50 60 70 80
240 250 260 270 280 290
pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG
:. :. : . :: ::. . :: :: . . . .: .:: :::. .:.
CCDS59 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY
90 100 110 120 130
300 310 320 330 340
pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW
::::.. :...::: ::. . : :.: ::: : ::: . :
CCDS59 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA
140 150 160 170
350 360 370 380 390 400
pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTG
: :::..:::::: .::. :. : :. :...:.::.:::::::...::::::::::
CCDS59 AASAGPFDSPVLHSLPGRAN---PAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTG
180 190 200 210 220 230
410 420 430 440 450 460
pF1KB9 HYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNA
:::::::::: ::::..:::::::.:. .:::.:::::::.:::::::::::::::::::
CCDS59 HYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNA
240 250 260 270 280 290
470 480 490 500 510 520
pF1KB9 CGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDD
::::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::..
CCDS59 CGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSN
300 310 320 330 340 350
530 540 550 560
pF1KB9 CSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLY
. ..: .: . : . .:.: : : .: : :: : : :
CCDS59 ATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYA
360 370 380 390 400 410
570 580 590
pF1KB9 IGVSLASPAEVTSSVRPDSWCALALA
:: :: .: . ::: .:.::
CCDS59 SPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA
420 430 440
>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa)
initn: 1160 init1: 814 opt: 1014 Z-score: 532.0 bits: 108.0 E(32554): 2.6e-23
Smith-Waterman score: 1246; 49.7% identity (68.1% similar) in 477 aa overlap (147-595:1-434)
120 130 140 150 160 170
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA
:::.:: ...:: .::. :.::.:.:.:
CCDS78 MYQSLAMAANHGPPPGAYEAGGPGAFMHGA
10 20 30
180 190 200 210 220 230
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP
. :::::::::: :: : . :: : :::.:.: :. :::.. . ::. .:
CCDS78 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP
40 50 60 70 80
240 250 260 270 280 290
pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG
:. :. : . :: ::. . :: :: . . . .: .:: :::. .:.
CCDS78 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY
90 100 110 120 130
300 310 320 330 340
pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW
::::.. :...::: ::. . : :.: ::: : ::: . :
CCDS78 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA
140 150 160 170
350 360 370 380 390 400
pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPS-ADLLEDLSESRECVNCGSIQTPLWRRDGT
: :::..:::::: .::. :. : :. .:...:.::.:::::::...:::::::::
CCDS78 AASAGPFDSPVLHSLPGRAN---PAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGT
180 190 200 210 220 230
410 420 430 440 450 460
pF1KB9 GHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCN
::::::::::: ::::..:::::::.:. .:::.:::::::.::::::::::::::::::
CCDS78 GHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCN
240 250 260 270 280 290
470 480 490 500 510 520
pF1KB9 ACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSD
:::::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::.
CCDS78 ACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSS
300 310 320 330 340 350
530 540 550 560
pF1KB9 DCSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGL
. . ..: .: . : . .:.: : : .: : :: : : :
CCDS78 NATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GY
360 370 380 390 400 410
570 580 590
pF1KB9 YIGVSLASPAEVTSSVRPDSWCALALA
:: :: .: . ::: .:.::
CCDS78 ASPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA
420 430 440
>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa)
initn: 1143 init1: 739 opt: 929 Z-score: 490.0 bits: 100.1 E(32554): 5.7e-21
Smith-Waterman score: 1113; 43.8% identity (65.6% similar) in 454 aa overlap (147-595:1-397)
120 130 140 150 160 170
pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAA
:::.:: .: ::: . :.:.:
CCDS13 MYQSLALAASPRQAAYADS-GSFLH-----
10 20
180 190 200 210 220 230
pF1KB9 AAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQ-ASADSPPY
: .:.::..:: .:: ::: : :: :. . .:.::: : :.::: .
CCDS13 ---APGAGSPMFVPPARVPSMLSYL------SGCEPSPQPPELAARPGWAQTATADSSAF
30 40 50 60 70
240 250 260 270 280 290
pF1KB9 GSGGGAAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSG
: :. :: : :: . ::.. :: .. ::::..:
CCDS13 GP--GSPHPPAAHPPGATA--------FPFAHSP-------------SGPGSGGSAGGRD
80 90 100 110
300 310 320 330 340 350
pF1KB9 GGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFE
:.. .:. :: :... .::.. .: . : ::. .. .: ::::.
CCDS13 GSAYQGALLPRE-QFAA-PLGRPVGTSYS----------ATYPAYVSPDVAQSWTAGPFD
120 130 140 150 160
360 370 380 390 400 410
pF1KB9 TPVLHSLQSRAGAPLPVPRGPSADLLEDL-SESRECVNCGSIQTPLWRRDGTGHYLCNAC
:::.: .: : : .:.::.. .:.:::::::...:::::::::::::::::
CCDS13 GSVLHGLPGRR--PTFV-----SDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNAC
170 180 190 200 210
420 430 440 450 460 470
pF1KB9 GLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKL
::: ::::..:::..::::. :::: :: :.:::::.:::::::.:::::::::::::::
CCDS13 GLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKL
220 230 240 250 260 270
480 490 500 510 520 530
pF1KB9 HGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPT-
::::::::::::.:::::::::.: :.. ::.. :. . .:..:. .....:.
CCDS13 HGVPRPLAMKKESIQTRKRKPKTIAKARGSSGSTRNASASPSAVASTDSSAATSKAKPSL
280 290 300 310 320 330
540 550 560 570 580 590
pF1KB9 TQPTASGAG-APVMTGA-GESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCA
..:. : . :: .: .: : . :.:. .: . ... . : . ...: ..:::
CCDS13 ASPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQEAWCA
340 350 360 370 380 390
pF1KB9 LALA
::::
CCDS13 LALA
>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa)
initn: 1016 init1: 814 opt: 834 Z-score: 445.3 bits: 91.1 E(32554): 1.7e-18
Smith-Waterman score: 868; 59.4% identity (76.1% similar) in 234 aa overlap (380-595:1-227)
350 360 370 380 390 400
pF1KB9 PAGPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHY
...:.::.:::::::...::::::::::::
CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHY
10 20 30
410 420 430 440 450 460
pF1KB9 LCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACG
:::::::: ::::..:::::::.:. .:::.:::::::.:::::::::::::::::::::
CCDS78 LCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACG
40 50 60 70 80 90
470 480 490 500 510 520
pF1KB9 LYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDDCS
::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::.. .
CCDS78 LYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSNAT
100 110 120 130 140
530 540 550 560 570
pF1KB9 KNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLYIG
..: .: . : . .:.: : : .: : :: : : :
CCDS78 TSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYASP
150 160 170 180 190 200
580 590
pF1KB9 VSLASPAEVTSSVRPDSWCALALA
:: :: .: . ::: .:.::
CCDS78 VS-QSPQ---TSSKQDSWNSLVLADSHGDIITA
210 220 230
>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa)
initn: 722 init1: 648 opt: 768 Z-score: 408.2 bits: 85.2 E(32554): 2e-16
Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (144-506:42-410)
120 130 140 150 160 170
pF1KB9 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA
:.:. . :.::: : :
CCDS30 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A
20 30 40 50 60
180 190 200 210 220
pF1KB9 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGWP
: : : .. ::... : :.: ::::. :.:. . : :..: : :
CCDS30 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT
70 80 90 100 110
230 240 250 260
pF1KB9 QAS-ADSPPYGSGGGAAGG------GAAGPGGAGSA---------AAHVSAR-FPYSPSP
. . .: . :..:. :: ::.: .:.::. ::: ... : . :.:
CCDS30 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP
120 130 140 150 160 170
270 280 290 300 310 320
pF1KB9 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH
: . : :. .:..::: .. : . .. . :.. .. :: :
CCDS30 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG
180 190 200 210 220 230
330 340 350 360 370 380
pF1KB9 HHHHHHHPSPYSP-YVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE
. ::: : : :: :: : . . ..: : . :.. : :. . .
CCDS30 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R
240 250 260 270 280
390 400 410 420 430 440
pF1KB9 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL
. ::.:::::::. :::::::::::::::::::: :::: .::::::..:. ..:: :
CCDS30 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT
290 300 310 320 330 340
450 460 470 480 490 500
pF1KB9 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK
::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: :
CCDS30 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K
350 360 370 380 390 400
510 520 530 540 550 560
pF1KB9 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY
. .:
CCDS30 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS
410 420 430 440 450 460
>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa)
initn: 735 init1: 643 opt: 682 Z-score: 365.5 bits: 77.2 E(32554): 4.9e-14
Smith-Waterman score: 724; 36.4% identity (57.9% similar) in 437 aa overlap (142-547:6-418)
120 130 140 150 160 170
pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
.::. . .. :.:..: : : :.
CCDS31 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
10 20 30
180 190 200 210 220
pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
:: :: : :. .: ::. .. . : .: :. .: :
CCDS31 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P
40 50 60 70 80
230 240 250 260 270 280
pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
. : :. .:: : :. .:.: . . ... : .. : : :: .... ::.
CCDS31 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
90 100 110 120 130 140
290 300 310 320 330
pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
:. :: : : . .: :. . :. :: ... . : .
CCDS31 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
150 160 170 180 190 200
340 350 360 370 380
pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
::: . : ::: : . .: : : :: . . . . :.:
CCDS31 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA--
210 220 230 240 250
390 400 410 420 430 440
pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
.. .:.:::::::. .:::::::::::::::::::: :::: .::::::..:. ..::
CCDS31 -RSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
260 270 280 290 300 310
450 460 470 480 490 500
pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
: :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: .. :
CCDS31 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K
320 330 340 350 360 370
510 520 530 540 550 560
pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
:: :. . ..:. : ..: : :.. : .. . . .. ..:
CCDS31 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
380 390 400 410 420 430
570 580 590
pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
CCDS31 GPHHPSSMVTAMG
440
>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa)
initn: 731 init1: 639 opt: 677 Z-score: 363.0 bits: 76.8 E(32554): 6.7e-14
Smith-Waterman score: 716; 36.4% identity (57.2% similar) in 437 aa overlap (142-547:6-417)
120 130 140 150 160 170
pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV
.::. . .. :.:..: : : :.
CCDS70 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS
10 20 30
180 190 200 210 220
pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP
:: :: : :. .: ::. .. . : .: :. .: :
CCDS70 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P
40 50 60 70 80
230 240 250 260 270 280
pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY
. : :. .:: : :. .:.: . . ... : .. : : :: .... ::.
CCDS70 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH
90 100 110 120 130 140
290 300 310 320 330
pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH---
:. :: : : . .: :. . :. :: ... . : .
CCDS70 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM
150 160 170 180 190 200
340 350 360 370 380
pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL
::: . : ::: : . .: : : :: . . . . :.:
CCDS70 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA--
210 220 230 240 250
390 400 410 420 430 440
pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL
: .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..::
CCDS70 --RSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
260 270 280 290 300 310
450 460 470 480 490 500
pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK
: :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: .. :
CCDS70 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K
320 330 340 350 360 370
510 520 530 540 550 560
pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL
:: :. . ..:. : ..: : :.. : .. . . .. ..:
CCDS70 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF
380 390 400 410 420 430
570 580 590
pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA
CCDS70 GPHHPSSMVTAMG
440
>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa)
initn: 777 init1: 608 opt: 639 Z-score: 344.4 bits: 73.2 E(32554): 7.3e-13
Smith-Waterman score: 678; 37.5% identity (57.3% similar) in 384 aa overlap (234-588:35-412)
210 220 230 240 250 260
pF1KB9 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF
: : : :......:. : .::: ..
CCDS14 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR
10 20 30 40 50 60
270 280 290 300 310
pF1KB9 P---YSPSP-----PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLSA
: :: :. : ::: :: : : .: . .. :: : .:
CCDS14 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAG--WAYGKTGLYPASTVCPTRED--SPPQA
70 80 90 100 110 120
320 330 340 350 360 370
pF1KB9 ARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAPL
.. :.: .. . . .. :. . . : . : . . : . : . : .:.::
CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL
130 140 150 160 170 180
380 390 400 410 420
pF1KB9 PVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRP
: : : :.:::::::. ::::::: :::::::::::: :::: .::
CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP
190 200 210 220 230 240
430 440 450 460 470 480
pF1KB9 LIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKE
::.:.::. :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.:.
CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD
250 260 270 280 290 300
490 500 510 520 530
pF1KB9 GIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PTT
:::::.:: .. .:.: :. .... :. . .:.: .:.. .: : :
CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT
310 320 330 340 350 360
540 550 560 570 580 590
pF1KB9 QPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALAL
.: : :..: : . : : .. : :. :. : : :
CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS
370 380 390 400 410
pF1KB9 A
595 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 03:18:50 2016 done: Tue Nov 8 03:18:50 2016
Total Scan time: 3.870 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]