FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7730, 480 aa
1>>>pF1KB7730 480 - 480 aa - 480 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.2541+/-0.000846; mu= -3.1783+/- 0.051
mean_var=267.1429+/-56.121, 0's: 0 Z-trim(116.2): 22 B-trim: 0 in 0/52
Lambda= 0.078470
statistics sampled from 16793 (16813) to 16793 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.807), E-opt: 0.2 (0.516), width: 16
Scan time: 3.050
The best scores are: opt bits E(32554)
CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 3401 397.8 1.3e-110
CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 ( 466) 2446 289.7 4.5e-78
CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 1362 167.0 3.8e-41
CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 1347 165.3 1.2e-40
CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 855 109.6 7.2e-24
CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 846 108.5 1.5e-23
CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 830 106.7 4.9e-23
CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 768 99.8 8.4e-21
CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 730 95.2 7.9e-20
CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 722 94.5 2.3e-19
>>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa)
initn: 3401 init1: 3401 opt: 3401 Z-score: 2099.2 bits: 397.8 E(32554): 1.3e-110
Smith-Waterman score: 3401; 100.0% identity (100.0% similar) in 480 aa overlap (1-480:1-480)
10 20 30 40 50 60
pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS30 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
430 440 450 460 470 480
>>CCDS46903.1 GATA2 gene_id:2624|Hs108|chr3 (466 aa)
initn: 2573 init1: 2417 opt: 2446 Z-score: 1515.1 bits: 289.7 E(32554): 4.5e-78
Smith-Waterman score: 3258; 97.1% identity (97.1% similar) in 480 aa overlap (1-480:1-466)
10 20 30 40 50 60
pF1KB7 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MEVAPEQPRWMAHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 FSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLW
::::::::::::::::::::::::::::::::::::::: :::::::
CCDS46 TATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRL--------------TTTTTLW
310 320 330 340
370 380 390 400 410 420
pF1KB7 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKC
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB7 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
410 420 430 440 450 460
>>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa)
initn: 1622 init1: 930 opt: 1362 Z-score: 852.2 bits: 167.0 E(32554): 3.8e-41
Smith-Waterman score: 1938; 62.6% identity (78.0% similar) in 486 aa overlap (1-480:1-444)
10 20 30 40 50
pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
:::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.:::
CCDS31 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N
:::.: ..: .. : :.: :.:.::: :::. .::::::::: : :: .
CCDS31 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP
::..:::::: .: :.:: :::::: :...: .:. :.. ::: ::
CCDS31 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP
120 130 140 150
180 190 200 210 220 230
pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA
:::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. :
CCDS31 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA
160 170 180 190 200
240 250 260 270 280 290
pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE
:.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: .::::
CCDS31 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARSSTEGRE
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT
:::::::.::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS31 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF
:::::::::::::::::::::::::::.:::::::::::::::::::.:::: :: . .
CCDS31 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS
:.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: ::::
CCDS31 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS
390 400 410 420 430
480
pF1KB7 MVTAMG
::::::
CCDS31 MVTAMG
440
>>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa)
initn: 1482 init1: 819 opt: 1347 Z-score: 843.0 bits: 165.3 E(32554): 1.2e-40
Smith-Waterman score: 1923; 62.6% identity (77.8% similar) in 486 aa overlap (1-480:1-443)
10 20 30 40 50
pF1KB7 MEVAPEQPRWMAH--PAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGN-
:::. .::::..: :::::.::::.:::::.:.::. :: :.::::.:: .:.:::
CCDS70 MEVTADQPRWVSHHHPAVLNGQHPDTHHPGLSHSYMDAAQYPLPEEVDVLFN-IDGQGNH
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 --PYYANPAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHH-N
:::.: ..: .. : :.: :.:.::: :::. .::::::::: : :: .
CCDS70 VPPYYGNSVRATVQ-RYPPTHH---GSQVCRPPLLHG-SLPWLDGGKALGS----HHTAS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 PWTVSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFP
::..:::::: .: :.:: :::::: :...: .:. :.. ::: ::
CCDS70 PWNLSPFSKTSIHH---GSPG-PLSVYPPASSSSLSGG------------HASPHLFTFP
120 130 140 150
180 190 200 210 220 230
pF1KB7 PTPPKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLA
:::::.:::::: . .:.:. ::: : ..:. .:::: : .:::.::. :
CCDS70 PTPPKDVSPDPSLS---TPGSA---GSA-RQDEKECLKYQVPLPDSMKLESSHSRGSMTA
160 170 180 190 200
240 250 260 270 280 290
pF1KB7 TMGTQPATHHPIPTYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRE
:.. .::::: ::: ::: .:::::: :...::: ..: :.: :::: : :::
CCDS70 LGGASSSTHHPITTYPPYVP----EYSSGLFPPSSLLGGSPTGFGCKSRPKARS-STGRE
210 220 230 240 250 260
300 310 320 330 340 350
pF1KB7 CVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQT
:::::::.::::::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS70 CVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTSCANCQT
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB7 TTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECF
:::::::::::::::::::::::::::.:::::::::::::::::::.:::: :: . .
CCDS70 TTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSSKSKKCKKVHDSL
330 340 350 360 370 380
420 430 440 450 460 470
pF1KB7 EELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSS
:.. : .: :. :::. ::. ..:. :::::.:.: ::::.:: :::::: ::::
CCDS70 EDFPK-----NSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSFGPHHPSS
390 400 410 420 430
480
pF1KB7 MVTAMG
::::::
CCDS70 MVTAMG
440
>>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa)
initn: 802 init1: 704 opt: 855 Z-score: 542.0 bits: 109.6 E(32554): 7.2e-24
Smith-Waterman score: 855; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-399)
70 80 90 100 110 120
pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS
:: . :: .:. .:. .: : :
CCDS78 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P--
10 20 30 40
130 140 150 160 170
pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF
:: ::.. : :: :. ::.:::.::..:... : : ...:. ..
CCDS78 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY
50 60 70 80 90
180 190 200 210 220 230
pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR
: :: ::: :.:::. . :...:.. : . .. : ..: . . . : :
CCDS78 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R
100 110 120 130 140 150
240 250 260 270 280
pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK
:.: ..: . . :.. ::: . ..: ..: :: ..::. :. .
CCDS78 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNLVDM
160 170 180 190 200
290 300 310 320 330 340
pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
. ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::.
CCDS78 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
210 220 230 240 250 260
350 360 370 380 390 400
pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK
: ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .:
CCDS78 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
270 280 290 300 310 320
410 420 430 440 450 460
pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS
.. .: : . :: : :. .. .: :. : .: : :: . .
CCDS78 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV
330 340 350 360 370 380
470 480
pF1KB7 SSLSFGH-P--HPSSMVTAMG
:..: :: : ::
CCDS78 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
390 400 410 420 430 440
>>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa)
initn: 794 init1: 704 opt: 846 Z-score: 536.5 bits: 108.5 E(32554): 1.5e-23
Smith-Waterman score: 846; 43.4% identity (64.0% similar) in 403 aa overlap (93-472:15-398)
70 80 90 100 110 120
pF1KB7 PAHARARVSYSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFS
:: . :: .:. .:. .: : :
CCDS59 MYQSLAMAANHGPPPG-AYEAGGPGAFMHGAGAASSPVYV-P--
10 20 30 40
130 140 150 160 170
pF1KB7 KTPLHPSAAGG-----PGGPLSVYPGAGGGSGGGSGSSVASLT----PTAAHSGSHLFGF
:: ::.. : :: :. ::.:::.::..:... : : ...:. ..
CCDS59 -TPRVPSSVLGLSYLQGGGAGSASGGASGGSSGGAASGAGPGTQQGSPGWSQAGADGAAY
50 60 70 80 90
180 190 200 210 220 230
pF1KB7 PPTPPKEVSPD---PSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLR
: :: ::: :.:::. . :...:.. : . .. : ..: . . . : :
CCDS59 TP-PP--VSPRFSFPGTTGSLAAAAAAAAAREAAAYSSGGGAAGAGL--AGREQYG---R
100 110 120 130 140 150
240 250 260 270 280
pF1KB7 PGLATMGTQPATHHPIPTYPSYVPAAAHD---YSSGLFH--PGGFLGGPASSFTPKQRSK
:.: ..: . . :.. ::: . ..: ..: :: ..::. :. .
CCDS59 AGFAGSYSSPYPAYMADVGASWAAAAAASAGPFDSPVLHSLPG--RANPAARH-PNL-DM
160 170 180 190 200
290 300 310 320 330 340
pF1KB7 ARSCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA
. ::::::::::: .::::::::::::::::::::::::: :::::::.:::::.::.
CCDS59 FDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNACGLYHKMNGINRPLIKPQRRLSASRRV
210 220 230 240 250 260
350 360 370 380 390 400
pF1KB7 GTCCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK
: ::::::::::::::::.:.:::::::::.:::.: :::.:.:::::::.:: .: .:
CCDS59 GLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNK
270 280 290 300 310 320
410 420 430 440 450 460
pF1KB7 KSKKGAECFEELSKCMQEKSSPFSAAALAG--HMAPVGHLPPFS-HSGHILPTPTPIHPS
.. .: : . :: : :. .. .: :. : .: : :: . .
CCDS59 SKTPAAPSGSESLPPASGASSNSSNATTSSSEEMRPIKTEPGLSSHYGHS-SSVSQTFSV
330 340 350 360 370 380
470 480
pF1KB7 SSLSFGH-P--HPSSMVTAMG
:..: :: : ::
CCDS59 SAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQTSSKQDSWNSLVLADSHGDIITA
390 400 410 420 430 440
>>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa)
initn: 956 init1: 724 opt: 830 Z-score: 527.1 bits: 106.7 E(32554): 4.9e-23
Smith-Waterman score: 846; 43.1% identity (61.3% similar) in 408 aa overlap (115-479:16-407)
90 100 110 120 130 140
pF1KB7 CRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSP--FSKTPLHPSAAGGPGGPLSVYP
: :.: :.:: :.. :.:: ..
CCDS14 MEFPGLGSLGTSEPLPQFVDPALVSSTP--ESGVFFPSGPEGLDA
10 20 30 40
150 160 170 180 190
pF1KB7 GAGGGSGGGSGSSVASLT---PTAAHSGSHLFG-FPPTPPKEVSPDPST-TGAAS-----
.:.. . . . ...:.:. . :. : .: .: : : : .: :
CCDS14 AASSTAPSTATAAAAALAYYRDAEAYRHSPVFQVYPLLNCMEGIPGGSPYAGWAYGKTGL
50 60 70 80 90 100
200 210 220 230 240
pF1KB7 -PASS---SAGGSAARG-EDKDGVKYQVSLTESMKMESGSPLRPGLATMGTQPATHHPIP
:::. . : .. :: :: : ..:. :..: : : : : :.: . :.:
CCDS14 YPASTVCPTREDSPPQAVEDLDG-KGSTSFLETLKTER---LSPDLLTLGPALPSSLPVP
110 120 130 140 150
250 260 270 280 290 300
pF1KB7 TYPSYVPAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKAR--SCSEGRECVNCGATATPL
. : :.:: .: : : . :. .:: :. : :.:::::::::::::
CCDS14 NSAYGGP----DFSSTFFSPTGSPLNSAAYSSPKLRGTLPLPPC-EARECVNCGATATPL
160 170 180 190 200 210
310 320 330 340 350 360
pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
:::: :::::::::::::::::::::::.::.:: ...:::: :.::::::::::::::.
CCDS14 WRRDRTGHYLCNACGLYHKMNGQNRPLIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNAS
220 230 240 250 260 270
370 380 390 400 410
pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKG------------AEC
:::::::::::::::.:::::::.:.:::::::: :.:.:: :.: :
CCDS14 GDPVCNACGLYYKLHQVNRPLTMRKDGIQTRNRKASGKGKK-KRGSSLGGTGAAEGPAGG
280 290 300 310 320 330
420 430 440 450 460
pF1KB7 FEELS------KCMQEKSS----PFSAAALAGHMAPVGHLPPFSHSGHILPTPTPI--HP
: .. .: . :. : ..: : ..:: : : :..: : :. :
CCDS14 FMVVAGGSGSGNCGEVASGLTLGPPGTAHLYQGLGPVVLSGPVS---HLMPFPGPLLGSP
340 350 360 370 380 390
470 480
pF1KB7 SSSLSFGHPHPSSMVTAMG
..:. : : : . :..
CCDS14 TGSFPTG-PMPPTTSTTVVAPLSS
400 410
>>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa)
initn: 756 init1: 648 opt: 768 Z-score: 486.9 bits: 99.8 E(32554): 8.4e-21
Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (42-410:144-506)
20 30 40 50 60
pF1KB7 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A
:.:. . :.::: : :
CCDS11 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA
120 130 140 150 160 170
70 80 90 100 110
pF1KB7 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT
: : : .. ::... : :.: ::::. :.:. . : :..: : :
CCDS11 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGW-
180 190 200 210 220
120 130 140 150 160 170
pF1KB7 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP
: ... : ..:: . ::::..: .:.. : ::: ... : . :.:
CCDS11 --PQASADSPPYGSGGGA--------AGGGAAGPGGAGSA-----AAHVSAR-FPYSPSP
230 240 250 260
180 190 200 210 220 230
pF1KB7 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG
: . : :. .:..::: .. : . .. . :.. .. :: :
CCDS11 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH
270 280 290 300 310 320
240 250 260 270 280
pF1KB7 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R
. ::: : : :: :: : . . ..: : . :.. : :. . .
CCDS11 HHHHHHHPSP-YSPYVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE
330 340 350 360 370 380
290 300 310 320 330 340
pF1KB7 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT
. ::.:::::::. :::::::::::::::::::: :::: .::::::..:. ..:: :
CCDS11 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL
390 400 410 420 430 440
350 360 370 380 390 400
pF1KB7 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K
::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: :
CCDS11 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK
450 460 470 480 490 500
410 420 430 440 450 460
pF1KB7 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS
. .:
CCDS11 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY
510 520 530 540 550 560
>>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa)
initn: 748 init1: 704 opt: 730 Z-score: 469.5 bits: 95.2 E(32554): 7.9e-20
Smith-Waterman score: 730; 61.4% identity (75.7% similar) in 189 aa overlap (290-472:6-192)
260 270 280 290 300 310
pF1KB7 YSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPLWRRDGTGHYLCNAC
::::::::::: .:::::::::::::::::
CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHYLCNAC
10 20 30
320 330 340 350 360 370
pF1KB7 GLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNANGDPVCNACGLYYKL
:::::::: :::::::.:::::.::.: ::::::::::::::::.:.:::::::::.::
CCDS78 GLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACGLYMKL
40 50 60 70 80 90
380 390 400 410 420 430
pF1KB7 HNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKSSPFSAAALAG--HM
:.: :::.:.:::::::.:: .: .:.. .: : . :: : :. .. .:
CCDS78 HGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLPPASGASSNSSNATTSSSEEM
100 110 120 130 140 150
440 450 460 470 480
pF1KB7 APVGHLPPFS-HSGHILPTPTPIHPSSSLSFGH-P--HPSSMVTAMG
:. : .: : :: . . :..: :: : ::
CCDS78 RPIKTEPGLSSHYGHS-SSVSQTFSVSAMS-GHGPSIHPVLSALKLSPQGYASPVSQSPQ
160 170 180 190 200 210
CCDS78 TSSKQDSWNSLVLADSHGDIITA
220 230
>>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa)
initn: 736 init1: 671 opt: 722 Z-score: 461.3 bits: 94.5 E(32554): 2.3e-19
Smith-Waterman score: 786; 41.5% identity (64.5% similar) in 369 aa overlap (102-464:13-348)
80 90 100 110 120 130
pF1KB7 YSPAHARLTGGQMCRPHLLHSPGLPWLDGGKAALSAAAAHHHNPWTVSPFSKTPLH-PSA
.:: . ... : : . ::. : . ::
CCDS13 MYQSLALAASPRQAAYADSGSFLHAPGAGSPMFVPPARVPSM
10 20 30 40
140 150 160 170 180
pF1KB7 AGGPGG--PLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTPPKEVSPDPSTT
. .: : : : .. : . ...:. .: :: : :: : ..
CCDS13 LSYLSGCEP-SPQPPELAARPGWAQTATAD--SSAFGPGS------PHPPAAHPPGATAF
50 60 70 80 90
190 200 210 220 230 240
pF1KB7 G-AASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPL-RPGLATMGTQPATHHPI
: ::.. ..::::. .:: :: .: . . ..:: :: .::. ..
CCDS13 PFAHSPSGPGSGGSAG---GRDGSAYQGALLP--REQFAAPLGRP----VGTSYSA----
100 110 120 130 140
250 260 270 280 290 300
pF1KB7 PTYPSYV-PAAAHDYSSGLFHPGGFLGGPASSFTPKQRSKARSCSEGRECVNCGATATPL
:::.:: : .:.....: : . . : :. : . . .:::::::::: .:::
CCDS13 -TYPAYVSPDVAQSWTAGPFDGSVLHGLPGRRPTFVSDFLEEFPGEGRECVNCGALSTPL
150 160 170 180 190
310 320 330 340 350 360
pF1KB7 WRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGTCCANCQTTTTTLWRRNAN
:::::::::::::::::::::: ::::..:..:::..:::: ::.::.::.:::::::..
CCDS13 WRRDGTGHYLCNACGLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSE
200 210 220 230 240 250
370 380 390 400 410 420
pF1KB7 GDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSKKSKKGAECFEELSKCMQEKS
:.:::::::::.:::.: :::.::::.::::.:: :. . .:. : .. :
CCDS13 GEPVCNACGLYMKLHGVPRPLAMKKESIQTRKRK--PKTIAKARGS------SGSTRNAS
260 270 280 290 300 310
430 440 450 460 470 480
pF1KB7 SPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLSFGHPHPSSMVTAMG
. ::.: . : ... : : .. . : :. . :..:
CCDS13 ASPSAVASTDSSAATSKAKP-SLASPVCPGPS-MAPQASGQEDDSLAPGHLEFKFEPEDF
320 330 340 350 360
CCDS13 AFPSTAPSPQAGLRGALRQEAWCALALA
370 380 390
480 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 09:17:12 2016 done: Fri Nov 4 09:17:12 2016
Total Scan time: 3.050 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]