FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9437, 595 aa 1>>>pF1KB9437 595 - 595 aa - 595 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.2810+/- 0.001; mu= -5.9162+/- 0.060 mean_var=397.9538+/-83.464, 0's: 0 Z-trim(116.2): 40 B-trim: 0 in 0/51 Lambda= 0.064292 statistics sampled from 16734 (16767) to 16734 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.795), E-opt: 0.2 (0.515), width: 16 Scan time: 3.870 The best scores are: opt bits E(32554) CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 ( 595) 4132 397.3 2.8e-110 CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 ( 442) 1032 109.7 8.2e-24 CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 ( 443) 1014 108.0 2.6e-23 CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 ( 397) 929 100.1 5.7e-21 CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 ( 236) 834 91.1 1.7e-18 CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 ( 480) 768 85.2 2e-16 CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 ( 444) 682 77.2 4.9e-14 CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 ( 443) 677 76.8 6.7e-14 CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX ( 413) 639 73.2 7.3e-13 >>CCDS11872.1 GATA6 gene_id:2627|Hs108|chr18 (595 aa) initn: 4132 init1: 4132 opt: 4132 Z-score: 2093.3 bits: 397.3 E(32554): 2.8e-110 Smith-Waterman score: 4132; 100.0% identity (100.0% similar) in 595 aa overlap (1-595:1-595) 10 20 30 40 50 60 pF1KB9 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MALTDGGWCLPKRFGAAGADASDSRAFPAREPSTPPSPISSSSSSCSRGGERGPGGASNC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GTPQLDTEAAAGPPARSLLLSSYASHPFGAPHGPSAPGVAGPGGNLSSWEDLLLFTDLDQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAAAAAA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSGGGSSL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 LAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASG 490 500 510 520 530 540 550 560 570 580 590 pF1KB9 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 AGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA 550 560 570 580 590 >>CCDS5983.1 GATA4 gene_id:2626|Hs108|chr8 (442 aa) initn: 1160 init1: 814 opt: 1032 Z-score: 541.0 bits: 109.7 E(32554): 8.2e-24 Smith-Waterman score: 1256; 49.8% identity (68.1% similar) in 476 aa overlap (147-595:1-433) 120 130 140 150 160 170 pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA :::.:: ...:: .::. :.::.:.:.: CCDS59 MYQSLAMAANHGPPPGAYEAGGPGAFMHGA 10 20 30 180 190 200 210 220 230 pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP . :::::::::: :: : . :: : :::.:.: :. :::.. . ::. .: CCDS59 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP 40 50 60 70 80 240 250 260 270 280 290 pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG :. :. : . :: ::. . :: :: . . . .: .:: :::. .:. CCDS59 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY 90 100 110 120 130 300 310 320 330 340 pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW ::::.. :...::: ::. . : :.: ::: : ::: . : CCDS59 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA 140 150 160 170 350 360 370 380 390 400 pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTG : :::..:::::: .::. :. : :. :...:.::.:::::::...:::::::::: CCDS59 AASAGPFDSPVLHSLPGRAN---PAARHPNLDMFDDFSEGRECVNCGAMSTPLWRRDGTG 180 190 200 210 220 230 410 420 430 440 450 460 pF1KB9 HYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNA :::::::::: ::::..:::::::.:. .:::.:::::::.::::::::::::::::::: CCDS59 HYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNA 240 250 260 270 280 290 470 480 490 500 510 520 pF1KB9 CGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDD ::::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::.. CCDS59 CGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSN 300 310 320 330 340 350 530 540 550 560 pF1KB9 CSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLY . ..: .: . : . .:.: : : .: : :: : : : CCDS59 ATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYA 360 370 380 390 400 410 570 580 590 pF1KB9 IGVSLASPAEVTSSVRPDSWCALALA :: :: .: . ::: .:.:: CCDS59 SPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA 420 430 440 >>CCDS78303.1 GATA4 gene_id:2626|Hs108|chr8 (443 aa) initn: 1160 init1: 814 opt: 1014 Z-score: 532.0 bits: 108.0 E(32554): 2.6e-23 Smith-Waterman score: 1246; 49.7% identity (68.1% similar) in 477 aa overlap (147-595:1-434) 120 130 140 150 160 170 pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGP--AAYD-GAPGGFVHSA :::.:: ...:: .::. :.::.:.:.: CCDS78 MYQSLAMAANHGPPPGAYEAGGPGAFMHGA 10 20 30 180 190 200 210 220 230 pF1KB9 AAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQASADSP . :::::::::: :: : . :: : :::.:.: :. :::.. . ::. .: CCDS78 G-------AASSPVYVPTPRVPSSVLGLSY-LQGGGAGSAS--GGASGGSSGGAASGAGP 40 50 60 70 80 240 250 260 270 280 290 pF1KB9 PYGSGGGAAGGGAAGPGGAGSAAAHVSARFPY-SPSPPMANGAAREPGGYAAAGSGGAGG :. :. : . :: ::. . :: :: . . . .: .:: :::. .:. CCDS78 --GTQQGSPGWSQAGADGAAYTPPPVSPRFSFPGTTGSLAAAAA------AAAAREAAAY 90 100 110 120 130 300 310 320 330 340 pF1KB9 VSGGGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPY---VGAPLTPAW ::::.. :...::: ::. . : :.: ::: : ::: . : CCDS78 SSGGGAAGAGLAGRE-QYGRAGFA----GSYS----------SPYPAYMADVGASWAAAA 140 150 160 170 350 360 370 380 390 400 pF1KB9 PA--GPFETPVLHSLQSRAGAPLPVPRGPS-ADLLEDLSESRECVNCGSIQTPLWRRDGT : :::..:::::: .::. :. : :. .:...:.::.:::::::...::::::::: CCDS78 AASAGPFDSPVLHSLPGRAN---PAARHPNLVDMFDDFSEGRECVNCGAMSTPLWRRDGT 180 190 200 210 220 230 410 420 430 440 450 460 pF1KB9 GHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCN ::::::::::: ::::..:::::::.:. .:::.:::::::.:::::::::::::::::: CCDS78 GHYLCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCN 240 250 260 270 280 290 470 480 490 500 510 520 pF1KB9 ACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSD :::::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::. CCDS78 ACGLYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSS 300 310 320 330 340 350 530 540 550 560 pF1KB9 DCSKNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGL . . ..: .: . : . .:.: : : .: : :: : : : CCDS78 NATTSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GY 360 370 380 390 400 410 570 580 590 pF1KB9 YIGVSLASPAEVTSSVRPDSWCALALA :: :: .: . ::: .:.:: CCDS78 ASPVS-QSP---QTSSKQDSWNSLVLADSHGDIITA 420 430 440 >>CCDS13499.1 GATA5 gene_id:140628|Hs108|chr20 (397 aa) initn: 1143 init1: 739 opt: 929 Z-score: 490.0 bits: 100.1 E(32554): 5.7e-21 Smith-Waterman score: 1113; 43.8% identity (65.6% similar) in 454 aa overlap (147-595:1-397) 120 130 140 150 160 170 pF1KB9 DLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSAAAA :::.:: .: ::: . :.:.: CCDS13 MYQSLALAASPRQAAYADS-GSFLH----- 10 20 180 190 200 210 220 230 pF1KB9 AAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSGPANHAGGAGAHPGWPQ-ASADSPPY : .:.::..:: .:: ::: : :: :. . .:.::: : :.::: . CCDS13 ---APGAGSPMFVPPARVPSMLSYL------SGCEPSPQPPELAARPGWAQTATADSSAF 30 40 50 60 70 240 250 260 270 280 290 pF1KB9 GSGGGAAGGGAAGPGGAGSAAAHVSARFPYSPSPPMANGAAREPGGYAAAGSGGAGGVSG : :. :: : :: . ::.. :: .. ::::..: CCDS13 GP--GSPHPPAAHPPGATA--------FPFAHSP-------------SGPGSGGSAGGRD 80 90 100 110 300 310 320 330 340 350 pF1KB9 GGSSLAAMGGREPQYSSLSAARPLNGTYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFE :.. .:. :: :... .::.. .: . : ::. .. .: ::::. CCDS13 GSAYQGALLPRE-QFAA-PLGRPVGTSYS----------ATYPAYVSPDVAQSWTAGPFD 120 130 140 150 160 360 370 380 390 400 410 pF1KB9 TPVLHSLQSRAGAPLPVPRGPSADLLEDL-SESRECVNCGSIQTPLWRRDGTGHYLCNAC :::.: .: : : .:.::.. .:.:::::::...::::::::::::::::: CCDS13 GSVLHGLPGRR--PTFV-----SDFLEEFPGEGRECVNCGALSTPLWRRDGTGHYLCNAC 170 180 190 200 210 420 430 440 450 460 470 pF1KB9 GLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKL ::: ::::..:::..::::. :::: :: :.:::::.:::::::.::::::::::::::: CCDS13 GLYHKMNGVNRPLVRPQKRLSSSRRAGLCCTNCHTTNTTLWRRNSEGEPVCNACGLYMKL 220 230 240 250 260 270 480 490 500 510 520 530 pF1KB9 HGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPT- ::::::::::::.:::::::::.: :.. ::.. :. . .:..:. .....:. CCDS13 HGVPRPLAMKKESIQTRKRKPKTIAKARGSSGSTRNASASPSAVASTDSSAATSKAKPSL 280 290 300 310 320 330 540 550 560 570 580 590 pF1KB9 TQPTASGAG-APVMTGA-GESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCA ..:. : . :: .: .: : . :.:. .: . ... . : . ...: ..::: CCDS13 ASPVCPGPSMAPQASGQEDDSLAPGHLEFKFEPEDFAFPSTAPSPQAGLRGALRQEAWCA 340 350 360 370 380 390 pF1KB9 LALA :::: CCDS13 LALA >>CCDS78304.1 GATA4 gene_id:2626|Hs108|chr8 (236 aa) initn: 1016 init1: 814 opt: 834 Z-score: 445.3 bits: 91.1 E(32554): 1.7e-18 Smith-Waterman score: 868; 59.4% identity (76.1% similar) in 234 aa overlap (380-595:1-227) 350 360 370 380 390 400 pF1KB9 PAGPFETPVLHSLQSRAGAPLPVPRGPSADLLEDLSESRECVNCGSIQTPLWRRDGTGHY ...:.::.:::::::...:::::::::::: CCDS78 MFDDFSEGRECVNCGAMSTPLWRRDGTGHY 10 20 30 410 420 430 440 450 460 pF1KB9 LCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACG :::::::: ::::..:::::::.:. .:::.:::::::.::::::::::::::::::::: CCDS78 LCNACGLYHKMNGINRPLIKPQRRLSASRRVGLSCANCQTTTTTLWRRNAEGEPVCNACG 40 50 60 70 80 90 470 480 490 500 510 520 pF1KB9 LYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSKTCSGNSNN-SIPMTPTS-TSSNSDDCS ::::::::::::::.:::::::::::::.::::: .. :.. :.: :.: .::::.. . CCDS78 LYMKLHGVPRPLAMRKEGIQTRKRKPKNLNKSKTPAAPSGSESLP--PASGASSNSSNAT 100 110 120 130 140 530 540 550 560 570 pF1KB9 KNTSPTTQPTASGAG----------------APVMTGAGESTNPENSELKYSGQDGLYIG ..: .: . : . .:.: : : .: : :: : : : CCDS78 TSSSEEMRPIKTEPGLSSHYGHSSSVSQTFSVSAMSGHGPSIHPVLSALKLSPQ-GYASP 150 160 170 180 190 200 580 590 pF1KB9 VSLASPAEVTSSVRPDSWCALALA :: :: .: . ::: .:.:: CCDS78 VS-QSPQ---TSSKQDSWNSLVLADSHGDIITA 210 220 230 >>CCDS3049.1 GATA2 gene_id:2624|Hs108|chr3 (480 aa) initn: 722 init1: 648 opt: 768 Z-score: 408.2 bits: 85.2 E(32554): 2e-16 Smith-Waterman score: 781; 40.9% identity (60.7% similar) in 394 aa overlap (144-506:42-410) 120 130 140 150 160 170 pF1KB9 LFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEMYQTLAALSSQGPAAYDGAPGGFVHSA :.:. . :.::: : : CCDS30 AHPAVLNAQHPDSHHPGLAHNYMEPAQLLPPDEVDVFFNHLDSQGNPYY----------A 20 30 40 50 60 180 190 200 210 220 pF1KB9 AAAAAAAAAASSPVYVPTTRVGSML-------PGLPYHLQGSGSGPANHAGGAGAHPGWP : : : .. ::... : :.: ::::. :.:. . : :..: : : CCDS30 NPAHARARVSYSPAHARLTG-GQMCRPHLLHSPGLPW-LDGGKA--ALSAAAAHHHNPWT 70 80 90 100 110 230 240 250 260 pF1KB9 QAS-ADSPPYGSGGGAAGG------GAAGPGGAGSA---------AAHVSAR-FPYSPSP . . .: . :..:. :: ::.: .:.::. ::: ... : . :.: CCDS30 VSPFSKTPLHPSAAGGPGGPLSVYPGAGGGSGGGSGSSVASLTPTAAHSGSHLFGFPPTP 120 130 140 150 160 170 270 280 290 300 310 320 pF1KB9 PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLS--AARPLN-GTYHHH : . : :. .:..::: .. : . .. . :.. .. :: : CCDS30 PKEVSPDPSTTGAASPASSSAGGSAARGEDKDGVKYQVSLTESMKMESGSPLRPGLATMG 180 190 200 210 220 230 330 340 350 360 370 380 pF1KB9 HHHHHHHPSPYSP-YVGAPLTPAWPAGPFETPVLHS---LQSRAGAPLPVPRGPSADLLE . ::: : : :: :: : . . ..: : . :.. : :. . . CCDS30 TQPATHHPIPTYPSYV-----PA-AAHDYSSGLFHPGGFLGGPASSFTPKQRSKA----R 240 250 260 270 280 390 400 410 420 430 440 pF1KB9 DLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRLGL . ::.:::::::. :::::::::::::::::::: :::: .::::::..:. ..:: : CCDS30 SCSEGRECVNCGATATPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRAGT 290 300 310 320 330 340 450 460 470 480 490 500 pF1KB9 SCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINKSK ::::.:::::::::::.:.:::::::::.:::.: :::.:::::::::.:: .: .: : CCDS30 CCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNVNRPLTMKKEGIQTRNRKMSNKSK-K 350 360 370 380 390 400 510 520 530 540 550 560 pF1KB9 TCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSELKY . .: CCDS30 SKKGAECFEELSKCMQEKSSPFSAAALAGHMAPVGHLPPFSHSGHILPTPTPIHPSSSLS 410 420 430 440 450 460 >>CCDS31143.1 GATA3 gene_id:2625|Hs108|chr10 (444 aa) initn: 735 init1: 643 opt: 682 Z-score: 365.5 bits: 77.2 E(32554): 4.9e-14 Smith-Waterman score: 724; 36.4% identity (57.9% similar) in 437 aa overlap (142-547:6-418) 120 130 140 150 160 170 pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV .::. . .. :.:..: : : :. CCDS31 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS 10 20 30 180 190 200 210 220 pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP :: :: : :. .: ::. .. . : .: :. .: : CCDS31 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P 40 50 60 70 80 230 240 250 260 270 280 pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY . : :. .:: : :. .:.: . . ... : .. : : :: .... ::. CCDS31 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH 90 100 110 120 130 140 290 300 310 320 330 pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH--- :. :: : : . .: :. . :. :: ... . : . CCDS31 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM 150 160 170 180 190 200 340 350 360 370 380 pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL ::: . : ::: : . .: : : :: . . . . :.: CCDS31 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA-- 210 220 230 240 250 390 400 410 420 430 440 pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL .. .:.:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: CCDS31 -RSSTEGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA 260 270 280 290 300 310 450 460 470 480 490 500 pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK : :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: .. : CCDS31 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K 320 330 340 350 360 370 510 520 530 540 550 560 pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL :: :. . ..:. : ..: : :.. : .. . . .. ..: CCDS31 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF 380 390 400 410 420 430 570 580 590 pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA CCDS31 GPHHPSSMVTAMG 440 >>CCDS7083.1 GATA3 gene_id:2625|Hs108|chr10 (443 aa) initn: 731 init1: 639 opt: 677 Z-score: 363.0 bits: 76.8 E(32554): 6.7e-14 Smith-Waterman score: 716; 36.4% identity (57.2% similar) in 437 aa overlap (142-547:6-417) 120 130 140 150 160 170 pF1KB9 LLLFTDLDQAATASKLLWSSRGAKLSPFAPEQPEEM-YQTLAALSSQGPAAYDGAPGGFV .::. . .. :.:..: : : :. CCDS70 MEVTADQPRWVSHHHPAVLNGQHP---DTHHPGLS 10 20 30 180 190 200 210 220 pF1KB9 HSAAAAAAAAAAASSPVYVPTTRVGSMLPGLPYHLQGSGSG----PANHAGGAGAHPGWP :: :: : :. .: ::. .. . : .: :. .: : CCDS70 HSYMDAAQYPLPEEVDVLFNIDGQGNHVP--PYYGNSVRATVQRYPPTHHGSQVCRP--P 40 50 60 70 80 230 240 250 260 270 280 pF1KB9 QASADSPPYGSGGGAAGGG-AAGPGGAG---SAAAHVSARFPYSPSPPMANGAAREPGGY . : :. .:: : :. .:.: . . ... : .. : : :: .... ::. CCDS70 LLHG-SLPWLDGGKALGSHHTASPWNLSPFSKTSIHHGSPGPLSVYPPASSSSLS--GGH 90 100 110 120 130 140 290 300 310 320 330 pF1KB9 AAAG-----SGGAGGVSGGGS-SLAAMGG--REPQYSSLSAARPLNGTYHHHHHHHH--- :. :: : : . .: :. . :. :: ... . : . CCDS70 ASPHLFTFPPTPPKDVSPDPSLSTPGSAGSARQDEKECLKYQVPLPDSMKLESSHSRGSM 150 160 170 180 190 200 340 350 360 370 380 pF1KB9 ----------HHP-SPYSPYVGAPLTPAWPAGPFETPVLHSLQSRAGAPLPVPRGPSADL ::: . : ::: : . .: : : :: . . . . :.: CCDS70 TALGGASSSTHHPITTYPPYV-----PEYSSGLFP-P--SSLLGGSPTGFGCKSRPKA-- 210 220 230 240 250 390 400 410 420 430 440 pF1KB9 LEDLSESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRPLIKPQKRVPSSRRL : .:::::::. .:::::::::::::::::::: :::: .::::::..:. ..:: CCDS70 --RSSTGRECVNCGATSTPLWRRDGTGHYLCNACGLYHKMNGQNRPLIKPKRRLSAARRA 260 270 280 290 300 310 450 460 470 480 490 500 pF1KB9 GLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKEGIQTRKRKPKNINK : :::::.:::::::::::.:.:::::::::.:::.. :::.:::::::::.:: .. : CCDS70 GTSCANCQTTTTTLWRRNANGDPVCNACGLYYKLHNINRPLTMKKEGIQTRNRKMSS--K 320 330 340 350 360 370 510 520 530 540 550 560 pF1KB9 SKTCSGNSNNSIPMTPTSTSSNSDDCSKNTSPTTQPTASGAGAPVMTGAGESTNPENSEL :: :. . ..:. : ..: : :.. : .. . . .. ..: CCDS70 SKKCK-KVHDSLEDFPKNSSFNPAALSRHMSSLSHISPFSHSSHMLTTPTPMHPPSSLSF 380 390 400 410 420 430 570 580 590 pF1KB9 KYSGQDGLYIGVSLASPAEVTSSVRPDSWCALALA CCDS70 GPHHPSSMVTAMG 440 >>CCDS14305.1 GATA1 gene_id:2623|Hs108|chrX (413 aa) initn: 777 init1: 608 opt: 639 Z-score: 344.4 bits: 73.2 E(32554): 7.3e-13 Smith-Waterman score: 678; 37.5% identity (57.3% similar) in 384 aa overlap (234-588:35-412) 210 220 230 240 250 260 pF1KB9 HLQGSGSGPANHAGGAGAHPGWPQASADSPPYGSGGGAAGGGAAGPGGAGSAAAHVSARF : : : :......:. : .::: .. CCDS14 GLGSLGTSEPLPQFVDPALVSSTPESGVFFPSGPEGLDAAASSTAPSTATAAAAALAYYR 10 20 30 40 50 60 270 280 290 300 310 pF1KB9 P---YSPSP-----PMANGAAREPGGYAAAGSGGAGGVSGGGSSLAAMGGREPQYSSLSA : :: :. : ::: :: : : .: . .. :: : .: CCDS14 DAEAYRHSPVFQVYPLLNCMEGIPGGSPYAG--WAYGKTGLYPASTVCPTRED--SPPQA 70 80 90 100 110 120 320 330 340 350 360 370 pF1KB9 ARPLNG----TYHHHHHHHHHHPSPYSPYVGAPLTPAWPAGPFETPVLHS-LQSRAGAPL .. :.: .. . . .. :. . . : . : . . : . : . : .:.:: CCDS14 VEDLDGKGSTSFLETLKTERLSPDLLTLGPALPSSLPVPNSAYGGPDFSSTFFSPTGSPL 130 140 150 160 170 180 380 390 400 410 420 pF1KB9 PVPRGPSADLLEDLS----ESRECVNCGSIQTPLWRRDGTGHYLCNACGLYSKMNGLSRP : : : :.:::::::. ::::::: :::::::::::: :::: .:: CCDS14 NSAAYSSPKLRGTLPLPPCEARECVNCGATATPLWRRDRTGHYLCNACGLYHKMNGQNRP 190 200 210 220 230 240 430 440 450 460 470 480 pF1KB9 LIKPQKRVPSSRRLGLSCANCHTTTTTLWRRNAEGEPVCNACGLYMKLHGVPRPLAMKKE ::.:.::. :.: : .:.::.::::::::::: :.:::::::::.::: : :::.:.:. CCDS14 LIRPKKRLIVSKRAGTQCTNCQTTTTTLWRRNASGDPVCNACGLYYKLHQVNRPLTMRKD 250 260 270 280 290 300 490 500 510 520 530 pF1KB9 GIQTRKRKPKNINKSKTCSGNSNNSIPMTPT------STSSNSDDCSKNTS------PTT :::::.:: .. .:.: :. .... :. . .:.: .:.. .: : : CCDS14 GIQTRNRKASGKGKKKRGSSLGGTGAAEGPAGGFMVVAGGSGSGNCGEVASGLTLGPPGT 310 320 330 340 350 360 540 550 560 570 580 590 pF1KB9 QPTASGAGAPVMTGAGESTNPENSELKYSGQDGLYIGVSLASPAEVTSSVRPDSWCALAL .: : :..: : . : : .. : :. :. : : : CCDS14 AHLYQGLGPVVLSGPVSHLMPFPGPLLGSPTGSFPTGP--MPPTTSTTVVAPLSS 370 380 390 400 410 pF1KB9 A 595 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:18:50 2016 done: Tue Nov 8 03:18:50 2016 Total Scan time: 3.870 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]