FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3427, 602 aa 1>>>pF1KE3427 602 - 602 aa - 602 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.7285+/-0.000952; mu= 3.2918+/- 0.057 mean_var=158.1530+/-33.006, 0's: 0 Z-trim(111.1): 39 B-trim: 590 in 1/50 Lambda= 0.101985 statistics sampled from 12059 (12096) to 12059 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.372), width: 16 Scan time: 3.760 The best scores are: opt bits E(32554) CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 ( 602) 4072 611.1 1.3e-174 CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 ( 496) 3387 510.3 2.3e-144 CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 ( 607) 1557 241.1 3.1e-63 CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX ( 520) 1265 198.1 2.3e-50 CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 ( 447) 931 149.0 1.3e-35 CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 ( 372) 840 135.5 1.2e-31 CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 ( 495) 832 134.4 3.4e-31 CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 ( 398) 824 133.2 6.3e-31 CCDS10670.1 TBX6 gene_id:6911|Hs108|chr16 ( 436) 803 130.1 5.8e-30 CCDS9173.1 TBX5 gene_id:6910|Hs108|chr12 ( 518) 790 128.2 2.5e-29 CCDS31621.1 TBX10 gene_id:347853|Hs108|chr11 ( 385) 787 127.7 2.6e-29 CCDS9174.1 TBX5 gene_id:6910|Hs108|chr12 ( 468) 783 127.2 4.7e-29 CCDS11629.1 TBX4 gene_id:9496|Hs108|chr17 ( 545) 775 126.0 1.2e-28 CCDS82180.1 TBX4 gene_id:9496|Hs108|chr17 ( 546) 772 125.6 1.7e-28 CCDS11627.2 TBX2 gene_id:6909|Hs108|chr17 ( 712) 720 118.0 4.2e-26 CCDS9175.1 TBX3 gene_id:6926|Hs108|chr12 ( 723) 718 117.7 5.3e-26 CCDS55960.1 MGA gene_id:23269|Hs108|chr15 (2856) 683 112.8 6.4e-24 CCDS55959.1 MGA gene_id:23269|Hs108|chr15 (3065) 683 112.8 6.8e-24 CCDS33310.1 TBR1 gene_id:10716|Hs108|chr2 ( 682) 608 101.5 3.7e-21 CCDS2646.1 EOMES gene_id:8320|Hs108|chr3 ( 686) 586 98.3 3.5e-20 CCDS11514.1 TBX21 gene_id:30009|Hs108|chr17 ( 535) 582 97.6 4.3e-20 CCDS63585.1 EOMES gene_id:8320|Hs108|chr3 ( 705) 558 94.1 6.3e-19 CCDS5290.1 T gene_id:6862|Hs108|chr6 ( 435) 497 85.1 2.1e-16 CCDS9176.1 TBX3 gene_id:6926|Hs108|chr12 ( 743) 474 81.8 3.5e-15 CCDS63584.1 EOMES gene_id:8320|Hs108|chr3 ( 410) 467 80.7 4.2e-15 CCDS59045.1 T gene_id:6862|Hs108|chr6 ( 377) 465 80.4 4.7e-15 CCDS1272.1 TBX19 gene_id:9095|Hs108|chr1 ( 448) 463 80.1 6.8e-15 >>CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 (602 aa) initn: 4072 init1: 4072 opt: 4072 Z-score: 3248.6 bits: 611.1 E(32554): 1.3e-174 Smith-Waterman score: 4072; 100.0% identity (100.0% similar) in 602 aa overlap (1-602:1-602) 10 20 30 40 50 60 pF1KE3 MSERRRSAVALSSRAHAFSVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MSERRRSAVALSSRAHAFSVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 AHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 AHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 DLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 DLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 KWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 KWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 QPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 QPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 GFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 ASSHLLSPSCSPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 ASSHLLSPSCSPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 YNRLQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFPTSQFQYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 YNRLQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFPTSQFQYV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 MQAGNAASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MQAGNAASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 TLLCSSPSNGAFGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 TLLCSSPSNGAFGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVH 550 560 570 580 590 600 pF1KE3 MV :: CCDS81 MV >>CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 (496 aa) initn: 3387 init1: 3387 opt: 3387 Z-score: 2705.3 bits: 510.3 E(32554): 2.3e-144 Smith-Waterman score: 3387; 100.0% identity (100.0% similar) in 496 aa overlap (107-602:1-496) 80 90 100 110 120 130 pF1KE3 DSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCADLWKRFHDIGTEMIIT :::::::::::::::::::::::::::::: CCDS30 MSSMEEIQVELQCADLWKRFHDIGTEMIIT 10 20 30 140 150 160 170 180 190 pF1KE3 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE3 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE3 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAIM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAIM 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE3 ETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLSPSCSPPTFH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 ETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLSPSCSPPTFH 220 230 240 250 260 270 380 390 400 410 420 430 pF1KE3 LAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 LAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPSE 280 290 300 310 320 330 440 450 460 470 480 490 pF1KE3 TFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFPTSQFQYVMQAGNAASSSSSPHMF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 TFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFPTSQFQYVMQAGNAASSSSSPHMF 340 350 360 370 380 390 500 510 520 530 540 550 pF1KE3 GGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGAFGERQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS30 GGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGAFGERQ 400 410 420 430 440 450 560 570 580 590 600 pF1KE3 YLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV :::::::::::::::::::::::::::::::::::::::::::::: CCDS30 YLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV 460 470 480 490 >>CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 (607 aa) initn: 1873 init1: 1405 opt: 1557 Z-score: 1248.7 bits: 241.1 E(32554): 3.1e-63 Smith-Waterman score: 1988; 55.2% identity (73.6% similar) in 636 aa overlap (1-602:1-607) 10 20 30 40 50 pF1KE3 MSERRRSA--VALSSRAHAFSVEALIGSNKKRKLRDWEEK-GLDLSMEALSPAG---PLG :.:.::.. :: .:::::::::::..:...:. ..: : . . :.. .: : CCDS34 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAAGAVDDGGCSRGGG 10 20 30 40 50 60 60 70 80 90 100 pF1KE3 DTEDAAAHGLE----PHPDSEQSTGSDSEVLTERTS---C--SFSTH-TDLASGAAGP-- : ....: : : : . : . : . :: . : .:. . ::: ...: CCDS34 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG 70 80 90 100 110 120 110 120 130 140 150 pF1KE3 VPA--------AMSSMEEIQVELQCADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLD :: . : . .:.:: :.::::::.::::::::::::::::::::::.::: CCDS34 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE3 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVV :::::::::::::::::::::::::::::::::::::::::::::::: :::.::::::. CCDS34 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVI 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE3 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPE :::::::::::::::::::::::::::::::::::: ..:::: :::: :.:::.:.::: CCDS34 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPE 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE3 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDF ::::::::::::::::::::::::::::::::::: ::::..:.:::::: .:::::::. CCDS34 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFEDI 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE3 TTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLS-PSCSPPTFHLAPNTFNVGCRESQLCN . :: :....: ..::. :.. :::: ::: :.:::.::: ::::. CCDS34 PGIPKQ--GNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNT-------SQLCS 370 380 390 400 410 400 410 420 430 440 450 pF1KE3 LNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPSETFMPQRTPSLISGIPTP : .:: ::::... . .:... :::: . : .::: : :::: . :. . CCDS34 LAPADYSACARSGLTLNRYSTSLAET-YNRLTN------QAGETFAPPRTPSYV-GVSSS 420 430 440 450 460 460 470 480 490 500 pF1KE3 PSLPGNSKMEAYGGQLG-SFPTSQFQYVMQAGNAASS------SSSPHMFGGSHMQQSSY :. : .: :: : .: : . :: .. . . : : . :. .. .:.:: CCDS34 TSV--NMSM---GGTDGDTFSCPQTSLSMQISGMSPQLQYIMPSPSSNAFATNQTHQGSY 470 480 490 500 510 510 520 530 540 550 560 pF1KE3 NAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGAFGERQYLPSGMEHSM :.: ::.: :::::: :::.:::::::. .::...: :::: :.. .::.:: .: .. CCDS34 NTFRLHSPCALYGYNFSTSPKLAASPEKIVSSQGSFLGSSPS-GTMTDRQMLPP-VE-GV 520 530 540 550 560 570 570 580 590 600 pF1KE3 HMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV :..: ..::. :.: :.. ::::.:.::: CCDS34 HLLSS--GGQQS--FFDSRTLGSLTLSSSQVSAHMV 580 590 600 >>CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX (520 aa) initn: 914 init1: 634 opt: 1265 Z-score: 1017.6 bits: 198.1 E(32554): 2.3e-50 Smith-Waterman score: 1400; 45.5% identity (69.0% similar) in 565 aa overlap (9-566:1-520) 10 20 30 40 50 60 pF1KE3 MSERRRSAVALSSRAHAFSVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAA .::::::.:::::::.: .::::.: ..: .: : CCDS14 MALSSRARAFSVEALVGRPSKRKLQD--------PIQAEQP-------ELRE 10 20 30 70 80 90 100 110 pF1KE3 AHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEE--IQVELQ .: : . . ..:... :: : .. . :: .. . :. . . :.:: ::.::: CCDS14 KKGGEEEEERRSSAAGKSEPLEKQPKTEPSTSASSGCGSDSGYGNSSESLEEKDIQMELQ 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE3 CADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYH ..:::::::::::::::::::::::..:::. :::: .::..:.:.::::.:::::::: CCDS14 GSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKGLDPGKQYHVAIDVVPVDSKRYRYVYH 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE3 SSKWMVAGNADSP-VPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSM ::.::::::.: . :: :.:::: ::.:::::..:::..::::::.::.:::::.:: CCDS14 SSQWMVAGNTDHLCIIPRFYVHPDSPCSGETWMRQIISFDRMKLTNNEMDDKGHIILQSM 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE3 HKYQPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNP :::.::::::.. : ::: . .:. .:::::.: :: :::::::::::::.:::.::: CCDS14 HKYKPRVHVIEQGSSVDLSQIQSLPT-EGVKTFSFKETEFTTVTAYQNQQITKLKIERNP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 FAKGFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTP :::::::.:::: :....::: ::: :: :. : . :.::.:.::.::: :.: CCDS14 FAKGFRDTGRNRGVLDGLLETYP-WRPSF-TLDFKTFGA--DTQSGSSGSSPVTSSGGAP 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 SPSASSHLLSPSCSPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLS :: : :::: : : ::: ..... : :. : :.:: : : . . . . : CCDS14 SPLNS--LLSPLCFSPMFHLPTSSLGMPCPEAYLPNVNL---PLCYKICPTNFWQQQPLV 340 350 360 370 380 420 430 440 450 460 470 pF1KE3 DSGYNRLQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFP--TS . .:: :...: : .: ...: ..:.. . : :.: : . : . : :. CCDS14 LPAPERLASSNSS--QSLAPLM-MEVP-MLSSLGVTNSKSGSS--EDSSDQYLQAPNSTN 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE3 QFQYVMQA-GNA-ASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPE :. : .:. :: .: .:. . . :.: :..: ::: :: .. . CCDS14 QMLYGLQSPGNIFLPNSITPEAL-----------SCSFHPSYDFYRYNFSMPSRLISGSN 450 460 470 480 490 540 550 560 570 580 590 pF1KE3 KLSASQSTLLCSSPSNGAFGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGS .:...... . : ..: .. .. :. ..: . CCDS14 HLKVNDDSQV--SFGEGKCNHVHWYPA-INHYL 500 510 520 600 pF1KE3 SSQMSVHMV >>CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 (447 aa) initn: 935 init1: 646 opt: 931 Z-score: 753.1 bits: 149.0 E(32554): 1.3e-35 Smith-Waterman score: 1008; 42.2% identity (64.8% similar) in 455 aa overlap (11-450:11-436) 10 20 30 40 50 pF1KE3 MSERRRSAVALSSRAHAFSVEALI--GSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTED :::::.:::. ::. :..:... . : :. .: : : :::. . CCDS43 MEFTASPKPQLSSRANAFSIAALMSSGGSKEKEATENTIKPLEQFVEKSSCAQPLGELTS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 AAAHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQ ::: : . :: : .: :. :. . . .:. : .: :. CCDS43 LDAHG-------EFGGGSGSSP----SSSSLCTEPLIPTTPI--IPSE--EMAKIACSLE 70 80 90 100 120 130 140 150 160 170 pF1KE3 CADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYH .:: .::..::::::::.::::::..::...:.::. .: . :::::::::::::.:: CCDS43 TKELWDKFHELGTEMIITKSGRRMFPTIRVSFSGVDPEAKYIVLMDIVPVDNKRYRYAYH 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE3 SSKWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMH :.:.:::.:: :.: :.:.:::: .:. ..:.:::.:.::::::::..:::::.::: CCDS43 RSSWLVAGKADPPLPARLYVHPDSPFTGEQLLKQMVSFEKVKLTNNELDQHGHIILNSMH 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 KYQPRVHVIRK-DFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNP :::::::.:.: : ...: : .. .:: :::::::.::::::: ::.:::: :: CCDS43 KYQPRVHIIKKKDHTASLLNLK----SEEFRTFIFPETVFTAVTAYQNQLITKLKIDSNP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE3 FAKGFRDSGR----NRTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSS ::::::::.: .: ..:.... ... : :.:: :. : . :.:. .: CCDS43 FAKGFRDSSRLTDIERESVESLIQKHSYARSPIRTYGGEE-----DVLGDESQTTPNRGS 290 300 310 320 330 360 370 380 390 400 pF1KE3 TGTPSPSAS-SHLLSPSCSPPTFHLAPNTFNVGCRESQLC----NLNLSDYPPCARSNMA . : : . : : .: : : : :. . .: ... . .. :: .: .: CCDS43 AFTTSDNLSLSSWVSSSSSFPGFQHPQSLTALGTSTASIATPIPHPIQGSLPPYSRLGMP 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE3 ALQSYPGLSDSGYNRLQSGTT--SATQPSETFMPQRTP-SLISGIPTPPSLPGNSKMEAY : . : .: :: : : .: . :. : . :.:. CCDS43 LTPSAIASSMQG-----SGPTFPSFHMPRYHHYFQQGPYAAIQGLRHSSAVMTPFV 400 410 420 430 440 470 480 490 500 510 520 pF1KE3 GGQLGSFPTSQFQYVMQAGNAASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTS >>CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 (372 aa) initn: 833 init1: 624 opt: 840 Z-score: 682.0 bits: 135.5 E(32554): 1.2e-31 Smith-Waterman score: 840; 45.4% identity (64.9% similar) in 328 aa overlap (49-368:45-366) 20 30 40 50 60 70 pF1KE3 SVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAAAHGLE--PHPDSEQSTGS : : : ::: : : : . CCDS13 ASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAP 20 30 40 50 60 70 80 90 100 110 120 130 pF1KE3 DSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCADLWKRFHDIGTEMIIT . . : .. . .. :..: .:: ... ..:.:. :: .:...:::::.: CCDS13 AAGAATSAAAEPEGPGASCAAAAKAPVKKN-AKVAGVSVQLEMKALWDEFNQLGTEMIVT 80 90 100 110 120 130 140 150 160 170 180 190 pF1KE3 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV ::::::::...::. :.:: .:.. ::.::::.:::::..:::.:.:::.:: .: :: CCDS13 KAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADPATPGRV 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE3 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS . :::: :.: ::.:.::::::::::: :::.:::::.:::.:::: ::. : .: CCDS13 HYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDSE 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE3 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSG-----RN-RT .. ::: : :: ::.::::::..::.::: ::::::::: :: : CCDS13 KYAE----ENFKTFVFEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRP 260 270 280 290 300 320 330 340 350 360 370 pF1KE3 GLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLSPSC : .: ..: : :: . : . : :: : .: .. :: .:. : : CCDS13 GALPLMSAFARSRNPVASPTQPSGTEKGLVTEGS-GLQPGLLDVLLKPPSKKSESLRPPH 310 320 330 340 350 360 380 390 400 410 420 430 pF1KE3 SPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTS CCDS13 CKDT 370 >>CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 (495 aa) initn: 809 init1: 624 opt: 832 Z-score: 673.6 bits: 134.4 E(32554): 3.4e-31 Smith-Waterman score: 835; 37.0% identity (59.9% similar) in 459 aa overlap (49-492:45-471) 20 30 40 50 60 70 pF1KE3 SVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAAAHGLE--PHPDSEQSTGS : : : ::: : : : . CCDS13 ASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAP 20 30 40 50 60 70 80 90 100 110 120 130 pF1KE3 DSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCADLWKRFHDIGTEMIIT . . : .. . .. :..: .:: ... ..:.:. :: .:...:::::.: CCDS13 AAGAATSAAAEPEGPGASCAAAAKAPVKKN-AKVAGVSVQLEMKALWDEFNQLGTEMIVT 80 90 100 110 120 130 140 150 160 170 180 190 pF1KE3 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV ::::::::...::. :.:: .:.. ::.::::.:::::..:::.:.:::.:: .: :: CCDS13 KAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADPATPGRV 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE3 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS . :::: :.: ::.:.::::::::::: :::.:::::.:::.:::: ::. : .: CCDS13 HYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDSE 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE3 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSG-----RN-RT .. ::: : :: ::.::::::..::.::: ::::::::: :: : CCDS13 KYAE----ENFKTFVFEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRP 260 270 280 290 300 320 330 340 350 360 pF1KE3 GLEAIMETYAFWRPPVRTLT-----FEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHL : .: ..: : :: . : .: . ... ..: . .. . : :. ... CCDS13 GALPLMSAFARSRNPVASPTQPSGTEKDAAEARREFQRDAGGPAVLGDPAHP-PQLLARV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 LSPSC--SPPTFHLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNR :::: . . :.: : : : :: . . : :: :. ... CCDS13 LSPSLPGAGGAGGLVPLPGAPGGRPS----------PPNPELRLEA----PGASEPLHHH 370 380 390 400 410 430 440 450 460 470 480 pF1KE3 LQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLGSFPTSQFQYVMQA . ..: . .. .. :.: ::: ....: . . : . . : : CCDS13 PYKYPAAAY---DHYLGAKSR------PAPYPLPG---LRGHGYHPHAHPHHHHHPVSPA 420 430 440 450 460 490 500 510 520 530 540 pF1KE3 GNAASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLL . ::..... CCDS13 AAAAAAAAAAAAAANMYSSAGAAPPGSYDYCPR 470 480 490 >>CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 (398 aa) initn: 839 init1: 624 opt: 824 Z-score: 668.8 bits: 133.2 E(32554): 6.3e-31 Smith-Waterman score: 824; 47.9% identity (67.9% similar) in 290 aa overlap (49-330:45-329) 20 30 40 50 60 70 pF1KE3 SVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTEDAAAHGLE--PHPDSEQSTGS : : : ::: : : : . CCDS13 ASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCAAAAPGAPGPPPPPHAYPFAP 20 30 40 50 60 70 80 90 100 110 120 130 pF1KE3 DSEVLTERTSCSFSTHTDLASGAAGPVPAAMSSMEEIQVELQCADLWKRFHDIGTEMIIT . . : .. . .. :..: .:: ... ..:.:. :: .:...:::::.: CCDS13 AAGAATSAAAEPEGPGASCAAAAKAPVKKN-AKVAGVSVQLEMKALWDEFNQLGTEMIVT 80 90 100 110 120 130 140 150 160 170 180 190 pF1KE3 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV ::::::::...::. :.:: .:.. ::.::::.:::::..:::.:.:::.:: .: :: CCDS13 KAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYRYAFHSSSWLVAGKADPATPGRV 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE3 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS . :::: :.: ::.:.::::::::::: :::.:::::.:::.:::: ::. : .: CCDS13 HYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIILNSMHRYQPRFHVVYVDPRKDSE 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE3 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSG-----RN-RT .. ::: : :: ::.::::::..::.::: ::::::::: :: : CCDS13 KYAE----ENFKTFVFEETRFTAVTAYQNHRITQLKIASNPFAKGFRDCDPEDWPRNHRP 260 270 280 290 300 320 330 340 350 360 370 pF1KE3 GLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLSPSC : .: ..: : :: . : CCDS13 GALPLMSAFARSRNPVASPTQPSGTEKGGHVLKDKEVKAETSRNTPEREVELLRDAGGCV 310 320 330 340 350 360 >>CCDS10670.1 TBX6 gene_id:6911|Hs108|chr16 (436 aa) initn: 548 init1: 330 opt: 803 Z-score: 651.4 bits: 130.1 E(32554): 5.8e-30 Smith-Waterman score: 819; 37.8% identity (60.6% similar) in 447 aa overlap (47-473:17-434) 20 30 40 50 60 70 pF1KE3 AFSVEALIGSNKKRKLRDWEEKGLDLSMEALSPAGPLGDTE--DAAAHGLE-PHPDSEQS :.:: : .:. : :.: . :. :. . CCDS10 MYHPRELYPSLGAGYRLGPAQPGADSSFPPALAEGYRYPELDTPKL 10 20 30 40 80 90 100 110 120 pF1KE3 TGSDSEVLTERTSCSFSTHTDL-----ASGA--AGPVPAAMSSMEEIQVELQCADLWKRF : . : . ....: : : :. : .: :. :. ... :. .:::.: CCDS10 DCFLSGM--EAAPRTLAAHPPLPLLPPAMGTEPAPSAPEALHSLPGVSLSLENRELWKEF 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE3 HDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAG ..:::::::::::::::: ::..:::::. .: . .:..:::. ::: ... .: .: CCDS10 SSVGTEMIITKAGRRMFPACRVSVTGLDPEARYLFLLDVIPVDGARYR--WQGRRWEPSG 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE3 NADSPVPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHV .:. .: :::::::: :.: :::: ::: ..::::. :: .::.:::::::::::.:. CCDS10 KAEPRLPDRVYIHPDSPATGAHWMRQPVSFHRVKLTNSTLDPHGHLILHSMHKYQPRIHL 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE3 IRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSG .: ...: . :. .: ::::.: .:::::: :::.::: ::::::::..: CCDS10 VR---AAQLCSQH----WGGMASFRFPETTFISVTAYQNPQITQLKIAANPFAKGFRENG 230 240 250 260 270 310 320 330 340 350 360 pF1KE3 RN-RTGLEAIMETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSST-GTPSPSASSH :: . .: .. :. : .. . : .. : . :. .:.:. .. CCDS10 RNCKRERDARVKRKLRGPEPAATEAYGSGDTPGGPCDSTLGGDIRESDPEQAPAPGEATA 280 290 300 310 320 330 370 380 390 400 410 pF1KE3 LLSPSCSPPT---FHLAPNTFNVGCRESQLCNLNLSDYPPCARSN--MAALQSYP-GLSD .: :. :. . : : .:. . . . .. . : .:: ::. : : . CCDS10 APAPLCGGPSAEAYLLHPAAFHGAPSHLPTRSPSFPEAPDSGRSAPYSAAFLELPHGSGG 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE3 SGYNRLQSGTTSATQPSETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQL--GSFPTSQ ::: :. :. : :. ...: : : :: . : :: : :: : CCDS10 SGY--------PAAPPAVPFAPH----FLQGGPFP--LP----YTAPGGYLDVGSKPMY 400 410 420 430 480 490 500 510 520 530 pF1KE3 FQYVMQAGNAASSSSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLS >>CCDS9173.1 TBX5 gene_id:6910|Hs108|chr12 (518 aa) initn: 500 init1: 350 opt: 790 Z-score: 639.9 bits: 128.2 E(32554): 2.5e-29 Smith-Waterman score: 799; 35.4% identity (63.0% similar) in 449 aa overlap (87-505:24-460) 60 70 80 90 100 110 pF1KE3 EDAAAHGLEPHPDSEQSTGSDSEVLTERTSCSFSTHTDLASGAAGPV-PAA---MSSMEE :. . .. :.. . .: : : ...:: CCDS91 MADADEGFGLAHTPLEPDAKDLPCDSKPESALGAPSKSPSSPQAAFTQQGMEG 10 20 30 40 50 120 130 140 150 160 170 pF1KE3 IQVELQCADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKR :.: :. .:: .::..:::::::::::::::...::.:::.:. .: . :::::.:..: CCDS91 IKVFLHERELWLKFHEVGTEMIITKAGRRMFPSYKVKVTGLNPKTKYILLMDIVPADDHR 60 70 80 90 100 110 180 190 200 210 220 230 pF1KE3 YRYVYHSSKWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHI :... ..:: :.:.:. .: :.:.:::: :.: ::::.:::.:::::::.:: ::: CCDS91 YKFA--DNKWSVTGKAEPAMPGRLYVHPDSPATGAHWMRQLVSFQKLKLTNNHLDPFGHI 120 130 140 150 160 170 240 250 260 270 280 290 pF1KE3 ILHSMHKYQPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLK ::.::::::::.:... : .. .. . . : ::::.: .::.:::..::.:: CCDS91 ILNSMHKYQPRLHIVKADENNGFGSKNTA-----FCTHVFPETAFIAVTSYQNHKITQLK 180 190 200 210 220 300 310 320 330 340 pF1KE3 IDRNPFAKGFRDSGRNRTGLEAIMETYAFWRPPVRTL------TFEDFTTMQKQQGGSTG :. :::::::: : . . :.. . : :. . :.. .. . :.. CCDS91 IENNPFAKGFRGSDDMELHRMSRMQSKEYPVVPRSTVRQKVASNHSPFSSESRALSTSSN 230 240 250 260 270 280 350 360 370 380 390 400 pF1KE3 T-SPTTSSTGTPSPSASSHLLSPSCSPPTFHLAPNTFNVGCRESQLCNLNLSDYP---PC : .:. .:: . :: : : . . .. :. . :. .:.: : CCDS91 LGSQYQCENGVSGPS--QDLLPPPNPYPLPQEHSQIYHCTKRKEEECST--TDHPYKKPY 290 300 310 320 330 340 410 420 430 440 450 pF1KE3 ARSNMAALQS-----YPGLSDSGYN-RLQSGTTSATQPSETFMPQR-TPSL--ISGIPTP ... . .: :: . : . : .:. .: . . . :.. .::: :: : CCDS91 METSPSEEDSFYRSSYPQQQGLGASYRTESAQRQACMYASSAPPSEPVPSLEDIS-CNTW 350 360 370 380 390 400 460 470 480 490 500 pF1KE3 PSLPGNSKMEAYGGQ-LGSFPTSQFQYVMQAG------NAASSSSSPHMFGGSHMQQSSY ::.:. :. . : . .: ..:. . .: . .. .::.. : ..:.: CCDS91 PSMPSYSSCTVTTVQPMDRLPYQHFSAHFTSGPLVPRLAGMANHGSPQLGEGMFQHQTSV 410 420 430 440 450 460 510 520 530 540 550 560 pF1KE3 NAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGAFGERQYLPSGMEHSM CCDS91 AHQPVVRQCGPQTGLQSPGTLQPPEFLYSHGVPRTLSPHQYHSVHGVGMVPEWSDNS 470 480 490 500 510 602 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 04:42:08 2016 done: Sun Nov 6 04:42:09 2016 Total Scan time: 3.760 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]