FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9752, 607 aa 1>>>pF1KB9752 607 - 607 aa - 607 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2676+/-0.000932; mu= 8.3168+/- 0.057 mean_var=204.8215+/-41.827, 0's: 0 Z-trim(113.3): 30 B-trim: 90 in 1/51 Lambda= 0.089616 statistics sampled from 13916 (13945) to 13916 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.746), E-opt: 0.2 (0.428), width: 16 Scan time: 3.790 The best scores are: opt bits E(32554) CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 ( 607) 4083 540.5 2.3e-153 CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 ( 602) 1557 213.9 4.8e-55 CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 ( 496) 1555 213.6 4.9e-55 CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX ( 520) 1210 169.0 1.4e-41 CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 ( 447) 947 134.9 2.1e-31 CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 ( 495) 846 121.9 1.9e-27 CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 ( 398) 835 120.4 4.4e-27 CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 ( 372) 834 120.3 4.6e-27 CCDS31621.1 TBX10 gene_id:347853|Hs108|chr11 ( 385) 805 116.5 6.3e-26 CCDS10670.1 TBX6 gene_id:6911|Hs108|chr16 ( 436) 800 115.9 1.1e-25 CCDS82180.1 TBX4 gene_id:9496|Hs108|chr17 ( 546) 793 115.1 2.4e-25 CCDS11629.1 TBX4 gene_id:9496|Hs108|chr17 ( 545) 786 114.2 4.5e-25 CCDS11627.2 TBX2 gene_id:6909|Hs108|chr17 ( 712) 784 114.0 6.6e-25 CCDS9173.1 TBX5 gene_id:6910|Hs108|chr12 ( 518) 766 111.6 2.6e-24 CCDS9175.1 TBX3 gene_id:6926|Hs108|chr12 ( 723) 764 111.5 4e-24 CCDS9174.1 TBX5 gene_id:6910|Hs108|chr12 ( 468) 745 108.8 1.6e-23 CCDS55960.1 MGA gene_id:23269|Hs108|chr15 (2856) 687 102.0 1.1e-20 CCDS55959.1 MGA gene_id:23269|Hs108|chr15 (3065) 687 102.0 1.2e-20 CCDS33310.1 TBR1 gene_id:10716|Hs108|chr2 ( 682) 650 96.7 1e-19 CCDS2646.1 EOMES gene_id:8320|Hs108|chr3 ( 686) 643 95.8 2e-19 CCDS63585.1 EOMES gene_id:8320|Hs108|chr3 ( 705) 643 95.8 2e-19 CCDS11514.1 TBX21 gene_id:30009|Hs108|chr17 ( 535) 638 95.1 2.6e-19 CCDS9176.1 TBX3 gene_id:6926|Hs108|chr12 ( 743) 503 77.7 5.9e-14 CCDS59045.1 T gene_id:6862|Hs108|chr6 ( 377) 494 76.3 7.9e-14 CCDS5290.1 T gene_id:6862|Hs108|chr6 ( 435) 494 76.4 8.8e-14 CCDS1272.1 TBX19 gene_id:9095|Hs108|chr1 ( 448) 480 74.6 3.2e-13 CCDS63584.1 EOMES gene_id:8320|Hs108|chr3 ( 410) 479 74.4 3.2e-13 >>CCDS34495.1 TBX18 gene_id:9096|Hs108|chr6 (607 aa) initn: 4083 init1: 4083 opt: 4083 Z-score: 2866.7 bits: 540.5 E(32554): 2.3e-153 Smith-Waterman score: 4083; 99.8% identity (99.8% similar) in 607 aa overlap (1-607:1-607) 10 20 30 40 50 60 pF1KB9 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGG ::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::: CCDS34 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAAGAVDDGGCSRGGG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFEDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFEDI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 PGIPKQGNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNTSQLCSLAPADYSAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PGIPKQGNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNTSQLCSLAPADYSAC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 ARSGLTLNRYSTSLAETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSMGGTDGDTFSC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ARSGLTLNRYSTSLAETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSMGGTDGDTFSC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 PQTSLSMQISGMSPQLQYIMPSPSSNAFATNQTHQGSYNTFRLHSPCALYGYNFSTSPKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PQTSLSMQISGMSPQLQYIMPSPSSNAFATNQTHQGSYNTFRLHSPCALYGYNFSTSPKL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 AASPEKIVSSQGSFLGSSPSGTMTDRQMLPPVEGVHLLSSGGQQSFFDSRTLGSLTLSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AASPEKIVSSQGSFLGSSPSGTMTDRQMLPPVEGVHLLSSGGQQSFFDSRTLGSLTLSSS 550 560 570 580 590 600 pF1KB9 QVSAHMV ::::::: CCDS34 QVSAHMV >>CCDS81360.1 TBX15 gene_id:6913|Hs108|chr1 (602 aa) initn: 1866 init1: 1405 opt: 1557 Z-score: 1101.8 bits: 213.9 E(32554): 4.8e-55 Smith-Waterman score: 1991; 55.2% identity (73.7% similar) in 636 aa overlap (1-607:1-602) 10 20 30 40 50 60 pF1KB9 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGG :.:.::.. :: .:::::::::::..:...:. ..: : . . .:.. .: : CCDS81 MSERRRSA--VALSSRAHAFSVEALIGSNKKRKLRDWEEK-GLDLSMEALSPAG---PLG 10 20 30 40 50 70 80 90 100 110 120 pF1KB9 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG : ....: : : : . : . : . :: . : .:. . ::: ...: CCDS81 DTEDAAAHGLE----PHPDSEQSTGSDSEVLTERTS---C--SFSTH-TDLASGAAGP-- 60 70 80 90 100 130 140 150 160 170 180 pF1KB9 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD :: . : . .:.:: :.::::::.::::::::::::::::::::::.::: CCDS81 VPA--------AMSSMEEIQVELQCADLWKRFHDIGTEMIITKAGRRMFPAMRVKITGLD 110 120 130 140 150 190 200 210 220 230 240 pF1KB9 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVI :::::::::::::::::::::::::::::::::::::::::::::::: :::.::::::. CCDS81 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSLASGDTWMRQVV 160 170 180 190 200 210 250 260 270 280 290 300 pF1KB9 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPE :::::::::::::::::::::::::::::::::::: ..:::: :::: :.:::.:.::: CCDS81 SFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLSPTKPVPVGDGVKTFNFPE 220 230 240 250 260 270 310 320 330 340 350 360 pF1KB9 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFEDI ::::::::::::::::::::::::::::::::::: ::::..:.:::::: .:::::::. CCDS81 TVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAIMETYAFWRPPVRTLTFEDF 280 290 300 310 320 330 370 380 390 400 410 pF1KB9 PGIPKQ--GNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNT-------SQLCS . :: :....: ..::. :.. :::: ::: :.:::.::: ::::. CCDS81 TTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLS-PSCSPPTFHLAPNTFNVGCRESQLCN 340 350 360 370 380 390 420 430 440 450 460 pF1KB9 LAPADYSACARSGLTLNRYSTSLAET-YNRLTN------QAGETFAPPRTPSYV-GVSSS : .:: ::::... . .:... :::: . : .::: : :::: . :. . CCDS81 LNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPSETFMPQRTPSLISGIPTP 400 410 420 430 440 450 470 480 490 500 510 pF1KB9 TSV--NMSM---GGTDGDTFSCPQTSLSMQISGMSPQLQYIMPSPSSNAFATNQTHQGSY :. : .: :: : .: : . :: .. . . : : . :. .. .:.:: CCDS81 PSLPGNSKMEAYGGQLG-SFPTSQFQYVMQAGNAASS------SSSPHMFGGSHMQQSSY 460 470 480 490 500 520 530 540 550 560 570 pF1KB9 NTFRLHSPCALYGYNFSTSPKLAASPEKIVSSQGSFLGSSPS-GTMTDRQMLPP-VE-GV :.: ::.: :::::: :::.:::::::. .::...: :::: :.. .::.:: .: .. CCDS81 NAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPSNGAFGERQYLPSGMEHSM 510 520 530 540 550 560 580 590 600 pF1KB9 HLLSSG--GQQSF--FDSRTLGSLTLSSSQVSAHMV :..: . .::. :.: :.. ::::.:.::: CCDS81 HMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV 570 580 590 600 >>CCDS30816.1 TBX15 gene_id:6913|Hs108|chr1 (496 aa) initn: 1758 init1: 1405 opt: 1555 Z-score: 1101.5 bits: 213.6 E(32554): 4.9e-55 Smith-Waterman score: 1897; 61.5% identity (78.4% similar) in 504 aa overlap (133-607:1-496) 110 120 130 140 150 160 pF1KB9 GFQQGASPLASPGGSPKGSPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIIT . : . .:.:: :.::::::.:::::::: CCDS30 MSSMEEIQVELQCADLWKRFHDIGTEMIIT 10 20 30 170 180 190 200 210 220 pF1KB9 KAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV ::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::: CCDS30 KAGRRMFPAMRVKITGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSPVPPRV 40 50 60 70 80 90 230 240 250 260 270 280 pF1KB9 YIHPDSPASGETWMRQVISFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLS :::::: :::.::::::.:::::::::::::::::::::::::::::::::::: ..::: CCDS30 YIHPDSLASGDTWMRQVVSFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDFSSDLS 100 110 120 130 140 150 290 300 310 320 330 340 pF1KB9 PIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALV : :::: :.:::.:.:::::::::::::::::::::::::::::::::::::: ::::.. CCDS30 PTKPVPVGDGVKTFNFPETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRTGLEAIM 160 170 180 190 200 210 350 360 370 380 390 400 pF1KB9 ESYAFWRPSLRTLTFEDIPGIPKQ--GNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAF :.:::::: .:::::::. . :: :....: ..::. :.. :::: ::: :.: CCDS30 ETYAFWRPPVRTLTFEDFTTMQKQQGGSTGTSPTTSSTGTPSPSASSHLLS-PSCSPPTF 220 230 240 250 260 410 420 430 440 pF1KB9 HLGPNT-------SQLCSLAPADYSACARSGLTLNRYSTSLAET-YNRLTN------QAG ::.::: ::::.: .:: ::::... . .:... :::: . : . CCDS30 HLAPNTFNVGCRESQLCNLNLSDYPPCARSNMAALQSYPGLSDSGYNRLQSGTTSATQPS 270 280 290 300 310 320 450 460 470 480 490 500 pF1KB9 ETFAPPRTPSYV-GVSSSTSV--NMSM---GGTDGDTFSCPQTSLSMQISGMSPQLQYIM ::: : :::: . :. . :. : .: :: : .: : . :: .. . . CCDS30 ETFMPQRTPSLISGIPTPPSLPGNSKMEAYGGQLG-SFPTSQFQYVMQAGNAASS----- 330 340 350 360 370 380 510 520 530 540 550 560 pF1KB9 PSPSSNAFATNQTHQGSYNTFRLHSPCALYGYNFSTSPKLAASPEKIVSSQGSFLGSSPS : : . :. .. .:.:::.: ::.: :::::: :::.:::::::. .::...: :::: CCDS30 -SSSPHMFGGSHMQQSSYNAFSLHNPYNLYGYNFPTSPRLAASPEKLSASQSTLLCSSPS 390 400 410 420 430 440 570 580 590 600 pF1KB9 -GTMTDRQMLPP-VE-GVHLLSSG--GQQSF--FDSRTLGSLTLSSSQVSAHMV :.. .::.:: .: ..:..: . .::. :.: :.. ::::.:.::: CCDS30 NGAFGERQYLPSGMEHSMHMISPSPNNQQATNTCDGRQYGAVPGSSSQMSVHMV 450 460 470 480 490 >>CCDS14445.1 TBX22 gene_id:50945|Hs108|chrX (520 aa) initn: 725 init1: 618 opt: 1210 Z-score: 860.1 bits: 169.0 E(32554): 1.4e-41 Smith-Waterman score: 1239; 43.4% identity (65.2% similar) in 557 aa overlap (13-554:3-502) 10 20 30 40 50 60 pF1KB9 MAEKRRGSPCSMLSLKAHAFSVEALIGAEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGG :: .:.:::::::.: ....:: . ::. . :: CCDS14 MALSSRARAFSVEALVGRPSKRKLQDP---IQAEQPELR------EKKGG 10 20 30 40 70 80 90 100 110 120 pF1KB9 AGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKG :. . : . : . :. : :..:: : ..: : CCDS14 EEEEERRSSAAGKSEPLEKQPKTEPSTS-------ASSGC--GSDSGY-----------G 50 60 70 80 130 140 150 160 170 180 pF1KB9 SPARSLARPGTPLPSPQAPRVDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLD . ..:: . . .:::.:::::::.::::::::::::::::..:::..::: CCDS14 NSSESLEEKDIQM--------ELQGSELWKRFHDIGTEMIITKAGRRMFPSVRVKVKGLD 90 100 110 120 130 190 200 210 220 230 pF1KB9 PHQQYYIAMDIVPVDNKRYRYVYHSSKWMVAGNADSP-VPPRVYIHPDSPASGETWMRQV : .::..:.:.::::.::::::::::.::::::.: . :: :.::::: ::::::::. CCDS14 PGKQYHVAIDVVPVDSKRYRYVYHSSQWMVAGNTDHLCIIPRFYVHPDSPCSGETWMRQI 140 150 160 170 180 190 240 250 260 270 280 290 pF1KB9 ISFDKLKLTNNELDDQGHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFP ::::..::::::.::.:::::.:::::.::::::.. . ::: :. .:. ::::.::: CCDS14 ISFDRMKLTNNEMDDKGHIILQSMHKYKPRVHVIEQGSSVDLSQIQSLPT-EGVKTFSFK 200 210 220 230 240 250 300 310 320 330 340 350 pF1KB9 ETVFTTVTAYQNQQITRLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFED :: :::::::::::::.:::.::::::::::.:::: :..:.:.: ::::. :: :. CCDS14 ETEFTTVTAYQNQQITKLKIERNPFAKGFRDTGRNRGVLDGLLETYP-WRPSF-TLDFKT 260 270 280 290 300 310 360 370 380 390 400 410 pF1KB9 IPGIPKQGNASSSTLLQGTGNGVPATHPHLLSGSSCSSPAFHLGPNTS--QLCSLA---- . : :...:.:. . ..: :.:. ::: : :: ::: :..: . : : CCDS14 F-GADTQSGSSGSSPVTSSG-GAPSPLNSLLS-PLCFSPMFHL-PTSSLGMPCPEAYLPN 320 330 340 350 360 420 430 440 450 460 pF1KB9 ---PADYSACARSGLTLNRYSTSLAETYNRL-TNQAGETFAPPRTPSYVGVSSSTSVNMS : :. : . . . . . . .:: ........:: : . :: .:. : CCDS14 VNLPLCYKICPTN---FWQQQPLVLPAPERLASSNSSQSLAPLMME--VPMLSSLGVTNS 370 380 390 400 410 420 470 480 490 500 510 520 pF1KB9 MGGTDGDTFSCPQTSLSMQISGMSPQLQYIMPSPSSNAFATNQ-THQGSYNTFRLHSPCA .:.. :. .. .: . . :. : . ::. : : :. : .. .: : CCDS14 KSGSSEDS-----SDQYLQAPNSTNQMLYGLQSPG-NIFLPNSITPEALSCSF--HPSYD 430 440 450 460 470 530 540 550 560 570 580 pF1KB9 LYGYNFSTSPKLAASPEKIV---SSQGSFLGSSPSGTMTDRQMLPPVEGVHLLSSGGQQS .: :::: .: .. ... .:: :: CCDS14 FYRYNFSMPSRLISGSNHLKVNDDSQVSFGEGKCNHVHWYPAINHYL 480 490 500 510 520 >>CCDS43568.1 TBX20 gene_id:57057|Hs108|chr7 (447 aa) initn: 927 init1: 680 opt: 947 Z-score: 677.2 bits: 134.9 E(32554): 2.1e-31 Smith-Waterman score: 961; 46.9% identity (70.5% similar) in 369 aa overlap (115-457:69-421) 90 100 110 120 130 pF1KB9 PARSGADLERGAAGGCEDGFQQGASPLASPGGSPKGSPARSLAR----PGTPL-PSPQAP ::: .. . :: : ::. :: . CCDS43 IKPLEQFVEKSSCAQPLGELTSLDAHGEFGGGSGSSPSSSSLCTEPLIPTTPIIPSEEMA 40 50 60 70 80 90 140 150 160 170 180 190 pF1KB9 RV--DLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNK .. .:. ::: .:::.::::::::.::::::..::..::.::. .: . ::::::::: CCDS43 KIACSLETKELWDKFHELGTEMIITKSGRRMFPTIRVSFSGVDPEAKYIVLMDIVPVDNK 100 110 120 130 140 150 200 210 220 230 240 250 pF1KB9 RYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQGH ::::.:: :.:.:::.:: :.: :.:.::::: .:: ..:..::.:.::::::::..:: CCDS43 RYRYAYHRSSWLVAGKADPPLPARLYVHPDSPFTGEQLLKQMVSFEKVKLTNNELDQHGH 160 170 180 190 200 210 260 270 280 290 300 310 pF1KB9 IILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRL :::.::::::::::.:.: : . . . : : ..: :::::::.::::::: ::.: CCDS43 IILNSMHKYQPRVHIIKKK--DHTASLLNLKS-EEFRTFIFPETVFTAVTAYQNQLITKL 220 230 240 250 260 270 320 330 340 350 360 pF1KB9 KIDRNPFAKGFRDSGR----NRMGLEALVESYAFWRPSLRTLT-FEDIPG-----IPKQG ::: ::::::::::.: .: ..:.:...... : .:: ::. : :..: CCDS43 KIDSNPFAKGFRDSSRLTDIERESVESLIQKHSYARSPIRTYGGEEDVLGDESQTTPNRG 280 290 300 310 320 330 370 380 390 400 410 pF1KB9 NA-SSSTLLQ-----GTGNGVPA-THPHLLS--GSSCSSPAFHLGPNTSQLCSLAPADYS .: ..: :. ..... :. ::. :. :.: .: : . :. : :: : :: CCDS43 SAFTTSDNLSLSSWVSSSSSFPGFQHPQSLTALGTSTASIATPI-PHPIQ-GSLPP--YS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB9 ACARSGLTLNRYSTSLAETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSMGGTDGDTF : :. :. ...: ... .: :: . : : CCDS43 ---RLGMPLT--PSAIASSMQ----GSGPTFPSFHMPRYHHYFQQGPYAAIQGLRHSSAV 400 410 420 430 440 480 490 500 510 520 530 pF1KB9 SCPQTSLSMQISGMSPQLQYIMPSPSSNAFATNQTHQGSYNTFRLHSPCALYGYNFSTSP CCDS43 MTPFV >>CCDS13767.1 TBX1 gene_id:6899|Hs108|chr22 (495 aa) initn: 832 init1: 636 opt: 846 Z-score: 606.1 bits: 121.9 E(32554): 1.9e-27 Smith-Waterman score: 846; 43.3% identity (62.4% similar) in 351 aa overlap (58-391:25-366) 30 40 50 60 70 80 pF1KB9 AEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGGAGEKGSSEGDEGAALPPPAGATSGPAR :: : . . : ::: : CCDS13 MHFSTVTRDMEAFTASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCA 10 20 30 40 50 90 100 110 120 130 140 pF1KB9 SGADLERGAAGGCEDG----FQQGASPLASPGGSPKGSPARSLARPGTPLPSPQ---APR ..: :: : : .:. .: .. :.: : : .:. . . CCDS13 AAAP---GAPGPPPPPHAYPFAPAAGAATSAAAEPEGPGASCAAAAKAPVKKNAKVAGVS 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB9 VDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNKRYR :.:. :: .:...:::::.:::::::::...::. :.:: .:.. ::.::::.:::: CCDS13 VQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYR 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB9 YVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQGHIIL :..:::.:.:::.:: .: ::. ::::::.: ::.:..:::::::::: :::.::::: CCDS13 YAFHSSSWLVAGKADPATPGRVHYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIIL 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB9 HSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRLKID .:::.:::: ::. : : :. :.: : :: ::.::::::..::.::: CCDS13 NSMHRYQPRFHVVYVDPRKDSEKYAE----ENFKTFVFEETRFTAVTAYQNHRITQLKIA 240 250 260 270 280 330 340 350 360 370 pF1KB9 RNPFAKGFRDSG-----RN-RMGLEALVESYAFWRPSLRTLTFEDIPGIPKQGNASSSTL ::::::::: :: : : :. ..: : . . : . : :.. . . CCDS13 SNPFAKGFRDCDPEDWPRNHRPGALPLMSAFARSRNPVASPT--QPSGTEKDAAEARREF 290 300 310 320 330 340 380 390 400 410 420 430 pF1KB9 LQGTGN----GVPATHPHLLSGSSCSSPAFHLGPNTSQLCSLAPADYSACARSGLTLNRY . .:. : :: :.::. CCDS13 QRDAGGPAVLGDPAHPPQLLARVLSPSLPGAGGAGGLVPLPGAPGGRPSPPNPELRLEAP 350 360 370 380 390 400 >>CCDS13766.1 TBX1 gene_id:6899|Hs108|chr22 (398 aa) initn: 882 init1: 636 opt: 835 Z-score: 599.7 bits: 120.4 E(32554): 4.4e-27 Smith-Waterman score: 835; 42.8% identity (64.0% similar) in 353 aa overlap (58-395:25-368) 30 40 50 60 70 80 pF1KB9 AEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGGAGEKGSSEGDEGAALPPPAGATSGPAR :: : . . : ::: : CCDS13 MHFSTVTRDMEAFTASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCA 10 20 30 40 50 90 100 110 120 130 140 pF1KB9 SGADLERGAAGGCEDG----FQQGASPLASPGGSPKGSPARSLARPGTPLPSPQ---APR ..: :: : : .:. .: .. :.: : : .:. . . CCDS13 AAAP---GAPGPPPPPHAYPFAPAAGAATSAAAEPEGPGASCAAAAKAPVKKNAKVAGVS 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB9 VDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNKRYR :.:. :: .:...:::::.:::::::::...::. :.:: .:.. ::.::::.:::: CCDS13 VQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYR 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB9 YVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQGHIIL :..:::.:.:::.:: .: ::. ::::::.: ::.:..:::::::::: :::.::::: CCDS13 YAFHSSSWLVAGKADPATPGRVHYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIIL 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB9 HSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRLKID .:::.:::: ::. : : . :. :.: : :: ::.::::::..::.::: CCDS13 NSMHRYQPRFHVVYVDPRKDSEKY----AEENFKTFVFEETRFTAVTAYQNHRITQLKIA 240 250 260 270 280 330 340 350 360 370 pF1KB9 RNPFAKGFRDSG-----RN-RMGLEALVESYAFWRPSLRTLTFEDIPGIPKQGNASSSTL ::::::::: :: : : :. ..: : . . : . : : :.. .. CCDS13 SNPFAKGFRDCDPEDWPRNHRPGALPLMSAFARSRNPVASPT--QPSGTEKGGHVLKDKE 290 300 310 320 330 340 380 390 400 410 420 430 pF1KB9 LQG-TGNGVPATHPHLL-SGSSCSSPAFHLGPNTSQLCSLAPADYSACARSGLTLNRYST ... :. ..: . .:: ....: CCDS13 VKAETSRNTPEREVELLRDAGGCVNLGLPCPAECQPFNTQGLVAGRTAGDRLC 350 360 370 380 390 >>CCDS13765.1 TBX1 gene_id:6899|Hs108|chr22 (372 aa) initn: 877 init1: 636 opt: 834 Z-score: 599.4 bits: 120.3 E(32554): 4.6e-27 Smith-Waterman score: 834; 44.3% identity (63.6% similar) in 332 aa overlap (58-376:25-346) 30 40 50 60 70 80 pF1KB9 AEKQQQLQKKRRKLGAEEAARAVDDGGCSRGGGAGEKGSSEGDEGAALPPPAGATSGPAR :: : . . : ::: : CCDS13 MHFSTVTRDMEAFTASSLSSLGAAGGFPGAASPGADPYGPREPPPPPPRYDPCA 10 20 30 40 50 90 100 110 120 130 140 pF1KB9 SGADLERGAAGGCEDG----FQQGASPLASPGGSPKGSPARSLARPGTPLPSPQ---APR ..: :: : : .:. .: .. :.: : : .:. . . CCDS13 AAAP---GAPGPPPPPHAYPFAPAAGAATSAAAEPEGPGASCAAAAKAPVKKNAKVAGVS 60 70 80 90 100 110 150 160 170 180 190 200 pF1KB9 VDLQGAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNKRYR :.:. :: .:...:::::.:::::::::...::. :.:: .:.. ::.::::.:::: CCDS13 VQLEMKALWDEFNQLGTEMIVTKAGRRMFPTFQVKLFGMDPMADYMLLMDFVPVDDKRYR 120 130 140 150 160 170 210 220 230 240 250 260 pF1KB9 YVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQGHIIL :..:::.:.:::.:: .: ::. ::::::.: ::.:..:::::::::: :::.::::: CCDS13 YAFHSSSWLVAGKADPATPGRVHYHPDSPAKGAQWMKQIVSFDKLKLTNNLLDDNGHIIL 180 190 200 210 220 230 270 280 290 300 310 320 pF1KB9 HSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRLKID .:::.:::: ::. : : :. :.: : :: ::.::::::..::.::: CCDS13 NSMHRYQPRFHVVYVDPRKDSEKYAE----ENFKTFVFEETRFTAVTAYQNHRITQLKIA 240 250 260 270 280 330 340 350 360 370 pF1KB9 RNPFAKGFRDSG-----RN-RMGLEALVESYAFWRPSLRTLTFEDIPGIPKQGNASSSTL ::::::::: :: : : :. ..: : . . : :. ..: .. .. CCDS13 SNPFAKGFRDCDPEDWPRNHRPGALPLMSAFARSRNPVASPT---QPSGTEKGLVTEGSG 290 300 310 320 330 340 380 390 400 410 420 430 pF1KB9 LQGTGNGVPATHPHLLSGSSCSSPAFHLGPNTSQLCSLAPADYSACARSGLTLNRYSTSL :: CCDS13 LQPGLLDVLLKPPSKKSESLRPPHCKDT 350 360 370 >>CCDS31621.1 TBX10 gene_id:347853|Hs108|chr11 (385 aa) initn: 783 init1: 622 opt: 805 Z-score: 578.9 bits: 116.5 E(32554): 6.3e-26 Smith-Waterman score: 820; 45.1% identity (67.3% similar) in 324 aa overlap (109-425:33-330) 80 90 100 110 120 130 pF1KB9 AGATSGPARSGADLERGAAGGCEDGFQQGASPLASPGGSPKGSPARSLARPGTPLP-SPQ ::. : : ... :...:.: : .:. CCDS31 AFLSAGLGILAPSETYPLPTTSSGWEPRLGSPFPS-GPCTSSTGAQAVAEPTGQGPKNPR 10 20 30 40 50 60 140 150 160 170 180 190 pF1KB9 APRVDLQ--GAELWKRFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVD . :: .: ::..:...:::::.::::::::: ..::: :.: .: . ::..:.: CCDS31 VSRVTVQLEMKPLWEEFNQLGTEMIVTKAGRRMFPPFQVKILGMDSLADYALLMDFIPLD 70 80 90 100 110 120 200 210 220 230 240 250 pF1KB9 NKRYRYVYHSSKWMVAGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQ .:::::..::: :.:::.:: .: ::..::::::.: ::::..:::::::::: :::. CCDS31 DKRYRYAFHSSAWLVAGKADPATPGRVHFHPDSPAKGAQWMRQIVSFDKLKLTNNLLDDN 130 140 150 160 170 180 260 270 280 290 300 310 pF1KB9 GHIILHSMHKYQPRVHVIRKDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQIT :::::.:::.:::: ::. : : . . :. :.: : :: ::.::::::..:: CCDS31 GHIILNSMHRYQPRFHVVFVDPRKD----SERYAQENFKSFIFTETQFTAVTAYQNHRIT 190 200 210 220 230 320 330 340 350 360 370 pF1KB9 RLKIDRNPFAKGFRDSGRNRMGLEALVESYAFWRPSLRTLTFEDIPGIPKQGNAS-SSTL .::: ::::::::.: . : . : : ..: ....: : . CCDS31 QLKIASNPFAKGFRESDLDS------------WPVAPRPLL-----SVPARSHSSLSPCV 240 250 260 270 280 380 390 400 410 420 430 pF1KB9 LQGTGNGVPATHPHLLSGSSCSSPAF---HLGPNTSQLCSLAPADYSACARSGLTLNRYS :.:. . :. :.:. ..::. .: : : :::: : . ..: CCDS31 LKGATD--REKDPNKASASTSKTPAWLHHQLLPPPEVL--LAPATYRPVTYQSLYSGAPS 290 300 310 320 330 440 450 460 470 480 490 pF1KB9 TSLAETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSMGGTDGDTFSCPQTSLSMQISG CCDS31 HLGIPRTRPAPYPLPNIRADRDQGGLPLPAGLGLLSPTVVCLGPGQDSQ 340 350 360 370 380 >>CCDS10670.1 TBX6 gene_id:6911|Hs108|chr16 (436 aa) initn: 826 init1: 344 opt: 800 Z-score: 574.7 bits: 115.9 E(32554): 1.1e-25 Smith-Waterman score: 814; 39.3% identity (60.5% similar) in 410 aa overlap (79-455:13-406) 50 60 70 80 90 100 pF1KB9 AVDDGGCSRGGGAGEKGSSEGDEGAALPPPAGATSGPARSGADLERGAAGGCEDGFQQGA :: :::. ::: : . . . CCDS10 MYHPRELYPSLGAGYRLGPAQPGADSSFPPALAEGYRYPELD 10 20 30 40 110 120 130 140 150 pF1KB9 SP-LASPGGSPKGSPARSLARPGTPL--------PSPQAPR---------VDLQGAELWK .: : .. ...: :.: :: :.:.::. ..:.. :::: CCDS10 TPKLDCFLSGMEAAPRTLAAHPPLPLLPPAMGTEPAPSAPEALHSLPGVSLSLENRELWK 50 60 70 80 90 100 160 170 180 190 200 210 pF1KB9 RFHEIGTEMIITKAGRRMFPAMRVKISGLDPHQQYYIAMDIVPVDNKRYRYVYHSSKWMV .: .:::::::::::::::: ::...::::. .: . .:..:::. :::. .. .: CCDS10 EFSSVGTEMIITKAGRRMFPACRVSVTGLDPEARYLFLLDVIPVDGARYRW--QGRRWEP 110 120 130 140 150 160 220 230 240 250 260 270 pF1KB9 AGNADSPVPPRVYIHPDSPASGETWMRQVISFDKLKLTNNELDDQGHIILHSMHKYQPRV .:.:. .: ::::::::::.: :::: .:: ..::::. :: .::.:::::::::::. CCDS10 SGKAEPRLPDRVYIHPDSPATGAHWMRQPVSFHRVKLTNSTLDPHGHLILHSMHKYQPRI 170 180 190 200 210 220 280 290 300 310 320 pF1KB9 HVIR--KDCGDDLSPIKPVPSGEGVKAFSFPETVFTTVTAYQNQQITRLKIDRNPFAKGF :..: . :.. . :. .: ::::.: .:::::: :::.::: ::::::: CCDS10 HLVRAAQLCSQHWG---------GMASFRFPETTFISVTAYQNPQITQLKIAANPFAKGF 230 240 250 260 270 330 340 350 360 370 380 pF1KB9 RDSGRN-RMGLEALVESYAFWRPSLRTLTFE--DIPGIPKQ----GNASSSTLLQGTGNG :..::: . .: :. : .. : :: : . :. : :. . : CCDS10 RENGRNCKRERDARVKRKLRGPEPAATEAYGSGDTPGGPCDSTLGGDIRESDPEQAPAPG 280 290 300 310 320 330 390 400 410 420 430 pF1KB9 VPATHPHLLSGSSCSS-----PA-FHLGPNTSQLCSLAPADYSACARSGLTLNRYSTSLA .. : : :. . :: :: .: :.: . .:. . :: . ::... CCDS10 EATAAPAPLCGGPSAEAYLLHPAAFHGAP--SHLPTRSPS-FPEAPDSGRSAP-YSAAFL 340 350 360 370 380 440 450 460 470 480 490 pF1KB9 ETYNRLTNQAGETFAPPRTPSYVGVSSSTSVNMSMGGTDGDTFSCPQTSLSMQISGMSPQ : . .. .: ::: .: CCDS10 ELPHG-SGGSGYPAAPPAVPFAPHFLQGGPFPLPYTAPGGYLDVGSKPMY 390 400 410 420 430 607 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 17:10:00 2016 done: Mon Nov 7 17:10:00 2016 Total Scan time: 3.790 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]