FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9645, 1032 aa 1>>>pF1KB9645 1032 - 1032 aa - 1032 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.4854+/-0.000993; mu= -1.1308+/- 0.060 mean_var=253.1159+/-55.584, 0's: 0 Z-trim(112.8): 21 B-trim: 0 in 0/51 Lambda= 0.080615 statistics sampled from 13509 (13518) to 13509 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.729), E-opt: 0.2 (0.415), width: 16 Scan time: 5.470 The best scores are: opt bits E(32554) CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032) 6790 803.5 0 CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077) 6790 803.5 0 CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081) 2201 269.8 2.2e-71 CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031) 1972 243.1 2.2e-63 CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034) 1972 243.1 2.2e-63 >>CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032 aa) initn: 6790 init1: 6790 opt: 6790 Z-score: 4279.7 bits: 803.5 E(32554): 0 Smith-Waterman score: 6790; 100.0% identity (100.0% similar) in 1032 aa overlap (1-1032:1-1032) 10 20 30 40 50 60 pF1KB9 MCNEETEIKEAQSYQNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQCPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MCNEETEIKEAQSYQNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQCPDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 VSYPQDSLAQIKAVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VSYPQDSLAQIKAVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 STTGPTTSTPSTSCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 STTGPTTSTPSTSCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFST 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 VQLYRQNNKLYGSVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VQLYRQNNKLYGSVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 WSKPRKRSLMEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WSKPRKRSLMEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 KLVPSTKKRALQDLAPPCSPEPAGMAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KLVPSTKKRALQDLAPPCSPEPAGMAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 WQFEARKAQILKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 WQFEARKAQILKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 QSIPLPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QSIPLPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB9 KFEPSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KFEPSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB9 PGTVKPLPAAVQSVQVQPSYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PGTVKPLPAAVQSVQVQPSYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB9 VTGKVNIKKEERPPEKEKSSLAKAASPIAKENKDFPKTEEVSGKPQKKGPEAETGKAKKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VTGKVNIKKEERPPEKEKSSLAKAASPIAKENKDFPKTEEVSGKPQKKGPEAETGKAKKE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB9 GPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPVS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB9 PSLDPLAMLYKISNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PSLDPLAMLYKISNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KB9 DSVASPLRESALMDISDMVKNLTGRLTPKSSTPSTVSEKSDADGSSFEEALDELSPVHKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DSVASPLRESALMDISDMVKNLTGRLTPKSSTPSTVSEKSDADGSSFEEALDELSPVHKR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KB9 KGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KB9 NVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPL 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KB9 NQIQEQQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NQIQEQQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPE 970 980 990 1000 1010 1020 1030 pF1KB9 DHLIYVTELEKQ :::::::::::: CCDS12 DHLIYVTELEKQ 1030 >>CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077 aa) initn: 6790 init1: 6790 opt: 6790 Z-score: 4279.4 bits: 803.5 E(32554): 0 Smith-Waterman score: 6790; 100.0% identity (100.0% similar) in 1032 aa overlap (1-1032:46-1077) 10 20 30 pF1KB9 MCNEETEIKEAQSYQNSPVSSATNQDAGYG :::::::::::::::::::::::::::::: CCDS77 VPEEELKAAEIDEEHVEDDGLSLDIQESEYMCNEETEIKEAQSYQNSPVSSATNQDAGYG 20 30 40 50 60 70 40 50 60 70 80 90 pF1KB9 SPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDSLAQIKAVYANLFSESCWSSLALD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDSLAQIKAVYANLFSESCWSSLALD 80 90 100 110 120 130 100 110 120 130 140 150 pF1KB9 LKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTSTSSSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTSTSSSS 140 150 160 170 180 190 160 170 180 190 200 210 pF1KB9 GYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKDCSAAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 GYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKDCSAAY 200 210 220 230 240 250 220 230 240 250 260 270 pF1KB9 DTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCMYCGHS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCMYCGHS 260 270 280 290 300 310 280 290 300 310 320 330 pF1KB9 FESLQDLSVHMIKTKHYQKVPLKEPVPAITKLVPSTKKRALQDLAPPCSPEPAGMAAEVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 FESLQDLSVHMIKTKHYQKVPLKEPVPAITKLVPSTKKRALQDLAPPCSPEPAGMAAEVA 320 330 340 350 360 370 340 350 360 370 380 390 pF1KB9 LSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQQLTAHM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 LSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQQLTAHM 380 390 400 410 420 430 400 410 420 430 440 450 pF1KB9 MVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDSPAGSTT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 MVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDSPAGSTT 440 450 460 470 480 490 460 470 480 490 500 510 pF1KB9 SEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFEPSTLYPYLREEDLDDSPKGGLDILKSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 SEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFEPSTLYPYLREEDLDDSPKGGLDILKSL 500 510 520 530 540 550 520 530 540 550 560 570 pF1KB9 ENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGTVKPLPAAVQSVQVQPSYAGGVKSLSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGTVKPLPAAVQSVQVQPSYAGGVKSLSSA 560 570 580 590 600 610 580 590 600 610 620 630 pF1KB9 EHNALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKSSLAKAASPIAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 EHNALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKSSLAKAASPIAK 620 630 640 650 660 670 640 650 660 670 680 690 pF1KB9 ENKDFPKTEEVSGKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ENKDFPKTEEVSGKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMD 680 690 700 710 720 730 700 710 720 730 740 750 pF1KB9 HSPEPSFINPLSALQSIMNTHLGKVSKPVSPSLDPLAMLYKISNSMLDKPVYPATPVKQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 HSPEPSFINPLSALQSIMNTHLGKVSKPVSPSLDPLAMLYKISNSMLDKPVYPATPVKQA 740 750 760 770 780 790 760 770 780 790 800 810 pF1KB9 DAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESALMDISDMVKNLTGRLTPKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 DAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESALMDISDMVKNLTGRLTPKS 800 810 820 830 840 850 820 830 840 850 860 870 pF1KB9 STPSTVSEKSDADGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 STPSTVSEKSDADGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGK 860 870 880 890 900 910 880 890 900 910 920 930 pF1KB9 YIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 YIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDC 920 930 940 950 960 970 940 950 960 970 980 990 pF1KB9 ASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEEDLGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS77 ASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEEDLGS 980 990 1000 1010 1020 1030 1000 1010 1020 1030 pF1KB9 TFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELEKQ :::::::::::::::::::::::::::::::::::::::::: CCDS77 TFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELEKQ 1040 1050 1060 1070 >>CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081 aa) initn: 3369 init1: 928 opt: 2201 Z-score: 1395.0 bits: 269.8 E(32554): 2.2e-71 Smith-Waterman score: 3645; 55.9% identity (75.6% similar) in 1076 aa overlap (1-1028:46-1077) 10 20 30 pF1KB9 MCNEETEIKEAQSYQNSPVSSATNQDAGYG :: :. . ::::::.. . .. CCDS12 VSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSE 20 30 40 50 60 70 40 50 60 70 80 pF1KB9 SPFSESSDQLAHFKGSSSREEKEDPQC--PDSVSYPQDSLAQIKAVYANLFSESCWSSLA : .::.::..: :...: ..:.: . : . .::: :.:::: :..:.: ::.: CCDS12 SHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNLN 80 90 100 110 120 130 90 100 110 120 130 140 pF1KB9 LDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTSTSS :.:.. .:.:... ::.: ::..:. . CCDS12 LNLHQP--------SSEKNNG--------------------------SSSSSSSSSSSCG 140 150 160 150 160 170 180 190 200 pF1KB9 SSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKDCSA :...::::.:.::::::.:. .:::::::::::::::..:::::.:::::::::::::: CCDS12 SGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSA 170 180 190 200 210 220 210 220 230 240 250 260 pF1KB9 AYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCMYCG ::::::::::::::::::::::.. :... :::::::::::.:::::::::::::::::: CCDS12 AYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCG 230 240 250 260 270 280 270 280 290 300 310 320 pF1KB9 HSFESLQDLSVHMIKTKHYQKVPLKEPV-PAITKLVPSTKKRALQDLAPPCSPEPAGMAA :::::::::::::::::::::::::::: :. .:..:.:.:.: .: : ::. .: . CCDS12 HSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTP 290 300 310 320 330 340 330 340 350 360 370 380 pF1KB9 EVALSESAKD-QKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQQL ....:.. :: .:::.:::::::.::::::.:.:::::.::::::::::::::::.: CCDS12 KATISDTNDALQKNSNPYITPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQEL 350 360 370 380 390 400 390 400 410 420 430 pF1KB9 TAHMMVTGHFLKVTTSASKKGKQLVLDPV-------VEEKIQSIPLPPTTHTRLPASSIK ::::::::::.:::.:: :::: .: :: ..::.::.:: :: : :... CCDS12 TAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTLLDEKVQSVPLAATTFTS-PSNT-- 410 420 430 440 450 440 450 460 470 480 490 pF1KB9 KQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFEPSTLYPYLREEDLDDS : : . . . : ::: .::: :. . : :.. . :: . :. : :: :.::..: CCDS12 --PASISPKLNVEVKKEVDKEKA-VTDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEES 460 470 480 490 500 510 500 510 520 530 540 550 pF1KB9 PKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGTVK-PLPAAVQSVQVQP :::::::::::::::..::.:::::.::::::::::::::::. .: : .. .:. ..: CCDS12 PKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKP 520 530 540 550 560 570 560 570 580 590 600 610 pF1KB9 SYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEKVTGKV-NIKKEERPPEKE . :. . .: .....:. :.: : : :.: ::::::.::: :: ..... . :. . CCDS12 MF-GNSEIVSPTKNQTLVSPPSSQTSPMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGK 580 590 600 610 620 630 620 630 640 650 660 670 pF1KB9 KSSLAKAA-SPIAKENKDFPKTEEVSG---KPQKKGPEAETGKAKKEGPLDVHTPNGTEP : .:. :: ..: . : : : . :...: : .:: . :: : CCDS12 LSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGCKDGSPLAEPVENGKEL 640 650 660 670 680 690 680 690 700 710 720 730 pF1KB9 LKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPVSPSLDPLAMLYKIS .: ... .. .:: :: :: :.::::::::.:: ::::..:: :.:::..::.:.: CCDS12 VKPLASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMS 700 710 720 730 740 750 740 750 760 770 pF1KB9 NSMLDKPVYPATP---VKQADAIDRYYYE-NSDQPIDLTKSKNK---------------- ::. .: . . : :.:: .:::.:. :.::::::::.:. CCDS12 NSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTA 760 770 780 790 800 810 780 790 800 810 820 pF1KB9 PLVSSVADSVA-----------SPLRESALMDISDMVKNLTGRLTPKSSTPSTVSEKSDA : .:: . ..: :::::.:: :::::.:::: : ::::::..::::: CCDS12 PATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESHTSKSSTPSSISEKSDI 820 830 840 850 860 870 830 840 850 860 870 880 pF1KB9 DGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERV ::...::: .: .:..::::::::::::::::::::::.:::.:.:::::::::.::::. CCDS12 DGATLEEA-EESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERM 880 890 900 910 920 930 890 900 910 920 930 940 pF1KB9 HISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYIS :::.:::::::::::::::::::::::::::::::::::::::::::::::.:: ::::: CCDS12 HISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYIS 940 950 960 970 980 990 950 960 970 980 990 1000 pF1KB9 HLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFA :::.:::: :.::::: .::. : .: ..: . .. :::::...:::::::::: CCDS12 HLESHLGFRLRDLSKLSTEQINSQIAQTKSPSEKMV--TSSPEEDLGTSYQCKLCNRTFA 1000 1010 1020 1030 1040 1050 1010 1020 1030 pF1KB9 SKHAVKLHLSKTHGKSPEDHLIYVTELEKQ :::::::::::::::::::::.::.: CCDS12 SKHAVKLHLSKTHGKSPEDHLLYVSELEKQ 1060 1070 1080 >>CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031 aa) initn: 2613 init1: 762 opt: 1972 Z-score: 1251.3 bits: 243.1 E(32554): 2.2e-63 Smith-Waterman score: 3203; 51.6% identity (72.3% similar) in 1052 aa overlap (3-1032:48-1031) 10 20 pF1KB9 MCNEETEIKEAQ----SYQNSPVSSATNQDAG .:: : : :::::: : .:::: CCDS54 LKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQKGCFSYQNSPGSHLSNQDAE 20 30 40 50 60 70 30 40 50 60 70 80 pF1KB9 YGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS---LAQIKAVYANLFSESCWS : .:..:::.. .:. .:. . : . : :... . .. :::::..:.: :: CCDS54 NESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWS 80 90 100 110 120 130 90 100 110 120 130 140 pF1KB9 SLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTS .:.: .: :.: . : : . CCDS54 GLGLGFKLSNSERRNCD----------------------------------------TRN 140 150 150 160 170 180 190 200 pF1KB9 TSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKD :..: .:::: ::.:.:::. . .:::::.::::::..:. :.::::::.:::.. CCDS54 GSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQ 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB9 CSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCM :::::::::::::::::::::.:::: ::. . .::::::....:. ::::::::::: CCDS54 CSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCM 220 230 240 250 260 270 270 280 290 300 310 320 pF1KB9 YCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVPSTKKRALQDLAPPCSPEPAG .:: ::.:::::::::::::::::::::::::.:. :.: .:::.. :. ::::. CCDS54 FCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVTPAKKRVF-DVNRPCSPD--- 280 290 300 310 320 330 330 340 350 360 370 380 pF1KB9 MAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQ .. ....: ..:: :: .. :::::::::::::::::: :.:::::::::::::::: CCDS54 -STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQ 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB9 QLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDS :::.::::::::::::.:::::::::::::.. ::.::. :.. . : : .. : CCDS54 QLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDC 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB9 PAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK-FEPSTLYPYLREEDLDDSPK : .:.: ::: .::.: .. ::. .:. :: :.: ..:. : :::::::.:. : CCDS54 TA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSK 460 470 480 490 500 510 520 530 540 550 560 pF1KB9 GGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP-GTVKPLPAAVQSVQVQPSY :: ::::::::::.:::.:::::::::..:::::::::: :: ::: . : .:..:. CCDS54 GGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNL 510 520 530 540 550 560 570 580 590 600 610 pF1KB9 AGGVKSLSSAEH-NALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKS .. .. .. . :. : :.: . .. : .. . : :: . :..: : CCDS54 TNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAVKECGK-------ESPHEEAS 570 580 590 600 610 620 620 630 640 650 660 670 pF1KB9 SLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKV :.... :. .: :.: .: . :: : : ::: . . :. :: .: . CCDS54 SFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLMKEGS-EKEKPQPLEPTSA-L 630 640 650 660 670 680 690 700 710 720 730 pF1KB9 TNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPV------SPSLDPLAMLYKI .::: . .:.: :::::::::..:.::::...:. ::: . ..:..: CCDS54 SNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKS 680 690 700 710 720 740 750 760 770 780 790 pF1KB9 SNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESAL . ...:::: . ...:.. :: .:::::::::::::.: :: :.: :: .. :: CCDS54 NLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQAQSCMSPPQKHAL 730 740 750 760 770 780 800 810 820 830 840 850 pF1KB9 MDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEALDELSPVHKRKGRQSNWNPQH ::.:::: : ::: .. : : : . : ::.. .:.: .:::::::::::::: CCDS54 SDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQH 790 800 810 820 830 840 860 870 880 890 900 910 pF1KB9 LLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGG :::::::::::: .:.::::..::::::::..::::::::::::::::::::::::.::: CCDS54 LLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQLRKTGG 850 860 870 880 890 900 920 930 940 950 960 970 pF1KB9 TKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQE-QQNVS ::::::.: :::.:.:.:::::::: ::::::::.::::..::...: ..: .. .:..: CCDS54 TKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSKVEQEIS 910 920 930 940 950 960 980 990 1000 1010 1020 1030 pF1KB9 KVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELE .: . . :.::: : :.:::: :::.:::::::::::::.:::: : .::... CCDS54 RVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVD 970 980 990 1000 1010 1020 pF1KB9 KQ .. CCDS54 EE 1030 >>CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034 aa) initn: 2613 init1: 762 opt: 1972 Z-score: 1251.3 bits: 243.1 E(32554): 2.2e-63 Smith-Waterman score: 3203; 51.6% identity (72.3% similar) in 1052 aa overlap (3-1032:51-1034) 10 20 pF1KB9 MCNEETEIKEAQ----SYQNSPVSSATNQDAG .:: : : :::::: : .:::: CCDS33 LKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQKGCFSYQNSPGSHLSNQDAE 30 40 50 60 70 80 30 40 50 60 70 80 pF1KB9 YGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS---LAQIKAVYANLFSESCWS : .:..:::.. .:. .:. . : . : :... . .. :::::..:.: :: CCDS33 NESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWS 90 100 110 120 130 90 100 110 120 130 140 pF1KB9 SLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTS .:.: .: :.: . : : . CCDS33 GLGLGFKLSNSERRNCD----------------------------------------TRN 140 150 150 160 170 180 190 200 pF1KB9 TSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKD :..: .:::: ::.:.:::. . .:::::.::::::..:. :.::::::.:::.. CCDS33 GSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQ 160 170 180 190 200 210 210 220 230 240 250 260 pF1KB9 CSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCM :::::::::::::::::::::.:::: ::. . .::::::....:. ::::::::::: CCDS33 CSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCM 220 230 240 250 260 270 270 280 290 300 310 320 pF1KB9 YCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVPSTKKRALQDLAPPCSPEPAG .:: ::.:::::::::::::::::::::::::.:. :.: .:::.. :. ::::. CCDS33 FCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVTPAKKRVF-DVNRPCSPD--- 280 290 300 310 320 330 330 340 350 360 370 380 pF1KB9 MAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQ .. ....: ..:: :: .. :::::::::::::::::: :.:::::::::::::::: CCDS33 -STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQ 340 350 360 370 380 390 390 400 410 420 430 440 pF1KB9 QLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDS :::.::::::::::::.:::::::::::::.. ::.::. :.. . : : .. : CCDS33 QLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDC 400 410 420 430 440 450 450 460 470 480 490 500 pF1KB9 PAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK-FEPSTLYPYLREEDLDDSPK : .:.: ::: .::.: .. ::. .:. :: :.: ..:. : :::::::.:. : CCDS33 TA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSK 460 470 480 490 500 510 510 520 530 540 550 560 pF1KB9 GGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP-GTVKPLPAAVQSVQVQPSY :: ::::::::::.:::.:::::::::..:::::::::: :: ::: . : .:..:. CCDS33 GGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNL 520 530 540 550 560 570 570 580 590 600 610 pF1KB9 AGGVKSLSSAEH-NALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKS .. .. .. . :. : :.: . .. : .. . : :: . :..: : CCDS33 TNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAVKECGK-------ESPHEEAS 580 590 600 610 620 620 630 640 650 660 670 pF1KB9 SLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKV :.... :. .: :.: .: . :: : : ::: . . :. :: .: . CCDS33 SFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLMKEGS-EKEKPQPLEPTSA-L 630 640 650 660 670 680 690 700 710 720 730 pF1KB9 TNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPV------SPSLDPLAMLYKI .::: . .:.: :::::::::..:.::::...:. ::: . ..:..: CCDS33 SNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKS 680 690 700 710 720 730 740 750 760 770 780 790 pF1KB9 SNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESAL . ...:::: . ...:.. :: .:::::::::::::.: :: :.: :: .. :: CCDS33 NLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQAQSCMSPPQKHAL 740 750 760 770 780 790 800 810 820 830 840 850 pF1KB9 MDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEALDELSPVHKRKGRQSNWNPQH ::.:::: : ::: .. : : : . : ::.. .:.: .:::::::::::::: CCDS33 SDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQH 800 810 820 830 840 850 860 870 880 890 900 910 pF1KB9 LLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGG :::::::::::: .:.::::..::::::::..::::::::::::::::::::::::.::: CCDS33 LLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQLRKTGG 860 870 880 890 900 910 920 930 940 950 960 970 pF1KB9 TKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQE-QQNVS ::::::.: :::.:.:.:::::::: ::::::::.::::..::...: ..: .. .:..: CCDS33 TKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSKVEQEIS 920 930 940 950 960 970 980 990 1000 1010 1020 1030 pF1KB9 KVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELE .: . . :.::: : :.:::: :::.:::::::::::::.:::: : .::... CCDS33 RVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVD 980 990 1000 1010 1020 1030 pF1KB9 KQ .. CCDS33 EE 1032 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:12:28 2016 done: Sun Nov 6 06:12:29 2016 Total Scan time: 5.470 Total Display time: 0.240 Function used was FASTA [36.3.4 Apr, 2011]