FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3349, 1034 aa 1>>>pF1KE3349 1034 - 1034 aa - 1034 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.4729+/-0.00101; mu= -2.7340+/- 0.060 mean_var=212.0128+/-47.436, 0's: 0 Z-trim(110.9): 23 B-trim: 687 in 1/51 Lambda= 0.088083 statistics sampled from 11971 (11982) to 11971 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.368), width: 16 Scan time: 5.350 The best scores are: opt bits E(32554) CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034) 6869 886.3 0 CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031) 6780 875.0 0 CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032) 1972 264.0 1.2e-69 CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077) 1972 264.0 1.2e-69 CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081) 1114 155.0 8.1e-37 >>CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034 aa) initn: 6869 init1: 6869 opt: 6869 Z-score: 4727.3 bits: 886.3 E(32554): 0 Smith-Waterman score: 6869; 100.0% identity (100.0% similar) in 1034 aa overlap (1-1034:1-1034) 10 20 30 40 50 60 pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS 970 980 990 1000 1010 1020 1030 pF1KE3 PEHHSQFVTDVDEE :::::::::::::: CCDS33 PEHHSQFVTDVDEE 1030 >>CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031 aa) initn: 6780 init1: 6780 opt: 6780 Z-score: 4666.1 bits: 875.0 E(32554): 0 Smith-Waterman score: 6780; 100.0% identity (100.0% similar) in 1021 aa overlap (14-1034:11-1031) 10 20 30 40 50 60 pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ ::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MMAAALLHYTGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE3 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE3 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE3 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE3 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE3 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK 420 430 440 450 460 470 490 500 510 520 530 540 pF1KE3 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA 480 490 500 510 520 530 550 560 570 580 590 600 pF1KE3 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE3 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE 600 610 620 630 640 650 670 680 690 700 710 720 pF1KE3 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS 660 670 680 690 700 710 730 740 750 760 770 780 pF1KE3 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA 720 730 740 750 760 770 790 800 810 820 830 840 pF1KE3 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK 780 790 800 810 820 830 850 860 870 880 890 900 pF1KE3 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL 840 850 860 870 880 890 910 920 930 940 950 960 pF1KE3 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KE3 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS 960 970 980 990 1000 1010 1030 pF1KE3 PEHHSQFVTDVDEE :::::::::::::: CCDS54 PEHHSQFVTDVDEE 1020 1030 >>CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032 aa) initn: 2613 init1: 762 opt: 1972 Z-score: 1364.1 bits: 264.0 E(32554): 1.2e-69 Smith-Waterman score: 3203; 51.6% identity (72.3% similar) in 1052 aa overlap (51-1034:3-1032) 30 40 50 60 70 80 pF1KE3 LKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQKGCFSYQNSPGSHLSNQDAE .:: : : :::::: : .:::: CCDS12 MCNEETEIKEAQ----SYQNSPVSSATNQDAG 10 20 90 100 110 120 130 pF1KE3 NESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWS : .:..:::.. .:. .:. . : . : :... . .. :::::..:.: :: CCDS12 YGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS---LAQIKAVYANLFSESCWS 30 40 50 60 70 80 140 150 pF1KE3 GLGLGFKLSNSERRNCD----------------------------------------TRN .:.: .: :.: . : : . CCDS12 SLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTS 90 100 110 120 130 140 160 170 180 190 200 210 pF1KE3 GSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQ :..: .:::: ::.:.:::. . .:::::.::::::..:. :.::::::.:::.. CCDS12 TSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKD 150 160 170 180 190 200 220 230 240 250 260 270 pF1KE3 CSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCM :::::::::::::::::::::.:::: ::. . .::::::....:. ::::::::::: CCDS12 CSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCM 210 220 230 240 250 260 280 290 300 310 320 330 pF1KE3 FCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVTPAKKRVF-DVNRPCSPD--- .:: ::.:::::::::::::::::::::::::.:. :.: .:::.. :. ::::. CCDS12 YCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVPSTKKRALQDLAPPCSPEPAG 270 280 290 300 310 320 340 350 360 370 380 390 pF1KE3 -STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQ .. ....: ..:: :: .. :::::::::::::::::: :.:::::::::::::::: CCDS12 MAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQ 330 340 350 360 370 380 400 410 420 430 440 450 pF1KE3 QLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDC :::.::::::::::::.:::::::::::::.. ::.::. :.. . : : .. : CCDS12 QLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDS 390 400 410 420 430 440 460 470 480 490 500 510 pF1KE3 TA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSK : .:.: ::: .::.: .. ::. .:. :: :.: ..:. : :::::::.:. : CCDS12 PAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK-FEPSTLYPYLREEDLDDSPK 450 460 470 480 490 500 520 530 540 550 560 570 pF1KE3 GGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNL :: ::::::::::.:::.:::::::::..:::::::::: :: ::: . : .:..:. CCDS12 GGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP-GTVKPLPAAVQSVQVQPSY 510 520 530 540 550 560 580 590 600 610 620 pF1KE3 TNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAVKECGK-------ESPHEEAS .. .. .. . :. : :.: . .. : .. . : :: . :..: : CCDS12 AGGVKSLSSAEH-NALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKS 570 580 590 600 610 630 640 650 660 670 pF1KE3 SFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLMKEGS-EKEKPQPLEPTSA-L :.... :. .: :.: .: . :: : : ::: . . :. :: .: . CCDS12 SLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKV 620 630 640 650 660 670 680 690 700 710 720 730 pF1KE3 SNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKS .::: . .:.: :::::::::..:.::::...:. ::: . ..:..: CCDS12 TNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPV------SPSLDPLAMLYKI 680 690 700 710 720 730 740 750 760 770 780 790 pF1KE3 NLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQAQSCMSPPQKHAL . ...:::: . ...:.. :: .:::::::::::::.: :: :.: :: .. :: CCDS12 SNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESAL 740 750 760 770 780 790 800 810 820 830 840 850 pF1KE3 SDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQH ::.:::: : ::: .. : : : . : ::.. .:.: .:::::::::::::: CCDS12 MDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEALDELSPVHKRKGRQSNWNPQH 800 810 820 830 840 850 860 870 880 890 900 910 pF1KE3 LLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQLRKTGG :::::::::::: .:.::::..::::::::..::::::::::::::::::::::::.::: CCDS12 LLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGG 860 870 880 890 900 910 920 930 940 950 960 970 pF1KE3 TKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSKVEQEIS ::::::.: :::.:.:.:::::::: ::::::::.::::..::...: ..: .. .:..: CCDS12 TKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQE-QQNVS 920 930 940 950 960 970 980 990 1000 1010 1020 1030 pF1KE3 RVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVD .: . . :.::: : :.:::: :::.:::::::::::::.:::: : .::... CCDS12 KVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELE 980 990 1000 1010 1020 1030 pF1KE3 EE .. CCDS12 KQ >>CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077 aa) initn: 2723 init1: 762 opt: 1972 Z-score: 1363.8 bits: 264.0 E(32554): 1.2e-69 Smith-Waterman score: 3244; 51.0% identity (71.9% similar) in 1090 aa overlap (13-1034:13-1077) 10 20 30 40 50 60 pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ :.:. ::.:: : .::. ::.: ..: .. .:: : : CCDS77 MPRRKQQAPRRSAAYVPEEELKAAE--IDEEHVEDDGLSLDIQE-SEYMCNEETEIKEAQ 10 20 30 40 50 70 80 90 100 110 pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAH :::::: : .:::: : .:..:::.. .:. .:. . : . : :... CCDS77 ----SYQNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS- 60 70 80 90 100 110 120 130 140 150 pF1KE3 NCMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCD----------------------- . .. :::::..:.: ::.:.: .: :.: . : CCDS77 --LAQIKAVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGP 120 130 140 150 160 170 160 170 180 190 pF1KE3 -----------------TRNGSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYR : . :..: .:::: ::.:.:::. . .:::::.::::: CCDS77 TTSTPSTSCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYR 180 190 200 210 220 230 200 210 220 230 240 250 pF1KE3 QSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPR :..:. :.::::::.:::..:::::::::::::::::::::.:::: ::. . .:::: CCDS77 QNNKLYGSVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPR 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE3 KRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVT ::....:. :::::::::::.:: ::.:::::::::::::::::::::::::.:. :.: CCDS77 KRSLMEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVP 300 310 320 330 340 320 330 340 350 360 370 pF1KE3 PAKKRVF-DVNRPCSPD----STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFE .:::.. :. ::::. .. ....: ..:: :: .. ::::::::::::::::: CCDS77 STKKRALQDLAPPCSPEPAGMAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFE 350 360 370 380 390 400 380 390 400 410 420 430 pF1KE3 ACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLS : :.:::::::::::::::::::.::::::::::::.:::::::::::::.. ::.::. CCDS77 ARKAQILKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIP 410 420 430 440 450 460 440 450 460 470 480 490 pF1KE3 EAPNSDSLAPKPSSNSASDCTA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKP :.. . : : .. : : .:.: ::: .::.: .. ::. .:. :: :.: CCDS77 LPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK- 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE3 LDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLS ..:. : :::::::.:. ::: ::::::::::.:::.:::::::::..:::::::::: CCDS77 FEPSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE3 EGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAV :: ::: . : .:..:. .. .. .. . :. : :.: . .. : .. . CCDS77 -GTVKPLPAAVQSVQVQPSYAGGVKSLSSA-EHNALLHSPGSLTPPPHKSNVSAMEELVE 590 600 610 620 630 640 620 630 640 650 pF1KE3 KECGK-------ESPHEEASSFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLM : :: . :..: ::.... :. .: :.: .: . :: : : CCDS77 KVTGKVNIKKEERPPEKEKSSLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAK 650 660 670 680 690 700 660 670 680 690 700 710 pF1KE3 KEGS-EKEKPQPLEPTSA-LSNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEP ::: . . :. :: .: ..::: . .:.: :::::::::..:.::::...: CCDS77 KEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKP 710 720 730 740 750 760 720 730 740 750 760 770 pF1KE3 LRSPSCSSPSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKS . ::: . ..:..: . ...:::: . ...:.. :: .:::::::::::::. CCDS77 V------SPSLDPLAMLYKISNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKN 770 780 790 800 810 780 790 800 810 820 830 pF1KE3 KKAESSQAQSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVS : :: :.: :: .. :: ::.:::: : ::: .. : : : . : ::.. CCDS77 KPLVSSVADSVASPLRESALMDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEAL 820 830 840 850 860 870 840 850 860 870 880 890 pF1KE3 SEVSTLHKRKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLS .:.: .:::::::::::::::::::::::::: .:.::::..::::::::..:::::::: CCDS77 DELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLS 880 890 900 910 920 930 900 910 920 930 940 950 pF1KE3 MTTISHWLANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQ ::::::::::::::::.:::::::::.: :::.:.:.:::::::: ::::::::.::::. CCDS77 MTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFS 940 950 960 970 980 990 960 970 980 990 1000 1010 pF1KE3 MKDMTRLSVDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLH .::...: ..: .. .:..:.: . . :.::: : :.:::: :::.:::::::: CCDS77 LKDLSKLPLNQIQE-QQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLH 1000 1010 1020 1030 1040 1050 1020 1030 pF1KE3 LSKTHSKSPEHHSQFVTDVDEE :::::.:::: : .::..... CCDS77 LSKTHGKSPEDHLIYVTELEKQ 1060 1070 >>CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081 aa) initn: 2329 init1: 735 opt: 1114 Z-score: 774.5 bits: 155.0 E(32554): 8.1e-37 Smith-Waterman score: 2943; 48.8% identity (72.8% similar) in 1061 aa overlap (58-1034:48-1081) 30 40 50 60 70 80 pF1KE3 KEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ---KGCFSYQNSPGSHLSNQDAENESL ::. ..: ::::::....: .. ..:: CCDS12 EELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSESH 20 30 40 50 60 70 90 100 110 120 130 140 pF1KE3 LSDASDQVSDIKSVCGRDASDKKAHTHVRLPNE---AHNCMDKMTAVYANILSDSYWSGL .:..::...:..: .. . : .: .: : . . ...: ::: :.::.::::.: CCDS12 ISETSDRMADFESGSIKNEEETK---EVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNL 80 90 100 110 120 130 150 160 170 180 190 pF1KE3 GLGFKLSNSERRNCDTRNGSNKSD------FDWHQDALSKSLQQNLPSRSVSKPSLFSSV .:... .::. : .. ..:..:. :::::.:..:.::: :: . .:::::.: CCDS12 NLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTV 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE3 QLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSY ::::::::. :..:::::.:::..:::::::::::::::::::::.:::.. :. : . CCDS12 QLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRW 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE3 SKPRKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISS ::::::.. .:. :::::::::::.:: ::.:::::::::::::::::::::::: ... CCDS12 SKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAA 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 KMVTPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----QKNANLQLSSNNRYGYQNGASY :.. ..:.. .... : ::::: :. ..:. :::.: .. :::::.:::::: CCDS12 KIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASY 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE3 TWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEK .:.::: ::::::::::::::::::.::.::::::::.:::.:: :::: .: :.. CCDS12 AWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTI 380 390 400 410 420 430 430 440 450 460 470 480 pF1KE3 MQSLSEAPNSDSLAP----KPSSNSASDCTASTTELKKESKKERPEETSKDEKVVKSEDY :.: .: :: .::.. :: ..:.::: ::. . ::: :..: CCDS12 TTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVEVKKEVDKEK---AVTDEKP-KQKDK 440 450 460 470 480 490 490 500 510 520 530 540 pF1KE3 EDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSI .. : . ::.:: :.:::.. ::: :::::::::::.::::::::.:::..:::: CCDS12 PGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSI 500 510 520 530 540 550 550 560 570 580 590 pF1KE3 HAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPT-HLAPYTQ---- :::::: . : : ... ..: . :. . ..: : . ::: :. . .:. . CCDS12 HAAYQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSPT-KNQTLVSPPSSQTSPMPKTNFH 560 570 580 590 600 600 610 620 630 pF1KE3 -----VKKESEDK---DEAVKEC-GKESPHEEAS-SFSHSE-GD----------SFRKSE ::: .: .: .:: :: :: ..:. : :: :. .::..: CCDS12 AMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQE 610 620 630 640 650 660 640 650 660 670 680 690 pF1KE3 ---TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLEPTSALSNGCAL-ANHAPALPCINP .::. . .:: : ...:.: :: .:.::.. :. ..: : : .:: CCDS12 NSPSPPRDGCKDGSPLAEP---VENGKELVKPL----ASSLSGSTAIITDHPPEQPFVNP 670 680 690 700 710 720 700 710 720 730 740 750 pF1KE3 LSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKSNLNVMDKPVLS---PASTRSAS :::::::.: :::::..: : :. . .::. : . .. .: ... : ....:. CCDS12 LSALQSVMNIHLGKAAKP------SLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKAD 730 740 750 760 770 760 770 780 pF1KE3 VSRRYLFE-NSDQPIDLTKSKSKK-------------------------AESSQAQSCMS ::... :.::::::::.:: : :..: . : :: CCDS12 HLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMS 780 790 800 810 820 830 790 800 810 820 830 840 pF1KE3 --PPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKG : ...:::::.::.: : .. : : .. : . : ..: .:. . : . .:::: CCDS12 NSPLRENALSDISDMLKNLTESHTSKSSTPSSISE-KSDIDGATLEE-AEESTPAQKRKG 840 850 860 870 880 890 850 860 870 880 890 900 pF1KE3 RQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANV ::::::::::::::::::.:: :::::::..:::.:::::.::.:::::::::::::::: CCDS12 RQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANV 900 910 920 930 940 950 910 920 930 940 950 960 pF1KE3 KYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQ :::::.:::::::::.: :::.:.:.:::::.::::::::::::::::...:...::..: CCDS12 KYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQ 960 970 980 990 1000 1010 970 980 990 1000 1010 1020 pF1KE3 QSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEH ....:....: ... : . ::: ....:::: :::.:::::::::::::.:::: CCDS12 ---INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPED 1020 1030 1040 1050 1060 1070 1030 pF1KE3 HSQFVTDVDEE : .:...... CCDS12 HLLYVSELEKQ 1080 1034 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 04:43:16 2016 done: Tue Nov 8 04:43:17 2016 Total Scan time: 5.350 Total Display time: 0.250 Function used was FASTA [36.3.4 Apr, 2011]