FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3581, 1081 aa 1>>>pF1KE3581 1081 - 1081 aa - 1081 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.8210+/-0.00112; mu= -4.2459+/- 0.067 mean_var=240.2177+/-54.395, 0's: 0 Z-trim(110.8): 17 B-trim: 698 in 1/52 Lambda= 0.082751 statistics sampled from 11892 (11901) to 11892 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.366), width: 16 Scan time: 5.540 The best scores are: opt bits E(32554) CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081) 7092 860.6 0 CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032) 2195 276.0 3.1e-73 CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077) 2195 276.0 3.2e-73 CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031) 1114 146.9 2.2e-34 CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034) 1114 146.9 2.2e-34 >>CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081 aa) initn: 7092 init1: 7092 opt: 7092 Z-score: 4587.6 bits: 860.6 E(32554): 0 Smith-Waterman score: 7092; 99.9% identity (99.9% similar) in 1081 aa overlap (1-1081:1-1081) 10 20 30 40 50 60 pF1KE3 MPRRKQQAPRRAAAYVSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MPRRKQQAPRRAAAYVSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 NSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 NSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 VYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 QSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 DDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 QKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 TPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 KGKPIVETPVTPTITTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVGVKKEVDKEKAV :::::::::::::::::::::::::::::::::::::::::::::::: ::::::::::: CCDS12 KGKPIVETPVTPTITTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVEVKKEVDKEKAV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 TDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 TPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNSEIVSPTKNQTLVSPPSSQTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNSEIVSPTKNQTLVSPPSSQTS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 PMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 DGGFRSQENSPSPPRDGCKDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DGGFRSQENSPSPPRDGCKDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 PLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRY 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 FYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 FYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 ENALSDISDMLKNLTESHTSKSSTPSSISEKSDIDGATLEEAEESTPAQKRKGRQSNWNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ENALSDISDMLKNLTESHTSKSSTPSSISEKSDIDGATLEEAEESTPAQKRKGRQSNWNP 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 QHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 QHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRT 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 GGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQ 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 TKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEK 1030 1040 1050 1060 1070 1080 pF1KE3 Q : CCDS12 Q >>CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032 aa) initn: 3369 init1: 928 opt: 2195 Z-score: 1428.4 bits: 276.0 E(32554): 3.1e-73 Smith-Waterman score: 3660; 56.0% identity (75.6% similar) in 1080 aa overlap (46-1081:1-1032) 20 30 40 50 60 70 pF1KE3 VSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSE :: :. . ::::::.. . .. CCDS12 MCNEETEIKEAQSYQNSPVSSATNQDAGYG 10 20 30 80 90 100 110 120 130 pF1KE3 SHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNLN : .::.::..: :...: ..:.: . : . .::: :.:::: :..:.: ::.: CCDS12 SPFSESSDQLAHFKGSSSREEKEDPQ--CPDSVSYPQDSLAQIKAVYANLFSESCWSSLA 40 50 60 70 80 140 150 160 pF1KE3 LNLHQP--------SSEKNNG--------------------------SSSSSSSSSSSCG :.:.. .:.:... ::.: ::..:. . CCDS12 LDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTSTSS 90 100 110 120 130 140 170 180 190 200 210 220 pF1KE3 SGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSA :...::::.:.::::::.:. .:::::::::::::::..:::::.:::::::::::::: CCDS12 SSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKDCSA 150 160 170 180 190 200 230 240 250 260 270 280 pF1KE3 AYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCG ::::::::::::::::::::::.. :... :::::::::::.:::::::::::::::::: CCDS12 AYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCMYCG 210 220 230 240 250 260 290 300 310 320 330 340 pF1KE3 HSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTP :::::::::::::::::::::::::::: :. .:..:.:.:.: .: : ::. .: . CCDS12 HSFESLQDLSVHMIKTKHYQKVPLKEPV-PAITKLVPSTKKRALQDLAPPCSPEPAGMAA 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE3 KATISDTNDALQKNSNPYITPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQEL ....:.. :: .:::.:::::::.::::::.:.:::::.::::::::::::::::.: CCDS12 EVALSESAKD-QKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQQL 330 340 350 360 370 380 410 420 430 440 450 pF1KE3 TAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTLLDEKVQSVPLAATTFTS-PSNT-- ::::::::::.:::.:: :::: .: :: ..::.::.:: :: : :... CCDS12 TAHMMVTGHFLKVTTSASKKGKQLVLDPV-------VEEKIQSIPLPPTTHTRLPASSIK 390 400 410 420 430 460 470 480 490 500 510 pF1KE3 --PASISPKLNVGVKKEVDKEKA-VTDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEES : : . . . ::: .::: :. . : :.. . :: . :. : :: :.::..: CCDS12 KQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFEPSTLYPYLREEDLDDS 440 450 460 470 480 490 520 530 540 550 560 570 pF1KE3 PKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKP :::::::::::::::..::.:::::.::::::::::::::::. .: : .. .:. ..: CCDS12 PKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGTVK-PLPAAVQSVQVQP 500 510 520 530 540 550 580 590 600 610 620 630 pF1KE3 MF-GNSEIVSPTKNQTLVSPPSSQTSPMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGK . :. . .: .....:. :.: : : :.: ::::::.::: :: ..... . :. . CCDS12 SYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEKVTGKV-NIKKEERPPEKE 560 570 580 590 600 610 640 650 660 670 680 690 pF1KE3 LSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGCKDGSPLAEPVENGKEL : .:. :: ..: . : : : . :...: : .:: . :: : CCDS12 KSSLAKAA-SPIAKENKDFPKTEEVSG---KPQKKGPEAETGKAKKEGPLDVHTPNGTEP 620 630 640 650 660 670 700 710 720 730 740 750 pF1KE3 VKPLASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMS .: ... .. .:: :: :: :.::::::::.:: ::::..:: :.:::..::.:.: CCDS12 LKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPVSPSLDPLAMLYKIS 680 690 700 710 720 730 760 770 780 790 800 810 pF1KE3 NSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTA ::. .: . . : :.:: .:::.:. :.::::::::.:. CCDS12 NSMLDKPVYPATP---VKQADAIDRYYYE-NSDQPIDLTKSKNK---------------- 740 750 760 770 820 830 840 850 860 870 pF1KE3 PATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESHTSKSSTPSSISEKSDI : .:: . ..: :::::.:: :::::.:::: : ::::::..::::: CCDS12 PLVSSVADSVA-----------SPLRESALMDISDMVKNLTGRLTPKSSTPSTVSEKSDA 780 790 800 810 820 880 890 900 910 920 930 pF1KE3 DGATLEEA-EESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERM ::...::: .: .:..::::::::::::::::::::::.:::.:.:::::::::.::::. CCDS12 DGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERV 830 840 850 860 870 880 940 950 960 970 980 990 pF1KE3 HISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYIS :::.:::::::::::::::::::::::::::::::::::::::::::::::.:: ::::: CCDS12 HISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYIS 890 900 910 920 930 940 1000 1010 1020 1030 1040 1050 pF1KE3 HLESHLGFRLRDLSKLSTEQINSQIAQTKSPSEKMV--TSSPEEDLGTSYQCKLCNRTFA :::.:::: :.::::: .::. : .: ..: . .. :::::...:::::::::: CCDS12 HLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFA 950 960 970 980 990 1000 1060 1070 1080 pF1KE3 SKHAVKLHLSKTHGKSPEDHLLYVSELEKQ :::::::::::::::::::::.::.::::: CCDS12 SKHAVKLHLSKTHGKSPEDHLIYVTELEKQ 1010 1020 1030 >>CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077 aa) initn: 3492 init1: 928 opt: 2195 Z-score: 1428.1 bits: 276.0 E(32554): 3.2e-73 Smith-Waterman score: 3792; 56.0% identity (75.5% similar) in 1126 aa overlap (1-1081:1-1077) 10 20 30 40 50 pF1KE3 MPRRKQQAPRRAAAYVSEE-LKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSY :::::::::::.:::: :: :::: . .: .. . . : . : .::: :. . :: CCDS77 MPRRKQQAPRRSAAYVPEEELKAAEIDEEHVEDDGLSLDIQES-EYMCNEETEIKEAQSY 10 20 30 40 50 60 70 80 90 100 110 pF1KE3 QNSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMK ::::.. . .. : .::.::..: :...: ..:.: . : . .::: :.: CCDS77 QNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQ--CPDSVSYPQDSLAQIK 60 70 80 90 100 110 120 130 140 pF1KE3 AVYNNFLSNSYWSNLNLNLHQP--------SSEKNNG----------------------- ::: :..:.: ::.: :.:.. .:.:... CCDS77 AVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPST 120 130 140 150 160 170 150 160 170 180 190 200 pF1KE3 ---SSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYG ::.: ::..:. .:...::::.:.::::::.:. .:::::::::::::::..:::: CCDS77 SCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYG 180 190 200 210 220 230 210 220 230 240 250 260 pF1KE3 SIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKPRKRSLLEM :.::::::::::::::::::::::::::::::::::::.. :... :::::::::::.:: CCDS77 SVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEM 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE3 EGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKIIPATRKKAS :::::::::::::::::::::::::::::::::::::::::::: :. .:..:.:.:.: CCDS77 EGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPV-PAITKLVPSTKKRAL 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE3 LELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASYAWHFEARKSQI .: : ::. .: . ....:.. :: .:::.:::::::.::::::.:.:::::.:: CCDS77 QDLAPPCSPEPAGMAAEVALSESAKD-QKAANPYVTPNNRYGYQNGASYTWQFEARKAQI 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE3 LKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTLLDEKVQSV ::::::::::::::.:::::::::::.:::.:: :::: .: :: ..::.::. CCDS77 LKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPV-------VEEKIQSI 420 430 440 450 460 450 460 470 480 490 pF1KE3 PLAATTFTS-PSNT----PASISPKLNVGVKKEVDKEKA-VTDEKPKQKDKPGEEEEKCD :: :: : :... : : . . . ::: .::: :. . : :.. . :: . CCDS77 PLPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFE 470 480 490 500 510 520 500 510 520 530 540 550 pF1KE3 ISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNM :. : :: :.::..::::::::::::::::..::.:::::.::::::::::::::::. CCDS77 PSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGT 530 540 550 560 570 580 560 570 580 590 600 610 pF1KE3 MKLSLGSSGKSTPLKPMF-GNSEIVSPTKNQTLVSPPSSQTSPMPKTNFHAMEELVKKVT .: : .. .:. ..: . :. . .: .....:. :.: : : :.: ::::::.::: CCDS77 VK-PLPAAVQSVQVQPSYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEKVT 590 600 610 620 630 640 620 630 640 650 660 670 pF1KE3 EKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGC :: ..... . :. . : .:. :: ..: . : : : . :...: CCDS77 GKV-NIKKEERPPEKEKSSLAKAA-SPIAKENKDFPKTEEVSG---KPQKKGPEAETGKA 650 660 670 680 690 700 680 690 700 710 720 730 pF1KE3 KDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAK : .:: . :: : .: ... .. .:: :: :: :.::::::::.:: ::::..: CCDS77 KKEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSK 710 720 730 740 750 760 740 750 760 770 780 790 pF1KE3 PSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSD : :.:::..::.:.:::. .: . . : :.:: .:::.:. :.::::::::.:. CCDS77 PVSPSLDPLAMLYKISNSMLDKPVYPATP---VKQADAIDRYYYE-NSDQPIDLTKSKNK 770 780 790 800 810 800 810 820 830 840 850 pF1KE3 KGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESH : .:: . ..: :::::.:: :::::.:::: CCDS77 ----------------PLVSSVADSVA-----------SPLRESALMDISDMVKNLTGRL 820 830 840 850 860 870 880 890 900 910 pF1KE3 TSKSSTPSSISEKSDIDGATLEEA-EESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQT : ::::::..::::: ::...::: .: .:..::::::::::::::::::::::.:::.: CCDS77 TPKSSTPSTVSEKSDADGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRET 860 870 880 890 900 910 920 930 940 950 960 970 pF1KE3 SEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFF .:::::::::.::::.:::.:::::::::::::::::::::::::::::::::::::::: CCDS77 TEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFF 920 930 940 950 960 970 980 990 1000 1010 1020 1030 pF1KE3 CNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQTKSPSEKMV--TSSPEE :::::::.:: ::::::::.:::: :.::::: .::. : .: ..: . .. :: CCDS77 CNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEE 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 DLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEKQ :::...:::::::::::::::::::::::::::::::.::.::::: CCDS77 DLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELEKQ 1040 1050 1060 1070 >>CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031 aa) initn: 2228 init1: 735 opt: 1114 Z-score: 730.9 bits: 146.9 E(32554): 2.2e-34 Smith-Waterman score: 2934; 48.6% identity (72.4% similar) in 1058 aa overlap (48-1081:55-1031) 20 30 40 50 60 70 pF1KE3 EELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSESH ::. ..: ::::::....: .. ..:: CCDS54 KEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ---KGCFSYQNSPGSHLSNQDAENESL 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE3 ISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNLNLN .:..::...:..: .. . : : . . . ...: ::: :.::.::::.:.:. CCDS54 LSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWSGLGLG 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE3 LHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLY .. .::. : .. ..:..:. :::::.:..:.::: :: . .:::::.:::: CCDS54 FKLSNSERRNCDTRNGSNKSD------FDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLY 150 160 170 180 190 200 210 220 230 240 250 pF1KE3 RQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKP :::::. :..:::::.:::..:::::::::::::::::::::.:::.. :. : .::: CCDS54 RQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKP 200 210 220 230 240 250 260 270 280 290 300 310 pF1KE3 RKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKII :::.. .:. :::::::::::.:: ::.:::::::::::::::::::::::: ...:.. CCDS54 RKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMV 260 270 280 290 300 310 320 330 340 350 360 370 pF1KE3 PATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASYAWH ..:.. .... : ::::: :. ..:. :::.: .. :::::.::::::.:. CCDS54 TPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----QKNANLQLSSNNRYGYQNGASYTWQ 320 330 340 350 360 380 390 400 410 420 430 pF1KE3 FEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTL ::: ::::::::::::::::::.::.::::::::.:::.:: :::: .: :.. CCDS54 FEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQS 370 380 390 400 410 420 440 450 460 470 480 490 pF1KE3 LDEKVQSVPLAATTFTSPSNTPASISPKLNVGVKKEVDKEK---AVTDEKP-KQKDKPGE :.: .: :: .::.. :: .. .::: ::. . ::: :..: CCDS54 LSEAPNSDSLAP----KPSSNSASDCTASTTELKKESKKERPEETSKDEKVVKSEDYEDP 430 440 450 460 470 480 500 510 520 530 540 550 pF1KE3 EEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAA .. : . ::.:: :.:::.. ::: :::::::::::.::::::::.:::..::::::: CCDS54 LQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAA 490 500 510 520 530 540 560 570 580 590 600 610 pF1KE3 YQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSPT-KNQTLVSPPSSQTSPMPKTNFHAME ::: . : : ... ..: . :. . ..: : . ::: :. . .:. . CCDS54 YQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPT-HLAPYTQ------- 550 560 570 580 590 620 630 640 650 660 670 pF1KE3 ELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSP ::: .: .: .:: :: :: ..: : : :. .::..: CCDS54 --VKKESEDK---DEAVKEC-GKESPHEEA--SSFSHSEGD----------SFRKSE--- 600 610 620 630 680 690 700 710 720 pF1KE3 SPPRDGCKDGSPLAEP---VENGKELVKPL----ASSLSGSTAIITDHPPEQPFVNPLSA .::. . .:: : ...:.: :: .:.::.. :. ..: : : .::::: CCDS54 TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLEPTSALSNGCAL-ANHAPALPCINPLSA 640 650 660 670 680 690 730 740 750 760 770 pF1KE3 LQSVMNIHLGKAAKP------SLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLD ::::.: :::::..: : :. . .::. : . .. .: ... : ....:. CCDS54 LQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKSNLNVMDKPVLS---PASTRSASVSR 700 710 720 730 740 750 780 790 800 810 820 830 pF1KE3 RYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSP ::... :.::::::::.:: : :..: . : :: : CCDS54 RYLFE-NSDQPIDLTKSKSKK-------------------------AESSQAQSCMS--P 760 770 780 840 850 860 870 880 890 pF1KE3 LRENALSDISDMLKNLTESHTSKSSTPSSISE-KSDIDGATLEE-AEESTPAQKRKGRQS ...:::::.::.: : .. : : .. : . : ..: .:. . : . .::::::: CCDS54 PQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQS 790 800 810 820 830 840 900 910 920 930 940 950 pF1KE3 NWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQ :::::::::::::::.:: :::::::..:::.:::::.::.::::::::::::::::::: CCDS54 NWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQ 850 860 870 880 890 900 960 970 980 990 1000 1010 pF1KE3 LRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQ--- ::.:::::::::.: :::.:.:.:::::.::::::::::::::::...:...::..: CCDS54 LRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSK 910 920 930 940 950 960 1020 1030 1040 1050 1060 1070 pF1KE3 INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLL ....:....: ... : . ::: ....:::: :::.:::::::::::::.:::: : CCDS54 VEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQ 970 980 990 1000 1010 1020 1080 pF1KE3 YVSELEKQ .:...... CCDS54 FVTDVDEE 1030 >>CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034 aa) initn: 2320 init1: 735 opt: 1114 Z-score: 730.9 bits: 146.9 E(32554): 2.2e-34 Smith-Waterman score: 3011; 47.9% identity (71.7% similar) in 1115 aa overlap (1-1081:1-1034) 10 20 30 40 50 pF1KE3 MPRRKQQAPRRAAAYVSEE-LKAAALVDEGLDPEEHTADGE-PSAKYMCPEKELA----- :::::::::.:::.:..:: :: . : . :. . .. ... ..:: CCDS33 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 RACPSYQNSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSD ..: ::::::....: .. ..:: .:..::...:..: .. . : : . . . CCDS33 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 SLEQMKAVYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMA ...: ::: :.::.::::.:.:... .::. : .. ..:..:. :::::.:.. CCDS33 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSD------FDWHQDALS 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 KTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHM :.::: :: . .:::::.:::::::::. :..:::::.:::..::::::::::::::: CCDS33 KSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHM 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 NETGHYRDDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVH ::::::.:::.. :. : .::::::.. .:. :::::::::::.:: ::.:::::::: CCDS33 NETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVH 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 MIKTKHYQKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQ :::::::::::::::: ...:.. ..:.. .... : ::::: :. ..:. : CCDS33 MIKTKHYQKVPLKEPVPTISSKMVTPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----Q 300 310 320 330 340 360 370 380 390 400 410 pF1KE3 KNSNPYITPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIK ::.: .. :::::.::::::.:.::: ::::::::::::::::::.::.::::::::.: CCDS33 KNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLK 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE3 VTNSAMKKGKPIVETPVTPTITTLLDEKVQSV---PLAATTFTSPSNTPASISPKLNVGV ::.:: :::: .: : : ::.::. : . . .::.. :: .. . CCDS33 VTSSASKKGKQLVLDP-------LAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTEL 410 420 430 440 450 460 480 490 500 510 520 pF1KE3 KKEVDKEK---AVTDEKP-KQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSL ::: ::. . ::: :..: .. : . ::.:: :.:::.. ::: :::::: CCDS33 KKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSL 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE3 ENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSP :::::.::::::::.:::..:::::::::: . : : ... ..: . :. . ..: CCDS33 ENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAP 530 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 T-KNQTLVSPPSSQTSPMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPS : . ::: :. . .:. . ::: .: .: .:: :: :: ..: : CCDS33 KWKVMPLVSMPT-HLAPYTQ---------VKKESEDK---DEAVKEC-GKESPHEEA--S 590 600 610 620 650 660 670 680 690 pF1KE3 PCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGCKDGSPLAEP---VENGKELVKPL--- : :. .::..: .::. . .:: : ...:.: :: CCDS33 SFSHSEGD----------SFRKSE---TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLE 630 640 650 660 670 700 710 720 730 740 750 pF1KE3 -ASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAKP------SLPALDPMSMLF .:.::.. :. ..: : : .:::::::::.: :::::..: : :. . .::. CCDS33 PTSALSNGCAL-ANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFH 680 690 700 710 720 730 760 770 780 790 800 810 pF1KE3 KMSNSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPT : . .. .: ... : ....:. ::... :.::::::::.:: : CCDS33 KSNLNVMDKPVLS---PASTRSASVSRRYLFE-NSDQPIDLTKSKSKK------------ 740 750 760 770 820 830 840 850 860 870 pF1KE3 STAPATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESHTSKSSTPSSISE- :..: . : :: : ...:::::.::.: : .. : : .. : . CCDS33 -------------AESSQAQSCMS--PPQKHALSDIADMVKVLPKATTPKPASSSRVPPM 780 790 800 810 880 890 900 910 920 pF1KE3 KSDIDGATLEE-AEESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSP : ..: .:. . : . .::::::::::::::::::::::.:: :::::::..:::.: CCDS33 KLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGP 820 830 840 850 860 870 930 940 950 960 970 980 pF1KE3 QERMHISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPS ::::.::.:::::::::::::::::::::.:::::::::.: :::.:.:.:::::.:::: CCDS33 QERMQISKFTGLSMTTISHWLANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPS 880 890 900 910 920 930 990 1000 1010 1020 1030 1040 pF1KE3 TYISHLESHLGFRLRDLSKLSTEQ---INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLC ::::::::::::...:...::..: ....:....: ... : . ::: ....:::: CCDS33 TYISHLESHLGFQMKDMTRLSVDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLC 940 950 960 970 980 990 1050 1060 1070 1080 pF1KE3 NRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEKQ :::.:::::::::::::.:::: : .:...... CCDS33 CRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVDEE 1000 1010 1020 1030 1081 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 23:43:19 2016 done: Sun Nov 6 23:43:20 2016 Total Scan time: 5.540 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]