FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3581, 1081 aa
1>>>pF1KE3581 1081 - 1081 aa - 1081 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.8210+/-0.00112; mu= -4.2459+/- 0.067
mean_var=240.2177+/-54.395, 0's: 0 Z-trim(110.8): 17 B-trim: 698 in 1/52
Lambda= 0.082751
statistics sampled from 11892 (11901) to 11892 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.366), width: 16
Scan time: 5.540
The best scores are: opt bits E(32554)
CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081) 7092 860.6 0
CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032) 2195 276.0 3.1e-73
CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077) 2195 276.0 3.2e-73
CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031) 1114 146.9 2.2e-34
CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034) 1114 146.9 2.2e-34
>>CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081 aa)
initn: 7092 init1: 7092 opt: 7092 Z-score: 4587.6 bits: 860.6 E(32554): 0
Smith-Waterman score: 7092; 99.9% identity (99.9% similar) in 1081 aa overlap (1-1081:1-1081)
10 20 30 40 50 60
pF1KE3 MPRRKQQAPRRAAAYVSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MPRRKQQAPRRAAAYVSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 NSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 NSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 VYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 QSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 DDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 QKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 TPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 KGKPIVETPVTPTITTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVGVKKEVDKEKAV
:::::::::::::::::::::::::::::::::::::::::::::::: :::::::::::
CCDS12 KGKPIVETPVTPTITTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVEVKKEVDKEKAV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 TDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 TPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNSEIVSPTKNQTLVSPPSSQTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNSEIVSPTKNQTLVSPPSSQTS
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 PMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 DGGFRSQENSPSPPRDGCKDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DGGFRSQENSPSPPRDGCKDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 PLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRY
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 FYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLR
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 ENALSDISDMLKNLTESHTSKSSTPSSISEKSDIDGATLEEAEESTPAQKRKGRQSNWNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ENALSDISDMLKNLTESHTSKSSTPSSISEKSDIDGATLEEAEESTPAQKRKGRQSNWNP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 QHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRT
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 GGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 TKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEK
1030 1040 1050 1060 1070 1080
pF1KE3 Q
:
CCDS12 Q
>>CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032 aa)
initn: 3369 init1: 928 opt: 2195 Z-score: 1428.4 bits: 276.0 E(32554): 3.1e-73
Smith-Waterman score: 3660; 56.0% identity (75.6% similar) in 1080 aa overlap (46-1081:1-1032)
20 30 40 50 60 70
pF1KE3 VSEELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSE
:: :. . ::::::.. . ..
CCDS12 MCNEETEIKEAQSYQNSPVSSATNQDAGYG
10 20 30
80 90 100 110 120 130
pF1KE3 SHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNLN
: .::.::..: :...: ..:.: . : . .::: :.:::: :..:.: ::.:
CCDS12 SPFSESSDQLAHFKGSSSREEKEDPQ--CPDSVSYPQDSLAQIKAVYANLFSESCWSSLA
40 50 60 70 80
140 150 160
pF1KE3 LNLHQP--------SSEKNNG--------------------------SSSSSSSSSSSCG
:.:.. .:.:... ::.: ::..:. .
CCDS12 LDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTSTSS
90 100 110 120 130 140
170 180 190 200 210 220
pF1KE3 SGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSA
:...::::.:.::::::.:. .:::::::::::::::..:::::.::::::::::::::
CCDS12 SSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKDCSA
150 160 170 180 190 200
230 240 250 260 270 280
pF1KE3 AYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCG
::::::::::::::::::::::.. :... :::::::::::.::::::::::::::::::
CCDS12 AYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCMYCG
210 220 230 240 250 260
290 300 310 320 330 340
pF1KE3 HSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTP
:::::::::::::::::::::::::::: :. .:..:.:.:.: .: : ::. .: .
CCDS12 HSFESLQDLSVHMIKTKHYQKVPLKEPV-PAITKLVPSTKKRALQDLAPPCSPEPAGMAA
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE3 KATISDTNDALQKNSNPYITPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQEL
....:.. :: .:::.:::::::.::::::.:.:::::.::::::::::::::::.:
CCDS12 EVALSESAKD-QKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQQL
330 340 350 360 370 380
410 420 430 440 450
pF1KE3 TAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTLLDEKVQSVPLAATTFTS-PSNT--
::::::::::.:::.:: :::: .: :: ..::.::.:: :: : :...
CCDS12 TAHMMVTGHFLKVTTSASKKGKQLVLDPV-------VEEKIQSIPLPPTTHTRLPASSIK
390 400 410 420 430
460 470 480 490 500 510
pF1KE3 --PASISPKLNVGVKKEVDKEKA-VTDEKPKQKDKPGEEEEKCDISSKYHYLTENDLEES
: : . . . ::: .::: :. . : :.. . :: . :. : :: :.::..:
CCDS12 KQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFEPSTLYPYLREEDLDDS
440 450 460 470 480 490
520 530 540 550 560 570
pF1KE3 PKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKP
:::::::::::::::..::.:::::.::::::::::::::::. .: : .. .:. ..:
CCDS12 PKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGTVK-PLPAAVQSVQVQP
500 510 520 530 540 550
580 590 600 610 620 630
pF1KE3 MF-GNSEIVSPTKNQTLVSPPSSQTSPMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGK
. :. . .: .....:. :.: : : :.: ::::::.::: :: ..... . :. .
CCDS12 SYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEKVTGKV-NIKKEERPPEKE
560 570 580 590 600 610
640 650 660 670 680 690
pF1KE3 LSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGCKDGSPLAEPVENGKEL
: .:. :: ..: . : : : . :...: : .:: . :: :
CCDS12 KSSLAKAA-SPIAKENKDFPKTEEVSG---KPQKKGPEAETGKAKKEGPLDVHTPNGTEP
620 630 640 650 660 670
700 710 720 730 740 750
pF1KE3 VKPLASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAKPSLPALDPMSMLFKMS
.: ... .. .:: :: :: :.::::::::.:: ::::..:: :.:::..::.:.:
CCDS12 LKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPVSPSLDPLAMLYKIS
680 690 700 710 720 730
760 770 780 790 800 810
pF1KE3 NSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTA
::. .: . . : :.:: .:::.:. :.::::::::.:.
CCDS12 NSMLDKPVYPATP---VKQADAIDRYYYE-NSDQPIDLTKSKNK----------------
740 750 760 770
820 830 840 850 860 870
pF1KE3 PATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESHTSKSSTPSSISEKSDI
: .:: . ..: :::::.:: :::::.:::: : ::::::..:::::
CCDS12 PLVSSVADSVA-----------SPLRESALMDISDMVKNLTGRLTPKSSTPSTVSEKSDA
780 790 800 810 820
880 890 900 910 920 930
pF1KE3 DGATLEEA-EESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERM
::...::: .: .:..::::::::::::::::::::::.:::.:.:::::::::.::::.
CCDS12 DGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERV
830 840 850 860 870 880
940 950 960 970 980 990
pF1KE3 HISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYIS
:::.:::::::::::::::::::::::::::::::::::::::::::::::.:: :::::
CCDS12 HISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYIS
890 900 910 920 930 940
1000 1010 1020 1030 1040 1050
pF1KE3 HLESHLGFRLRDLSKLSTEQINSQIAQTKSPSEKMV--TSSPEEDLGTSYQCKLCNRTFA
:::.:::: :.::::: .::. : .: ..: . .. :::::...::::::::::
CCDS12 HLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFA
950 960 970 980 990 1000
1060 1070 1080
pF1KE3 SKHAVKLHLSKTHGKSPEDHLLYVSELEKQ
:::::::::::::::::::::.::.:::::
CCDS12 SKHAVKLHLSKTHGKSPEDHLIYVTELEKQ
1010 1020 1030
>>CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077 aa)
initn: 3492 init1: 928 opt: 2195 Z-score: 1428.1 bits: 276.0 E(32554): 3.2e-73
Smith-Waterman score: 3792; 56.0% identity (75.5% similar) in 1126 aa overlap (1-1081:1-1077)
10 20 30 40 50
pF1KE3 MPRRKQQAPRRAAAYVSEE-LKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSY
:::::::::::.:::: :: :::: . .: .. . . : . : .::: :. . ::
CCDS77 MPRRKQQAPRRSAAYVPEEELKAAEIDEEHVEDDGLSLDIQES-EYMCNEETEIKEAQSY
10 20 30 40 50
60 70 80 90 100 110
pF1KE3 QNSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMK
::::.. . .. : .::.::..: :...: ..:.: . : . .::: :.:
CCDS77 QNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQ--CPDSVSYPQDSLAQIK
60 70 80 90 100 110
120 130 140
pF1KE3 AVYNNFLSNSYWSNLNLNLHQP--------SSEKNNG-----------------------
::: :..:.: ::.: :.:.. .:.:...
CCDS77 AVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPST
120 130 140 150 160 170
150 160 170 180 190 200
pF1KE3 ---SSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYG
::.: ::..:. .:...::::.:.::::::.:. .:::::::::::::::..::::
CCDS77 SCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYG
180 190 200 210 220 230
210 220 230 240 250 260
pF1KE3 SIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKPRKRSLLEM
:.::::::::::::::::::::::::::::::::::::.. :... :::::::::::.::
CCDS77 SVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEM
240 250 260 270 280 290
270 280 290 300 310 320
pF1KE3 EGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKIIPATRKKAS
:::::::::::::::::::::::::::::::::::::::::::: :. .:..:.:.:.:
CCDS77 EGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPV-PAITKLVPSTKKRAL
300 310 320 330 340 350
330 340 350 360 370 380
pF1KE3 LELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASYAWHFEARKSQI
.: : ::. .: . ....:.. :: .:::.:::::::.::::::.:.:::::.::
CCDS77 QDLAPPCSPEPAGMAAEVALSESAKD-QKAANPYVTPNNRYGYQNGASYTWQFEARKAQI
360 370 380 390 400 410
390 400 410 420 430 440
pF1KE3 LKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTLLDEKVQSV
::::::::::::::.:::::::::::.:::.:: :::: .: :: ..::.::.
CCDS77 LKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPV-------VEEKIQSI
420 430 440 450 460
450 460 470 480 490
pF1KE3 PLAATTFTS-PSNT----PASISPKLNVGVKKEVDKEKA-VTDEKPKQKDKPGEEEEKCD
:: :: : :... : : . . . ::: .::: :. . : :.. . :: .
CCDS77 PLPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKIKEESEDSLEKFE
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE3 ISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNM
:. : :: :.::..::::::::::::::::..::.:::::.::::::::::::::::.
CCDS77 PSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLPGT
530 540 550 560 570 580
560 570 580 590 600 610
pF1KE3 MKLSLGSSGKSTPLKPMF-GNSEIVSPTKNQTLVSPPSSQTSPMPKTNFHAMEELVKKVT
.: : .. .:. ..: . :. . .: .....:. :.: : : :.: ::::::.:::
CCDS77 VK-PLPAAVQSVQVQPSYAGGVKSLSSAEHNALLHSPGSLTPPPHKSNVSAMEELVEKVT
590 600 610 620 630 640
620 630 640 650 660 670
pF1KE3 EKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGC
:: ..... . :. . : .:. :: ..: . : : : . :...:
CCDS77 GKV-NIKKEERPPEKEKSSLAKAA-SPIAKENKDFPKTEEVSG---KPQKKGPEAETGKA
650 660 670 680 690 700
680 690 700 710 720 730
pF1KE3 KDGSPLAEPVENGKELVKPLASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAK
: .:: . :: : .: ... .. .:: :: :: :.::::::::.:: ::::..:
CCDS77 KKEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSK
710 720 730 740 750 760
740 750 760 770 780 790
pF1KE3 PSLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSD
: :.:::..::.:.:::. .: . . : :.:: .:::.:. :.::::::::.:.
CCDS77 PVSPSLDPLAMLYKISNSMLDKPVYPATP---VKQADAIDRYYYE-NSDQPIDLTKSKNK
770 780 790 800 810
800 810 820 830 840 850
pF1KE3 KGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESH
: .:: . ..: :::::.:: :::::.::::
CCDS77 ----------------PLVSSVADSVA-----------SPLRESALMDISDMVKNLTGRL
820 830 840 850
860 870 880 890 900 910
pF1KE3 TSKSSTPSSISEKSDIDGATLEEA-EESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQT
: ::::::..::::: ::...::: .: .:..::::::::::::::::::::::.:::.:
CCDS77 TPKSSTPSTVSEKSDADGSSFEEALDELSPVHKRKGRQSNWNPQHLLILQAQFASSLRET
860 870 880 890 900 910
920 930 940 950 960 970
pF1KE3 SEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFF
.:::::::::.::::.:::.::::::::::::::::::::::::::::::::::::::::
CCDS77 TEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFF
920 930 940 950 960 970
980 990 1000 1010 1020 1030
pF1KE3 CNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQINSQIAQTKSPSEKMV--TSSPEE
:::::::.:: ::::::::.:::: :.::::: .::. : .: ..: . .. ::
CCDS77 CNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQEQQNVSKVLTNKTLGPLGATEE
980 990 1000 1010 1020 1030
1040 1050 1060 1070 1080
pF1KE3 DLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEKQ
:::...:::::::::::::::::::::::::::::::.::.:::::
CCDS77 DLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELEKQ
1040 1050 1060 1070
>>CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031 aa)
initn: 2228 init1: 735 opt: 1114 Z-score: 730.9 bits: 146.9 E(32554): 2.2e-34
Smith-Waterman score: 2934; 48.6% identity (72.4% similar) in 1058 aa overlap (48-1081:55-1031)
20 30 40 50 60 70
pF1KE3 EELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSESH
::. ..: ::::::....: .. ..::
CCDS54 KEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ---KGCFSYQNSPGSHLSNQDAENESL
30 40 50 60 70 80
80 90 100 110 120 130
pF1KE3 ISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNLNLN
.:..::...:..: .. . : : . . . ...: ::: :.::.::::.:.:.
CCDS54 LSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWSGLGLG
90 100 110 120 130 140
140 150 160 170 180 190
pF1KE3 LHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTVQLY
.. .::. : .. ..:..:. :::::.:..:.::: :: . .:::::.::::
CCDS54 FKLSNSERRNCDTRNGSNKSD------FDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLY
150 160 170 180 190
200 210 220 230 240 250
pF1KE3 RQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRWSKP
:::::. :..:::::.:::..:::::::::::::::::::::.:::.. :. : .:::
CCDS54 RQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKP
200 210 220 230 240 250
260 270 280 290 300 310
pF1KE3 RKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAAKII
:::.. .:. :::::::::::.:: ::.:::::::::::::::::::::::: ...:..
CCDS54 RKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMV
260 270 280 290 300 310
320 330 340 350 360 370
pF1KE3 PATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASYAWH
..:.. .... : ::::: :. ..:. :::.: .. :::::.::::::.:.
CCDS54 TPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----QKNANLQLSSNNRYGYQNGASYTWQ
320 330 340 350 360
380 390 400 410 420 430
pF1KE3 FEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTITTL
::: ::::::::::::::::::.::.::::::::.:::.:: :::: .: :..
CCDS54 FEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQS
370 380 390 400 410 420
440 450 460 470 480 490
pF1KE3 LDEKVQSVPLAATTFTSPSNTPASISPKLNVGVKKEVDKEK---AVTDEKP-KQKDKPGE
:.: .: :: .::.. :: .. .::: ::. . ::: :..:
CCDS54 LSEAPNSDSLAP----KPSSNSASDCTASTTELKKESKKERPEETSKDEKVVKSEDYEDP
430 440 450 460 470 480
500 510 520 530 540 550
pF1KE3 EEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSIHAA
.. : . ::.:: :.:::.. ::: :::::::::::.::::::::.:::..:::::::
CCDS54 LQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAA
490 500 510 520 530 540
560 570 580 590 600 610
pF1KE3 YQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSPT-KNQTLVSPPSSQTSPMPKTNFHAME
::: . : : ... ..: . :. . ..: : . ::: :. . .:. .
CCDS54 YQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPT-HLAPYTQ-------
550 560 570 580 590
620 630 640 650 660 670
pF1KE3 ELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQENSP
::: .: .: .:: :: :: ..: : : :. .::..:
CCDS54 --VKKESEDK---DEAVKEC-GKESPHEEA--SSFSHSEGD----------SFRKSE---
600 610 620 630
680 690 700 710 720
pF1KE3 SPPRDGCKDGSPLAEP---VENGKELVKPL----ASSLSGSTAIITDHPPEQPFVNPLSA
.::. . .:: : ...:.: :: .:.::.. :. ..: : : .:::::
CCDS54 TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLEPTSALSNGCAL-ANHAPALPCINPLSA
640 650 660 670 680 690
730 740 750 760 770
pF1KE3 LQSVMNIHLGKAAKP------SLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKADHLD
::::.: :::::..: : :. . .::. : . .. .: ... : ....:.
CCDS54 LQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKSNLNVMDKPVLS---PASTRSASVSR
700 710 720 730 740 750
780 790 800 810 820 830
pF1KE3 RYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMSNSP
::... :.::::::::.:: : :..: . : :: :
CCDS54 RYLFE-NSDQPIDLTKSKSKK-------------------------AESSQAQSCMS--P
760 770 780
840 850 860 870 880 890
pF1KE3 LRENALSDISDMLKNLTESHTSKSSTPSSISE-KSDIDGATLEE-AEESTPAQKRKGRQS
...:::::.::.: : .. : : .. : . : ..: .:. . : . .:::::::
CCDS54 PQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQS
790 800 810 820 830 840
900 910 920 930 940 950
pF1KE3 NWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANVKYQ
:::::::::::::::.:: :::::::..:::.:::::.::.:::::::::::::::::::
CCDS54 NWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQ
850 860 870 880 890 900
960 970 980 990 1000 1010
pF1KE3 LRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQ---
::.:::::::::.: :::.:.:.:::::.::::::::::::::::...:...::..:
CCDS54 LRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSK
910 920 930 940 950 960
1020 1030 1040 1050 1060 1070
pF1KE3 INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLL
....:....: ... : . ::: ....:::: :::.:::::::::::::.:::: :
CCDS54 VEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQ
970 980 990 1000 1010 1020
1080
pF1KE3 YVSELEKQ
.:......
CCDS54 FVTDVDEE
1030
>>CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034 aa)
initn: 2320 init1: 735 opt: 1114 Z-score: 730.9 bits: 146.9 E(32554): 2.2e-34
Smith-Waterman score: 3011; 47.9% identity (71.7% similar) in 1115 aa overlap (1-1081:1-1034)
10 20 30 40 50
pF1KE3 MPRRKQQAPRRAAAYVSEE-LKAAALVDEGLDPEEHTADGE-PSAKYMCPEKELA-----
:::::::::.:::.:..:: :: . : . :. . .. ... ..::
CCDS33 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 RACPSYQNSPAAEFSCHEMDSESHISETSDRMADFESGSIKNEEETKEVTVPLEDTTVSD
..: ::::::....: .. ..:: .:..::...:..: .. . : : . . .
CCDS33 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 SLEQMKAVYNNFLSNSYWSNLNLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMA
...: ::: :.::.::::.:.:... .::. : .. ..:..:. :::::.:..
CCDS33 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSD------FDWHQDALS
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 KTLQQVSQSRMLPEPSLFSTVQLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHM
:.::: :: . .:::::.:::::::::. :..:::::.:::..:::::::::::::::
CCDS33 KSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 NETGHYRDDNHETDNNNPKRWSKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVH
::::::.:::.. :. : .::::::.. .:. :::::::::::.:: ::.::::::::
CCDS33 NETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVH
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 MIKTKHYQKVPLKEPVTPVAAKIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQ
:::::::::::::::: ...:.. ..:.. .... : ::::: :. ..:. :
CCDS33 MIKTKHYQKVPLKEPVPTISSKMVTPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----Q
300 310 320 330 340
360 370 380 390 400 410
pF1KE3 KNSNPYITPNNRYGHQNGASYAWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIK
::.: .. :::::.::::::.:.::: ::::::::::::::::::.::.::::::::.:
CCDS33 KNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLK
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE3 VTNSAMKKGKPIVETPVTPTITTLLDEKVQSV---PLAATTFTSPSNTPASISPKLNVGV
::.:: :::: .: : : ::.::. : . . .::.. :: .. .
CCDS33 VTSSASKKGKQLVLDP-------LAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTEL
410 420 430 440 450 460
480 490 500 510 520
pF1KE3 KKEVDKEK---AVTDEKP-KQKDKPGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSL
::: ::. . ::: :..: .. : . ::.:: :.:::.. ::: ::::::
CCDS33 KKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSL
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE3 ENTVTSAINKAQNGTPSWGGYPSIHAAYQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSP
:::::.::::::::.:::..:::::::::: . : : ... ..: . :. . ..:
CCDS33 ENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAP
530 540 550 560 570 580
590 600 610 620 630 640
pF1KE3 T-KNQTLVSPPSSQTSPMPKTNFHAMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPS
: . ::: :. . .:. . ::: .: .: .:: :: :: ..: :
CCDS33 KWKVMPLVSMPT-HLAPYTQ---------VKKESEDK---DEAVKEC-GKESPHEEA--S
590 600 610 620
650 660 670 680 690
pF1KE3 PCSSEVGEPIKMEASSDGGFRSQENSPSPPRDGCKDGSPLAEP---VENGKELVKPL---
: :. .::..: .::. . .:: : ...:.: ::
CCDS33 SFSHSEGD----------SFRKSE---TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLE
630 640 650 660 670
700 710 720 730 740 750
pF1KE3 -ASSLSGSTAIITDHPPEQPFVNPLSALQSVMNIHLGKAAKP------SLPALDPMSMLF
.:.::.. :. ..: : : .:::::::::.: :::::..: : :. . .::.
CCDS33 PTSALSNGCAL-ANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFH
680 690 700 710 720 730
760 770 780 790 800 810
pF1KE3 KMSNSLAEKAAVATPPPLQSKKADHLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPT
: . .. .: ... : ....:. ::... :.::::::::.:: :
CCDS33 KSNLNVMDKPVLS---PASTRSASVSRRYLFE-NSDQPIDLTKSKSKK------------
740 750 760 770
820 830 840 850 860 870
pF1KE3 STAPATSSSTVTTAKTSAVVSFMSNSPLRENALSDISDMLKNLTESHTSKSSTPSSISE-
:..: . : :: : ...:::::.::.: : .. : : .. : .
CCDS33 -------------AESSQAQSCMS--PPQKHALSDIADMVKVLPKATTPKPASSSRVPPM
780 790 800 810
880 890 900 910 920
pF1KE3 KSDIDGATLEE-AEESTPAQKRKGRQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSP
: ..: .:. . : . .::::::::::::::::::::::.:: :::::::..:::.:
CCDS33 KLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGP
820 830 840 850 860 870
930 940 950 960 970 980
pF1KE3 QERMHISRFTGLSMTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPS
::::.::.:::::::::::::::::::::.:::::::::.: :::.:.:.:::::.::::
CCDS33 QERMQISKFTGLSMTTISHWLANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPS
880 890 900 910 920 930
990 1000 1010 1020 1030 1040
pF1KE3 TYISHLESHLGFRLRDLSKLSTEQ---INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLC
::::::::::::...:...::..: ....:....: ... : . ::: ....::::
CCDS33 TYISHLESHLGFQMKDMTRLSVDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLC
940 950 960 970 980 990
1050 1060 1070 1080
pF1KE3 NRTFASKHAVKLHLSKTHGKSPEDHLLYVSELEKQ
:::.:::::::::::::.:::: : .:......
CCDS33 CRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVDEE
1000 1010 1020 1030
1081 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 23:43:19 2016 done: Sun Nov 6 23:43:20 2016
Total Scan time: 5.540 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]