FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3349, 1034 aa
1>>>pF1KE3349 1034 - 1034 aa - 1034 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.4729+/-0.00101; mu= -2.7340+/- 0.060
mean_var=212.0128+/-47.436, 0's: 0 Z-trim(110.9): 23 B-trim: 687 in 1/51
Lambda= 0.088083
statistics sampled from 11971 (11982) to 11971 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.699), E-opt: 0.2 (0.368), width: 16
Scan time: 5.350
The best scores are: opt bits E(32554)
CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034) 6869 886.3 0
CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031) 6780 875.0 0
CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032) 1972 264.0 1.2e-69
CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077) 1972 264.0 1.2e-69
CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081) 1114 155.0 8.1e-37
>>CCDS33490.1 TSHZ2 gene_id:128553|Hs108|chr20 (1034 aa)
initn: 6869 init1: 6869 opt: 6869 Z-score: 4727.3 bits: 886.3 E(32554): 0
Smith-Waterman score: 6869; 100.0% identity (100.0% similar) in 1034 aa overlap (1-1034:1-1034)
10 20 30 40 50 60
pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS
970 980 990 1000 1010 1020
1030
pF1KE3 PEHHSQFVTDVDEE
::::::::::::::
CCDS33 PEHHSQFVTDVDEE
1030
>>CCDS54474.1 TSHZ2 gene_id:128553|Hs108|chr20 (1031 aa)
initn: 6780 init1: 6780 opt: 6780 Z-score: 4666.1 bits: 875.0 E(32554): 0
Smith-Waterman score: 6780; 100.0% identity (100.0% similar) in 1021 aa overlap (14-1034:11-1031)
10 20 30 40 50 60
pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MMAAALLHYTGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
10 20 30 40 50
70 80 90 100 110 120
pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDASDKKAHTHVRLPNEAHN
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE3 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCDTRNGSNKSDFDWHQDALSKSLQQN
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE3 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHY
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE3 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QDDNRKKDKLRPTSYSKPRKRAFQDMDKEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHY
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE3 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QKVPLKEPVPTISSKMVTPAKKRVFDVNRPCSPDSTTGSFADSFSSQKNANLQLSSNNRY
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE3 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GYQNGASYTWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLV
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE3 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDCTASTTELKKESKKERPEETSKDEKVVK
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE3 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SEDYEDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSA
480 490 500 510 520 530
550 560 570 580 590 600
pF1KE3 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 YPSIHAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQV
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE3 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KKESEDKDEAVKECGKESPHEEASSFSHSEGDSFRKSETPPEAKKTELGPLKEEEKLMKE
600 610 620 630 640 650
670 680 690 700 710 720
pF1KE3 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GSEKEKPQPLEPTSALSNGCALANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSS
660 670 680 690 700 710
730 740 750 760 770 780
pF1KE3 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 PSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQA
720 730 740 750 760 770
790 800 810 820 830 840
pF1KE3 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 QSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHK
780 790 800 810 820 830
850 860 870 880 890 900
pF1KE3 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 RKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWL
840 850 860 870 880 890
910 920 930 940 950 960
pF1KE3 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLS
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KE3 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKS
960 970 980 990 1000 1010
1030
pF1KE3 PEHHSQFVTDVDEE
::::::::::::::
CCDS54 PEHHSQFVTDVDEE
1020 1030
>>CCDS12009.1 TSHZ1 gene_id:10194|Hs108|chr18 (1032 aa)
initn: 2613 init1: 762 opt: 1972 Z-score: 1364.1 bits: 264.0 E(32554): 1.2e-69
Smith-Waterman score: 3203; 51.6% identity (72.3% similar) in 1052 aa overlap (51-1034:3-1032)
30 40 50 60 70 80
pF1KE3 LKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQKGCFSYQNSPGSHLSNQDAE
.:: : : :::::: : .::::
CCDS12 MCNEETEIKEAQ----SYQNSPVSSATNQDAG
10 20
90 100 110 120 130
pF1KE3 NESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAHNCMDKMTAVYANILSDSYWS
: .:..:::.. .:. .:. . : . : :... . .. :::::..:.: ::
CCDS12 YGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS---LAQIKAVYANLFSESCWS
30 40 50 60 70 80
140 150
pF1KE3 GLGLGFKLSNSERRNCD----------------------------------------TRN
.:.: .: :.: . : : .
CCDS12 SLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGPTTSTPSTSCSSSTSHSSTTS
90 100 110 120 130 140
160 170 180 190 200 210
pF1KE3 GSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYRQSSKMCGTVFTGASRFRCRQ
:..: .:::: ::.:.:::. . .:::::.::::::..:. :.::::::.:::..
CCDS12 TSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYRQNNKLYGSVFTGASKFRCKD
150 160 170 180 190 200
220 230 240 250 260 270
pF1KE3 CSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPRKRAFQDMD-KEDAQKVLKCM
:::::::::::::::::::::.:::: ::. . .::::::....:. :::::::::::
CCDS12 CSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPRKRSLMEMEGKEDAQKVLKCM
210 220 230 240 250 260
280 290 300 310 320 330
pF1KE3 FCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVTPAKKRVF-DVNRPCSPD---
.:: ::.:::::::::::::::::::::::::.:. :.: .:::.. :. ::::.
CCDS12 YCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVPSTKKRALQDLAPPCSPEPAG
270 280 290 300 310 320
340 350 360 370 380 390
pF1KE3 -STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFEACKSQILKCMECGSSHDTLQ
.. ....: ..:: :: .. :::::::::::::::::: :.::::::::::::::::
CCDS12 MAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFEARKAQILKCMECGSSHDTLQ
330 340 350 360 370 380
400 410 420 430 440 450
pF1KE3 QLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLSEAPNSDSLAPKPSSNSASDC
:::.::::::::::::.:::::::::::::.. ::.::. :.. . : : .. :
CCDS12 QLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIPLPPTTHTRLPASSIKKQPDS
390 400 410 420 430 440
460 470 480 490 500 510
pF1KE3 TA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKPLDPTIKYQYLREEDLEDGSK
: .:.: ::: .::.: .. ::. .:. :: :.: ..:. : :::::::.:. :
CCDS12 PAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK-FEPSTLYPYLREEDLDDSPK
450 460 470 480 490 500
520 530 540 550 560 570
pF1KE3 GGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLSEGTKPPLPMGSQVLQIRPNL
:: ::::::::::.:::.:::::::::..:::::::::: :: ::: . : .:..:.
CCDS12 GGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP-GTVKPLPAAVQSVQVQPSY
510 520 530 540 550 560
580 590 600 610 620
pF1KE3 TNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAVKECGK-------ESPHEEAS
.. .. .. . :. : :.: . .. : .. . : :: . :..: :
CCDS12 AGGVKSLSSAEH-NALLHSPGSLTPPPHKSNVSAMEELVEKVTGKVNIKKEERPPEKEKS
570 580 590 600 610
630 640 650 660 670
pF1KE3 SFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLMKEGS-EKEKPQPLEPTSA-L
:.... :. .: :.: .: . :: : : ::: . . :. :: .: .
CCDS12 SLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAKKEGPLDVHTPNGTEPLKAKV
620 630 640 650 660 670
680 690 700 710 720 730
pF1KE3 SNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKS
.::: . .:.: :::::::::..:.::::...:. ::: . ..:..:
CCDS12 TNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKPV------SPSLDPLAMLYKI
680 690 700 710 720 730
740 750 760 770 780 790
pF1KE3 NLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKSKKAESSQAQSCMSPPQKHAL
. ...:::: . ...:.. :: .:::::::::::::.: :: :.: :: .. ::
CCDS12 SNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKNKPLVSSVADSVASPLRESAL
740 750 760 770 780 790
800 810 820 830 840 850
pF1KE3 SDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKGRQSNWNPQH
::.:::: : ::: .. : : : . : ::.. .:.: .::::::::::::::
CCDS12 MDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEALDELSPVHKRKGRQSNWNPQH
800 810 820 830 840 850
860 870 880 890 900 910
pF1KE3 LLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANVKYQLRKTGG
:::::::::::: .:.::::..::::::::..::::::::::::::::::::::::.:::
CCDS12 LLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLSMTTISHWLANVKYQLRRTGG
860 870 880 890 900 910
920 930 940 950 960 970
pF1KE3 TKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQQSKVEQEIS
::::::.: :::.:.:.:::::::: ::::::::.::::..::...: ..: .. .:..:
CCDS12 TKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFSLKDLSKLPLNQIQE-QQNVS
920 930 940 950 960 970
980 990 1000 1010 1020 1030
pF1KE3 RVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEHHSQFVTDVD
.: . . :.::: : :.:::: :::.:::::::::::::.:::: : .::...
CCDS12 KVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLHLSKTHGKSPEDHLIYVTELE
980 990 1000 1010 1020 1030
pF1KE3 EE
..
CCDS12 KQ
>>CCDS77199.1 TSHZ1 gene_id:10194|Hs108|chr18 (1077 aa)
initn: 2723 init1: 762 opt: 1972 Z-score: 1363.8 bits: 264.0 E(32554): 1.2e-69
Smith-Waterman score: 3244; 51.0% identity (71.9% similar) in 1090 aa overlap (13-1034:13-1077)
10 20 30 40 50 60
pF1KE3 MPRRKQQAPKRAAGYAQEEQLKEEEEIKEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ
:.:. ::.:: : .::. ::.: ..: .. .:: : :
CCDS77 MPRRKQQAPRRSAAYVPEEELKAAE--IDEEHVEDDGLSLDIQE-SEYMCNEETEIKEAQ
10 20 30 40 50
70 80 90 100 110
pF1KE3 KGCFSYQNSPGSHLSNQDAENESLLSDASDQVSDIKSVCGRDAS-DKKAHTHVRLPNEAH
:::::: : .:::: : .:..:::.. .:. .:. . : . : :...
CCDS77 ----SYQNSPVSSATNQDAGYGSPFSESSDQLAHFKGSSSREEKEDPQCPDSVSYPQDS-
60 70 80 90 100 110
120 130 140 150
pF1KE3 NCMDKMTAVYANILSDSYWSGLGLGFKLSNSERRNCD-----------------------
. .. :::::..:.: ::.:.: .: :.: . :
CCDS77 --LAQIKAVYANLFSESCWSSLALDLKKSGSTTSTNDASQKESSAPTPTPPTCPVSTTGP
120 130 140 150 160 170
160 170 180 190
pF1KE3 -----------------TRNGSNKSDFDWHQDALSKSLQQNLPSRSVSKPSLFSSVQLYR
: . :..: .:::: ::.:.:::. . .:::::.:::::
CCDS77 TTSTPSTSCSSSTSHSSTTSTSSSSGYDWHQAALAKTLQQTSSYGLLPEPSLFSTVQLYR
180 190 200 210 220 230
200 210 220 230 240 250
pF1KE3 QSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSYSKPR
:..:. :.::::::.:::..:::::::::::::::::::::.:::: ::. . .::::
CCDS77 QNNKLYGSVFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNRDKDSEKTKRWSKPR
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE3 KRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISSKMVT
::....:. :::::::::::.:: ::.:::::::::::::::::::::::::.:. :.:
CCDS77 KRSLMEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVPAIT-KLVP
300 310 320 330 340
320 330 340 350 360 370
pF1KE3 PAKKRVF-DVNRPCSPD----STTGSFADSFSSQKNANLQLSSNNRYGYQNGASYTWQFE
.:::.. :. ::::. .. ....: ..:: :: .. :::::::::::::::::
CCDS77 STKKRALQDLAPPCSPEPAGMAAEVALSESAKDQKAANPYVTPNNRYGYQNGASYTWQFE
350 360 370 380 390 400
380 390 400 410 420 430
pF1KE3 ACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEKMQSLS
: :.:::::::::::::::::::.::::::::::::.:::::::::::::.. ::.::.
CCDS77 ARKAQILKCMECGSSHDTLQQLTAHMMVTGHFLKVTTSASKKGKQLVLDPVVEEKIQSIP
410 420 430 440 450 460
440 450 460 470 480 490
pF1KE3 EAPNSDSLAPKPSSNSASDCTA--STTELKKESKKERPEETSKDEKVVKSEDYEDPLQKP
:.. . : : .. : : .:.: ::: .::.: .. ::. .:. :: :.:
CCDS77 LPPTTHTRLPASSIKKQPDSPAGSTTSEEKKEPEKEKPPVAGDAEKI--KEESEDSLEK-
470 480 490 500 510 520
500 510 520 530 540 550
pF1KE3 LDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSIHAAYQLS
..:. : :::::::.:. ::: ::::::::::.:::.:::::::::..::::::::::
CCDS77 FEPSTLYPYLREEDLDDSPKGGLDILKSLENTVSTAISKAQNGAPSWGGYPSIHAAYQLP
530 540 550 560 570 580
560 570 580 590 600 610
pF1KE3 EGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPTHLAPYTQVKKESEDKDEAV
:: ::: . : .:..:. .. .. .. . :. : :.: . .. : .. .
CCDS77 -GTVKPLPAAVQSVQVQPSYAGGVKSLSSA-EHNALLHSPGSLTPPPHKSNVSAMEELVE
590 600 610 620 630 640
620 630 640 650
pF1KE3 KECGK-------ESPHEEASSFSHS------EGDSFRKSETPPEAKKTELGPLKEEEKLM
: :: . :..: ::.... :. .: :.: .: . :: : :
CCDS77 KVTGKVNIKKEERPPEKEKSSLAKAASPIAKENKDFPKTEEVS-GKPQKKGPEAETGKAK
650 660 670 680 690 700
660 670 680 690 700 710
pF1KE3 KEGS-EKEKPQPLEPTSA-LSNGCA----LANHAPALPCINPLSALQSVLNNHLGKATEP
::: . . :. :: .: ..::: . .:.: :::::::::..:.::::...:
CCDS77 KEGPLDVHTPNGTEPLKAKVTNGCNNLGIIMDHSPEPSFINPLSALQSIMNTHLGKVSKP
710 720 730 740 750 760
720 730 740 750 760 770
pF1KE3 LRSPSCSSPSSSTISMFHKSNLNVMDKPVLSPASTRSASVSRRYLFENSDQPIDLTKSKS
. ::: . ..:..: . ...:::: . ...:.. :: .:::::::::::::.
CCDS77 V------SPSLDPLAMLYKISNSMLDKPVYPATPVKQADAIDRYYYENSDQPIDLTKSKN
770 780 790 800 810
780 790 800 810 820 830
pF1KE3 KKAESSQAQSCMSPPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVS
: :: :.: :: .. :: ::.:::: : ::: .. : : : . : ::..
CCDS77 KPLVSSVADSVASPLRESALMDISDMVKNLTGRLTPKSSTPSTVSE-KSDADGSSFEEAL
820 830 840 850 860 870
840 850 860 870 880 890
pF1KE3 SEVSTLHKRKGRQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLS
.:.: .:::::::::::::::::::::::::: .:.::::..::::::::..::::::::
CCDS77 DELSPVHKRKGRQSNWNPQHLLILQAQFASSLRETTEGKYIMSDLGPQERVHISKFTGLS
880 890 900 910 920 930
900 910 920 930 940 950
pF1KE3 MTTISHWLANVKYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQ
::::::::::::::::.:::::::::.: :::.:.:.:::::::: ::::::::.::::.
CCDS77 MTTISHWLANVKYQLRRTGGTKFLKNLDTGHPVFFCNDCASQFRTASTYISHLETHLGFS
940 950 960 970 980 990
960 970 980 990 1000 1010
pF1KE3 MKDMTRLSVDQQSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLH
.::...: ..: .. .:..:.: . . :.::: : :.:::: :::.::::::::
CCDS77 LKDLSKLPLNQIQE-QQNVSKVLTNKTLGPLGATEEDLGSTFQCKLCNRTFASKHAVKLH
1000 1010 1020 1030 1040 1050
1020 1030
pF1KE3 LSKTHSKSPEHHSQFVTDVDEE
:::::.:::: : .::.....
CCDS77 LSKTHGKSPEDHLIYVTELEKQ
1060 1070
>>CCDS12421.2 TSHZ3 gene_id:57616|Hs108|chr19 (1081 aa)
initn: 2329 init1: 735 opt: 1114 Z-score: 774.5 bits: 155.0 E(32554): 8.1e-37
Smith-Waterman score: 2943; 48.8% identity (72.8% similar) in 1061 aa overlap (58-1034:48-1081)
30 40 50 60 70 80
pF1KE3 KEEEEEEDSGSVAQLQGGNDTGTDEELETGPEQ---KGCFSYQNSPGSHLSNQDAENESL
::. ..: ::::::....: .. ..::
CCDS12 EELKAAALVDEGLDPEEHTADGEPSAKYMCPEKELARACPSYQNSPAAEFSCHEMDSESH
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE3 LSDASDQVSDIKSVCGRDASDKKAHTHVRLPNE---AHNCMDKMTAVYANILSDSYWSGL
.:..::...:..: .. . : .: .: : . . ...: ::: :.::.::::.:
CCDS12 ISETSDRMADFESGSIKNEEETK---EVTVPLEDTTVSDSLEQMKAVYNNFLSNSYWSNL
80 90 100 110 120 130
150 160 170 180 190
pF1KE3 GLGFKLSNSERRNCDTRNGSNKSD------FDWHQDALSKSLQQNLPSRSVSKPSLFSSV
.:... .::. : .. ..:..:. :::::.:..:.::: :: . .:::::.:
CCDS12 NLNLHQPSSEKNNGSSSSSSSSSSSCGSGSFDWHQSAMAKTLQQVSQSRMLPEPSLFSTV
140 150 160 170 180 190
200 210 220 230 240 250
pF1KE3 QLYRQSSKMCGTVFTGASRFRCRQCSAAYDTLVELTVHMNETGHYQDDNRKKDKLRPTSY
::::::::. :..:::::.:::..:::::::::::::::::::::.:::.. :. : .
CCDS12 QLYRQSSKLYGSIFTGASKFRCKDCSAAYDTLVELTVHMNETGHYRDDNHETDNNNPKRW
200 210 220 230 240 250
260 270 280 290 300 310
pF1KE3 SKPRKRAFQDMD-KEDAQKVLKCMFCGDSFDSLQDLSVHMIKTKHYQKVPLKEPVPTISS
::::::.. .:. :::::::::::.:: ::.:::::::::::::::::::::::: ...
CCDS12 SKPRKRSLLEMEGKEDAQKVLKCMYCGHSFESLQDLSVHMIKTKHYQKVPLKEPVTPVAA
260 270 280 290 300 310
320 330 340 350 360
pF1KE3 KMVTPAKKRV-FDVNRPCSPDSTTGSFADSFSS-----QKNANLQLSSNNRYGYQNGASY
:.. ..:.. .... : ::::: :. ..:. :::.: .. :::::.::::::
CCDS12 KIIPATRKKASLELELPSSPDSTGGTPKATISDTNDALQKNSNPYITPNNRYGHQNGASY
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE3 TWQFEACKSQILKCMECGSSHDTLQQLTTHMMVTGHFLKVTSSASKKGKQLVLDPLAVEK
.:.::: ::::::::::::::::::.::.::::::::.:::.:: :::: .: :..
CCDS12 AWHFEARKSQILKCMECGSSHDTLQELTAHMMVTGHFIKVTNSAMKKGKPIVETPVTPTI
380 390 400 410 420 430
430 440 450 460 470 480
pF1KE3 MQSLSEAPNSDSLAP----KPSSNSASDCTASTTELKKESKKERPEETSKDEKVVKSEDY
:.: .: :: .::.. :: ..:.::: ::. . ::: :..:
CCDS12 TTLLDEKVQSVPLAATTFTSPSNTPASISPKLNVEVKKEVDKEK---AVTDEKP-KQKDK
440 450 460 470 480 490
490 500 510 520 530 540
pF1KE3 EDPLQKPLDPTIKYQYLREEDLEDGSKGGGDILKSLENTVTTAINKAQNGAPSWSAYPSI
.. : . ::.:: :.:::.. ::: :::::::::::.::::::::.:::..::::
CCDS12 PGEEEEKCDISSKYHYLTENDLEESPKGGLDILKSLENTVTSAINKAQNGTPSWGGYPSI
500 510 520 530 540 550
550 560 570 580 590
pF1KE3 HAAYQLSEGTKPPLPMGSQVLQIRPNLTNKLRPIAPKWKVMPLVSMPT-HLAPYTQ----
:::::: . : : ... ..: . :. . ..: : . ::: :. . .:. .
CCDS12 HAAYQLPNMMKLSLGSSGKSTPLKPMFGNS-EIVSPT-KNQTLVSPPSSQTSPMPKTNFH
560 570 580 590 600
600 610 620 630
pF1KE3 -----VKKESEDK---DEAVKEC-GKESPHEEAS-SFSHSE-GD----------SFRKSE
::: .: .: .:: :: :: ..:. : :: :. .::..:
CCDS12 AMEELVKKVTEKVAKVEEKMKEPDGKLSPPKRATPSPCSSEVGEPIKMEASSDGGFRSQE
610 620 630 640 650 660
640 650 660 670 680 690
pF1KE3 ---TPPEAKKTELGPLKEEEKLMKEGSEKEKPQPLEPTSALSNGCAL-ANHAPALPCINP
.::. . .:: : ...:.: :: .:.::.. :. ..: : : .::
CCDS12 NSPSPPRDGCKDGSPLAEP---VENGKELVKPL----ASSLSGSTAIITDHPPEQPFVNP
670 680 690 700 710 720
700 710 720 730 740 750
pF1KE3 LSALQSVLNNHLGKATEPLRSPSCSSPSSSTISMFHKSNLNVMDKPVLS---PASTRSAS
:::::::.: :::::..: : :. . .::. : . .. .: ... : ....:.
CCDS12 LSALQSVMNIHLGKAAKP------SLPALDPMSMLFKMSNSLAEKAAVATPPPLQSKKAD
730 740 750 760 770
760 770 780
pF1KE3 VSRRYLFE-NSDQPIDLTKSKSKK-------------------------AESSQAQSCMS
::... :.::::::::.:: : :..: . : ::
CCDS12 HLDRYFYHVNNDQPIDLTKGKSDKGCSLGSVLLSPTSTAPATSSSTVTTAKTSAVVSFMS
780 790 800 810 820 830
790 800 810 820 830 840
pF1KE3 --PPQKHALSDIADMVKVLPKATTPKPASSSRVPPMKLEMDVRRFEDVSSEVSTLHKRKG
: ...:::::.::.: : .. : : .. : . : ..: .:. . : . .::::
CCDS12 NSPLRENALSDISDMLKNLTESHTSKSSTPSSISE-KSDIDGATLEE-AEESTPAQKRKG
840 850 860 870 880 890
850 860 870 880 890 900
pF1KE3 RQSNWNPQHLLILQAQFASSLFQTSEGKYLLSDLGPQERMQISKFTGLSMTTISHWLANV
::::::::::::::::::.:: :::::::..:::.:::::.::.::::::::::::::::
CCDS12 RQSNWNPQHLLILQAQFAASLRQTSEGKYIMSDLSPQERMHISRFTGLSMTTISHWLANV
900 910 920 930 940 950
910 920 930 940 950 960
pF1KE3 KYQLRKTGGTKFLKNMDKGHPIFYCSDCASQFRTPSTYISHLESHLGFQMKDMTRLSVDQ
:::::.:::::::::.: :::.:.:.:::::.::::::::::::::::...:...::..:
CCDS12 KYQLRRTGGTKFLKNLDTGHPVFFCNDCASQIRTPSTYISHLESHLGFRLRDLSKLSTEQ
960 970 980 990 1000 1010
970 980 990 1000 1010 1020
pF1KE3 QSKVEQEISRVSSAQRSPETIAAEEDTDSKFKCKLCCRTFVSKHAVKLHLSKTHSKSPEH
....:....: ... : . ::: ....:::: :::.:::::::::::::.::::
CCDS12 ---INSQIAQTKSPSEKMVTSSPEEDLGTSYQCKLCNRTFASKHAVKLHLSKTHGKSPED
1020 1030 1040 1050 1060 1070
1030
pF1KE3 HSQFVTDVDEE
: .:......
CCDS12 HLLYVSELEKQ
1080
1034 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 04:43:16 2016 done: Tue Nov 8 04:43:17 2016
Total Scan time: 5.350 Total Display time: 0.250
Function used was FASTA [36.3.4 Apr, 2011]