FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1318, 1388 aa
1>>>pF1KSDA1318 1388 - 1388 aa - 1388 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.7293+/-0.000688; mu= -11.4133+/- 0.042
mean_var=454.0731+/-97.162, 0's: 0 Z-trim(115.5): 133 B-trim: 426 in 1/53
Lambda= 0.060188
statistics sampled from 25953 (26063) to 25953 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.306), width: 16
Scan time: 18.390
The best scores are: opt bits E(85289)
XP_011529300 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0
XP_011529301 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0
XP_016885184 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0
XP_016885183 (OMIM: 300965) PREDICTED: retrotransp (1388) 8922 791.1 0
NP_065820 (OMIM: 300965) retrotransposon gag domai (1388) 8922 791.1 0
NP_001035194 (OMIM: 608424) mucin-17 precursor [Ho (4493) 615 70.2 3.9e-10
NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 539 63.7 4.5e-08
NP_060876 (OMIM: 158372) mucin-4 isoform a precurs (5412) 515 61.6 1.8e-07
XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A is (3076) 369 48.7 0.00078
XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A is (3143) 369 48.7 0.0008
XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A is (3245) 369 48.7 0.00082
XP_011514549 (OMIM: 158371) PREDICTED: mucin-3A is (3296) 369 48.7 0.00083
XP_011514548 (OMIM: 158371) PREDICTED: mucin-3A is (3313) 369 48.7 0.00083
NP_005951 (OMIM: 158371) mucin-3A precursor [Homo (3323) 369 48.8 0.00083
XP_016882989 (OMIM: 606154) PREDICTED: mucin-16 is (11159) 363 48.6 0.003
XP_016882988 (OMIM: 606154) PREDICTED: mucin-16 is (11186) 363 48.6 0.003
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 330 45.2 0.0061
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 330 45.2 0.0061
NP_001157934 (OMIM: 604609) mucin-12 precursor [Ho (5335) 338 46.2 0.0077
>>XP_011529300 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa)
initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0
Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
1330 1340 1350 1360 1370 1380
pF1KSD HQKAHTNK
::::::::
XP_011 HQKAHTNK
>>XP_011529301 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa)
initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0
Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
1330 1340 1350 1360 1370 1380
pF1KSD HQKAHTNK
::::::::
XP_011 HQKAHTNK
>>XP_016885184 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa)
initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0
Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
1330 1340 1350 1360 1370 1380
pF1KSD HQKAHTNK
::::::::
XP_016 HQKAHTNK
>>XP_016885183 (OMIM: 300965) PREDICTED: retrotransposon (1388 aa)
initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0
Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_016 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
1330 1340 1350 1360 1370 1380
pF1KSD HQKAHTNK
::::::::
XP_016 HQKAHTNK
>>NP_065820 (OMIM: 300965) retrotransposon gag domain-co (1388 aa)
initn: 8922 init1: 8922 opt: 8922 Z-score: 4208.3 bits: 791.1 E(85289): 0
Smith-Waterman score: 8922; 100.0% identity (100.0% similar) in 1388 aa overlap (1-1388:1-1388)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 LDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 IMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 AMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 DLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 SGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTGS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 MKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 MRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 MSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTD
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 LVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAPASG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMATAPIR
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPKEVPS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 FGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERW
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 FILQMEVGEPLSHENKSFLRRSQGIYDSLSEIDILSAVLCHPKQGQKSVRQYATDFLLLA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KSD RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 RHLSWSDAILRTRFLEGLSEAVTTKMGRIFLKVAGSLKELIDRSLYTECQLAEEKDSPGN
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KSD SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 SSQVLPTACKRNNEEAMGNELSSQQQTEEHQHVSKRCYYLKEHGDPQEGLHDHLGQSTGH
1330 1340 1350 1360 1370 1380
pF1KSD HQKAHTNK
::::::::
NP_065 HQKAHTNK
>>NP_001035194 (OMIM: 608424) mucin-17 precursor [Homo s (4493 aa)
initn: 101 init1: 59 opt: 615 Z-score: 303.0 bits: 70.2 E(85289): 3.9e-10
Smith-Waterman score: 681; 25.9% identity (52.1% similar) in 1166 aa overlap (31-1146:139-1214)
10 20 30 40 50
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSA--SDP
: : .:: . . . : :: : :
NP_001 RMTPTESRTTSESTSDSTTLFPSSTEDTSSPTTPEGTDVP-MSTPSEESISSTMAFVSTA
110 120 130 140 150 160
60 70 80 90 100 110
pF1KSD GGTSTQLMTSPVFDT-MSAPLMGVPNSGALSPPLMPASDSGALSPLLMPAS-DSGALSPL
: . .:: .. . ::.:: . .. : : : : : . .: : .: . .::
NP_001 PLPSFEAYTSLTYKVDMSTPL--TTSTQASSSPTTPESTT-------IPKSTNSEGSTPL
170 180 190 200 210
120 130 140 150 160 170
pF1KSD L-MPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSG
::: .:.. : . . .: .. : :.:: .: .:: :. :::.:
NP_001 TSMPA---STMKVASSEAITLLTTPVEISTP--VTISAQASSSPTTAEGPSLSNSAPSGG
220 230 240 250 260 270
180 190 200 210 220 230
pF1KSD VVCTPIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSS-EAMS-PLQ
::. . .:. :... ... :: : . ::. .:.. :. : : .
NP_001 --STPL----TRMPLSVMLVVSSEASTLSTTPAATNIPVITSTEASSSPTTAEGTSIPTS
280 290 300 310 320
240 250 260 270 280 290
pF1KSD ITDEDTEAMSKVLMTAL--ASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNS
: . .... ... :..:.:.: .. .:. :.:. :: .:.: ..
NP_001 TYTEGSTPLTSTPASTMPVATSEMSTLSITPVDT---STLVT-------TSTEPSSLPTT
330 340 350 360 370
300 310 320 330 340
pF1KSD GGIPTPLMSDLDSG--------IMSSLLMSSPGSEVMSTPLLS---VPDAGEMSTLPKPA
. . : : :. : . . :. :: .: . . :. : : :.: :. : :
NP_001 AEATSMLTSTLSEGSTPLTNMPVSTILVASSEASTTSTIPVDSKTFVTTASEASSSPTTA
380 390 400 410 420 430
350 360 370 380 390
pF1KSD PDAE-AMSPALMTALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMS
:. : : . : ::..: :. .: : : :: :::. . . ..:..:
NP_001 EDTSIATSTPSEGSTPLTSMPVSTTPVASSEA-SNLSTTPVDSKTQVTTSTEASSS----
440 450 460 470 480 490
400 410 420 430 440 450
pF1KSD APPVRALDSGAMSTPLMGAPASGNMSTLQKTVPASGAMTTSLMTVP---SSGVMSTEQMS
::. ..: ::: :. .::. .:.:.... ...: :.: :. : .. . :
NP_001 -PPTAEVNSMPTSTPSEGSTPLTSMSV--STMPVASSEASTLSTTPVDTSTPVTTSSEAS
500 510 520 530 540
460 470 480 490 500 510
pF1KSD ATASRVMSAQL-TMAKTSGAMPTGSMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPV
.... .... : . . :. : .: . .. . :: .:: . :
NP_001 SSSTTPEGTSIPTSTPSEGSTPLTNMPVSTRLVVSSEASTTSTTPADSNTFVTTSSEASS
550 560 570 580 590 600
520 530 540 550 560 570
pF1KSD TATASETMSMPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAM
..:..: ::: : :. .. .: . .. . : . :... ... . .. :
NP_001 SSTTAEGTSMPTSTYSERGT-TITSMSVSTTLVAS-SEASTLSTTPVDSNTPVTTSTEAT
610 620 630 640 650 660
580 590 600 610 620 630
pF1KSD STPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTT
:. . :: ::: . . .. . : : .:.... .. : :: ..: : :.
NP_001 SSSTTAEGTSMPTST--YTEGSTPLTSMPVNTTLVASSEASTLSTTPVDTSTPVT---TS
670 680 690 700 710 720
640 650 660 670 680 690
pF1KSD TASEAMPTLLMRDTVSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSM
: . . :: :..:: ::: :.: : : :. : .: .. ::. ..:.: .
NP_001 TEASSSPT-----TADGA-SMP--TSTPSEG-STPLTSMPVSKTLLTSSEASTLS---TT
730 740 750 760 770
700 710 720 730 740 750
pF1KSD PLMRAQDPGVMPASLMRAKVSGKML---SQPMSTQDPGGMSMSPM-KSMTAGGMQMNSPT
:: : .. .. .:. : :.:.:: . : ::. :. .. ..::
NP_001 PL----DTSTHITTSTEASCSPTTTEGTSMPISTPSEG----SPLLTSIPVSITPVTSPE
780 790 800 810 820
760 770 780 790 800 810
pF1KSD SDVMSTPTVRAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPL
....:: : . . : :: . . :.: :. : . : :. :: :.: .: .
NP_001 ASTLSTTPVDSNSPVTTSTEVSSSPTPAEGTSMPTSTYSEGR--TPLTSMPVS---TTLV
830 840 850 860 870
820 830 840 850 860
pF1KSD RSPAYGAMSAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSR-
. : ...:. . ... :. . . : . ::: ... : : :: :::
NP_001 ATSAISTLSTTPVDTSTPVTNSTEARSSPTTSEGTSMP---TSTPGEGSTPLTSMPDSTT
880 890 900 910 920 930
870 880 890 900 910 920
pF1KSD --VTSTSQMMPTASGDMCTLPVRAPASGGVSSPLVRAPASGTMSTPLR--RPSACETVST
:.: .. . .. : : :: . .. ..::: . .: ::: . : . ::
NP_001 PVVSSEARTLSATPVDTST-PV-TTSTEATSSPTTAEGTSIPTSTPSEGTTPLTSTPVSH
940 950 960 970 980 990
930 940 950 960 970 980
pF1KSD ELMRASASGHMSTAQTTAMVSGGMSKPLMRAP--ASGT-MPMPLMSAMASGEMSMPLMET
:. : .. .::. . . . : : : :: :: : .. ::. :
NP_001 TLVANSEASTLSTTPVDSNTPLTTSTEASSPPPTAEGTSMPTSTPSEGSTPLTRMPVSTT
1000 1010 1020 1030 1040 1050
990 1000 1010 1020 1030
pF1KSD M-ASGATSTLQTSVANSRS--MSLSQ-TTYTVSGRMATAPIRASASGARSTSFMRASVSG
: ::. ::::.:. :.. . . :: .. .... .. : . . : :: . . ::
NP_001 MVASSETSTLSTTPADTSTPVTTYSQASSSSTTADGTSMPTSTYSEG--STPLTSVPVST
1060 1070 1080 1090 1100 1110
1040 1050 1060 1070 1080 1090
pF1KSD SMPMPLPRATASGCGMGMSMPQMTATDS-------RGMSTPLMRASGPGTMSTPQTAFGV
. . .: : . :.: :.:.. .: : : .: :. .:: ... :
NP_001 RLVVSSEASTLSTTPVDTSIPVTTSTEASSSPTTAEGTSIP---TSPPSEGTTPLASMPV
1120 1130 1140 1150 1160
1100 1110 1120 1130 1140 1150
pF1KSD MSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPPPK-EVPSFGMLTPALCY
.: . :.::.: .. : :: ..::. :...::: :: :. ::
NP_001 STTLVV----SSEANT--LSTTPVDSKT---QVATSTEASSPPPTAEVTSMPTSTPGERS
1170 1180 1190 1200 1210
1160 1170 1180 1190 1200 1210
pF1KSD LLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEP
NP_001 TPLTSMPVRHTPVASSEASTLSTSPVDTSTPVTTSAETSSSPTTAEGTSLPTSTTSEGST
1220 1230 1240 1250 1260 1270
>--
initn: 91 init1: 56 opt: 606 Z-score: 298.7 bits: 69.4 E(85289): 6.7e-10
Smith-Waterman score: 623; 23.6% identity (55.2% similar) in 1143 aa overlap (31-1135:1269-2321)
10 20 30 40 50 60
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGG
: . : .: : .:. .: ...: .
NP_001 LSTSPVDTSTPVTTSAETSSSPTTAEGTSLPTSTTSEGSTLLTS---IPVSTTLVTSPEA
1240 1250 1260 1270 1280 1290
70 80 90 100 110
pF1KSD TSTQLMTSPVFDTMSAPLMGVPNSGALSPPLMPASDSGALSPLLMPASD-SGALSPLLMP
.. :.:.:: :: ..: : .:. .: :: .. ::.: : . .::
NP_001 ST--LLTTPV-DT-KGP---VVTSNEVSSSPTPAEGTS------MPTSTYSEGRTPLTSI
1300 1310 1320 1330 1340
120 130 140 150 160 170
pF1KSD ALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCT
... :...: ...: . : :. .: ..: . . :: :. :
NP_001 PVNT----TLVASSAISILSTTPVDNSTPVTTSTEACSSPTTSEGTSMPNSNPSEGT--T
1350 1360 1370 1380 1390
180 190 200 210 220 230
pF1KSD PIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSS-EAMS-PLQITDE
:. : : .::.. . ... :: .. .::. :.. . .:.. :..: : . .:
NP_001 PLTSIPVS---TTPVV-SSEASTLSATPVDTSTPGTTSAEATSSPTTAEGISIPTSTPSE
1400 1410 1420 1430 1440 1450
240 250 260 270 280 290
pF1KSD DTEAMSKVLM--TALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPT-STQNSGGI
.... . : .:..: :.: . .::. : .. :...: .:: :. .:. . .
NP_001 GKTPLKSIPVSNTPVANSEASTLSTTPVDSN--SPVVTSTAVS--SSPTPAEGTSIAIST
1460 1470 1480 1490 1500
300 310 320 330 340 350
pF1KSD PTPLMSDLDS-GIMSSLLMSSPGSEVMSTP-LLSVP--DAGEMSTLPKPAPDAEAMSPAL
:. . : : . .. . :: . . .:: . :.: .. :. : : :. .:. .
NP_001 PSEGSTALTSIPVSTTTVASSEINSLSTTPAVTSTPVTTYSQASSSPTTA-DGTSMQTST
1510 1520 1530 1540 1550 1560
360 370 380 390 400
pF1KSD MT--ALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDS
.. . : .:..:: . .: : . :: .::. ...::: :. . .:
NP_001 YSEGSTPLTSLPVSTMLVVSSEA-NTLSTTPIDSK------TQVTASTEASSSTTAEGSS
1570 1580 1590 1600 1610 1620
410 420 430 440 450 460
pF1KSD GAMSTPLMGAPASGNMSTLQKTVPASGAMTTSLMTVP---SSGVMSTEQMSATASRVMSA
..::: :.: .. . .:.:... ...: :.: .: :... ..:.. . . ..
NP_001 MTISTPSEGSPLLTSIPV--STTPVASPEASTLSTTPVDSNSPVITSTEVSSSPTPAEGT
1630 1640 1650 1660 1670
470 480 490 500 510 520
pF1KSD QL-TMAKTSGAMPTGSMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMS
.. : . : : : :. . . .. : .::. . . . . :.:: :
NP_001 SMPTSTYTEGRTPLTSITVRTTPVASSAISTLSTTPVDNSTPVTTSTEARSSPTTSEGTS
1680 1690 1700 1710 1720 1730
530 540 550 560 570 580
pF1KSD MPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQT
::. ..:. :. . .. . .. ..: :. . ... . . : : :.: . :
NP_001 MPN-STPSEGTTPLTSIPVSTTPVLSSEASTLSATPIDTSTPVTTSTE-ATSSPTTAEGT
1740 1750 1760 1770 1780 1790
590 600 610 620 630 640
pF1KSD SGSTSTLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLL
: :::: . . . : : ..:.... .. : : .... . .:.:: . ::
NP_001 SIPTSTL--SEGMTPLTSTPVSHTLVANSEASTLSTTPVDSN--SPVVTSTAVSSSPT--
1800 1810 1820 1830 1840 1850
650 660 670 680 690 700
pF1KSD MRDTVSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGV
. .: : : :. .:: .. .: :.. : : .. .:. . : :. . .
NP_001 PAEGTSIATSTPSEGSTALTSIPVS----TTTVASSETNTLSTTPAVTSTPVTTYAQVSS
1860 1870 1880 1890 1900
710 720 730 740 750 760
pF1KSD MPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTS
:.. : :. : : . : .. :... :... ..:. .. . .: : . :
NP_001 SPTT---ADGSSMPTSTPREGRPP--LTSIPVSTTTVASSEINTLSTTLADTRTPVTTYS
1910 1920 1930 1940 1950 1960
770 780 790 800 810
pF1KSD ETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-----MRAPASGEIATPL--RSPAYGA
.. :.: :.: :. .:. :.:: . . :: .::. .:: .
NP_001 QASSSPT--TADGTSMPTPAYSEGSTPLTSMPLSTTLVVSSEASTLSTTPVDTSTPATTS
1970 1980 1990 2000 2010
820 830 840 850 860 870
pF1KSD MSAPQMTATASG--MMSSMPQVKA-PISGAMSMPLTRSTASGGMSMPLMRAP-DSR--VT
. . .::.: ...: :. .. :..: ::.. . . .. . : .: ::. ::
NP_001 TEGSSSPTTAGGTSIQTSTPSERTTPLAG---MPVSTTLVVSSEGNTLSTTPVDSKTQVT
2020 2030 2040 2050 2060 2070
880 890 900 910 920 930
pF1KSD STSQMMPTASGDMCTLPVRAPASGGVSSPLVRA-PASGTMSTPLRRPSACETVSTELMRA
.... .:... .. . ::. : :::. . : : .::. : : :.:: . .
NP_001 NSTEASSSATAEGSSMTISAPSEG---SPLLTSIPLS---TTPVASPEAS-TLSTTPVDS
2080 2090 2100 2110 2120
940 950 960 970 980
pF1KSD SASGHMSTAQTTAMVSGGMSKPLMRAPASGT-MPMPLMSAMASGEMSMPLMETM-ASGAT
. : . :.. :: :.:. :. :: : .: . :::. :. ::.:
NP_001 N-----SPVITSTEVS---SSPI---PTEGTSMQTSTYSDRRTPLTSMPVSTTVVASSAI
2130 2140 2150 2160 2170
990 1000 1010 1020 1030 1040
pF1KSD STLQTSVANSRSMSLSQT---TYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLP
:::.:. ... . ..: . .... .. : . . : :: : :: .::.
NP_001 STLSTTPVDTSTPVTNSTEARSSPTTSEGTSMPTSTPSEG--STPFTSMPVS-TMPVVTS
2180 2190 2200 2210 2220 2230
1050 1060 1070 1080 1090 1100
pF1KSD RA-TASGCGMGMSMPQMTATDSRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGE
.: : :. . : : :.:.. :.: ... :: : : .... .:: . . ..
NP_001 EASTLSATPVDTSTPVTTSTEA--TSSP---TTAEGT-SIPTSTLSEGTTP-LTSIPVSH
2240 2250 2260 2270 2280
1110 1120 1130 1140 1150 1160
pF1KSD ASTSHINITASGSKPTSHMT--ATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSC
. ... .... .. :.. : .:. :...:::
NP_001 TLVANSEVSTLSTTPVDSNTPFTTSTEASSPPPTAEGTSMPTSTSSEGNTPLTRMPVSTT
2290 2300 2310 2320 2330 2340
1170 1180 1190 1200 1210 1220
pF1KSD SVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRS
NP_001 MVASFETSTLSTTPADTSTPVTTYSQAGSSPTTADDTSMPTSTYSEGSTPLTSVPVSTMP
2350 2360 2370 2380 2390 2400
>>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa)
initn: 375 init1: 164 opt: 539 Z-score: 265.9 bits: 63.7 E(85289): 4.5e-08
Smith-Waterman score: 619; 23.3% identity (52.8% similar) in 1093 aa overlap (69-1121:3625-4624)
40 50 60 70 80 90
pF1KSD VQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDT-MSAPLMGVPNSGALSPPLMPASDS
:: .: ..:: ..:.. : :: .: .
NP_001 VCRNQDQQGPFKMCLNYEVRVLCCETPKGCPVTSTSVTAP--STPSGRATSPTQSTSSWQ
3600 3610 3620 3630 3640 3650
100 110 120 130 140 150
pF1KSD GALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMV
. . :. .: ... . : : .: ::. .. :. . : .: :
NP_001 KSRTTTLVTSSITSTTQT-------STTSAPTTSTTPASI--PSTTSAPTTSTTS-----
3660 3670 3680 3690
160 170 180 190 200 210
pF1KSD APDSAEISPLAMPAPSSGVVCTPIMSTSSSEAMSTPLMLAPDSGELSPILMQDMNPGVMS
:: .. : ::..... :: .:::. . :: :: .. .: . .. . :
NP_001 APTTSTTS-----APTTSTTSTPQTTTSSAPTSSTT--SAPTTSTISAPTTSTISAPTTS
3700 3710 3720 3730 3740 3750
220 230 240 250 260 270
pF1KSD TQPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSLL---MSGTDSEAISSLIMS
: .:. :. . .: . .. : ... :. .:. :.: . ..: : .: : :
NP_001 TTSAPTASTTS-APTSTSSAPTTNTTSAPTTSTTSAPITSTISAPTTSTTSTPQTSTISS
3760 3770 3780 3790 3800 3810
280 290 300 310 320 330
pF1KSD AVASGGTSPQP--TSTQNSGGIPTPLMSDLDSGIMSSLLMSSPGSEVMSTPLLSVPDAGE
..: ..:: ::. ... .: : .. :. :.: . . :.: :. .:
NP_001 PTTSTTSTPQTSTTSSPTTSTTSAPTTSTTSAPTTSTT--STPQTSISSAPTSSTTSAPT
3820 3830 3840 3850 3860
340 350 360 370 380 390
pF1KSD MSTLPKPAPDAEAMSPALMTALPSGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRA
::. :. .. .. . :. :.. :.. : .. . . :: . .. : :. .
NP_001 ASTISAPTTSTTSFHTTSTTSPPTS--STSSTPQTSKTSAATSSTTSGSGTTPSPVPTTS
3870 3880 3890 3900 3910 3920
400 410 420 430 440
pF1KSD TASGVMSAPPVRALDSGAMSTPLMGA--PASGNMSTLQKTVPASGAM---TTSLMTVPSS
::: .. .... . : :. : . .. :. : . .. :
NP_001 TASVSKTSTSHVSVSKTTHSQPVTRDCHPRCTWTKWFDVDFPSPGPHGGDKETYNNIIRS
3930 3940 3950 3960 3970 3980
450 460 470 480 490 500
pF1KSD G---VMSTEQMSATASRVMS-AQLTMAKTSGAMPTGSMKAVAKQYKRATASGKM--STPL
: :... :. : .... . . .. . .... . . . :: . .
NP_001 GEKICRRPEEITRLQCRAESHPEVSIEHLGQVVQCSREEGLVCRNQDQQGPFKMCLNYEV
3990 4000 4010 4020 4030 4040
510 520 530 540 550
pF1KSD R----RAPTSGAMSTQPVTATASETMSMPQLTVPASGSMSMLQMRAPV---SEAMSMPQM
: ..: . ... :::: .. . . : :.... : . :. . . . : ::
NP_001 RVLCCETPKGCPVTSTPVTAPSTPS---GRATSPTQSTSSWQKSRTTTLVTTSTTSTPQT
4050 4060 4070 4080 4090 4100
560 570 580 590 600 610
pF1KSD RTMASGLTSAAQMKA-MTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGA
: .. ::. .. :..: .: .: :...::. : :.:: . . .: .
NP_001 STTSAPTTSTIPASTPSTTSAPTTSTTSAPTTSTTSAPTHR-TTSGPTTSTTLAPTTS-T
4110 4120 4130 4140 4150 4160
620 630 640 650 660 670
pF1KSD LSKPLMTPKASGTMFTEKMTTTASEAMPTL-LMRDTVSGALSMPQMTDT-ASGGLSASLM
: : . ... : : . .::.. . :: . . .:.. : :: . : :. . ..:
NP_001 TSAPTTSTNSAPTTSTISASTTSTISAPTTSTISSPTSSTTSTPQTSKTSAATSSTTSGS
4170 4180 4190 4200 4210 4220
680 690 700 710 720 730
pF1KSD RDTASGAMSTSQMTATVSGGMSMPLMRAQD-PGVMPASLMRAKVSGKMLSQPMSTQDPGG
: : . .:: .:.... : : . . ::. :. . ..... .. .:. :
NP_001 GTTPSPVPTTSTTSASTTSTTSAPTTSTTSGPGTTPSPVPSTSTTSAATTS--TTSAPTT
4230 4240 4250 4260 4270
740 750 760 770 780
pF1KSD MSMS-PMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGERPSLLTRASS
. : : .:::.: ::. ::. . .. : :: :: :: :: . .:.
NP_001 RTTSAPTSSMTSGPGTTPSPV------PTTSTTSAPTTST----TSGPGTTPSPVPTTST
4280 4290 4300 4310 4320
790 800 810 820 830 840
pF1KSD SGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAPISGAMSMPL
. : :. . .:: .:: :. .. ::: ..:... :. ...: . .:
NP_001 T---SAPIT-STTSGPGSTPSPVPTTSTTSAPTTSTTSASTAST---TSGPGTTPSPVPT
4330 4340 4350 4360 4370 4380
850 860 870 880 890 900
pF1KSD TRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSPLVRA-PAS-
: .:. :: .:.::.: :.:: : : .:... .:.: .:. :::
NP_001 TSTTS----------APTTRTTSASTA-STTSGPGST-PSPVPTTSTTSAPTTRTTPAST
4390 4400 4410 4420 4430
910 920 930 940 950 960
pF1KSD -GTMSTPLRRPSACETVSTELMRASASGHMSTAQTTA-----MVSGGMSKPLMRAPASGT
.: : : :: :.:: .... . :..::. :.:: . : .:...:
NP_001 ASTTSGPGTTPSPVPTTSTTSASTTSTISLPTTSTTSAPITSMTSGPGTTP-SPVPTTST
4440 4450 4460 4470 4480
970 980 990 1000 1010
pF1KSD MPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRMAT-API-
: :. ... : . . . : .:. : . : . ..:. :.:: .. .:.
NP_001 TSAPTTSTTSASTASTTSGPGTTPSPVPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVP
4490 4500 4510 4520 4530 4540
1020 1030 1040 1050 1060 1070
pF1KSD RASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLMRASGP
.:...: .:: .: :. : :.: .... : : ..: :::
NP_001 TTSTTSAPTTS--TTSGPGTTPSPVPTTSTT------SAPTTSTT------------SGP
4550 4560 4570 4580
1080 1090 1100 1110 1120 1130
pF1KSD GTMSTPQTAFGVMSTPEIKATDSGEASTSHINIT-ASGSKPTSHMTATTPETAKPPPKEV
:: .: .: ..: ...::::.... .. :.:..
NP_001 GTTPSP--------VPTTSTTPVSKTSTSHLSVSKTTHSQPVTSDCHPLCAWTKWFDVDF
4590 4600 4610 4620 4630 4640
1140 1150 1160 1170 1180 1190
pF1KSD PSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHLGAAE
NP_001 PSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESHPEVNIEHLGQVVQCSREEGL
4650 4660 4670 4680 4690 4700
>--
initn: 277 init1: 155 opt: 515 Z-score: 254.7 bits: 61.6 E(85289): 1.9e-07
Smith-Waterman score: 696; 23.7% identity (54.3% similar) in 1086 aa overlap (49-1110:2240-3207)
20 30 40 50 60 70
pF1KSD VEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPL
: :::. . . :.: . :: : :.:
NP_001 RVLCCETPKGCPVTSTPVTAPSTPSGRATSPTQSTSSWQKSRTTTLVTTS----TTSTPQ
2210 2220 2230 2240 2250 2260
80 90 100 110 120 130
pF1KSD MGVPNSGALSPPLMPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM
.. . . : :.. . . :.. . . :: . ..: ::. .:: ..
NP_001 TSTTYAHTTSTTSAPTARTTS-----APTTRTTSASPASTTSGPGNTPSPVPTTSTISAP
2270 2280 2290 2300 2310 2320
140 150 160 170 180 190
pF1KSD SPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSGVVCTPIMSTSSSEAMSTPLMLAP
. .. . : .: :: . .. .: :.:..... .: ::.:. . :: :
NP_001 TTSITSAPTTSTTSAPTSSTTSGPGTTP--SPVPTTSITSAPTTSTTSAPTTSTTS--AR
2330 2340 2350 2360 2370
200 210 220 230 240 250
pF1KSD DSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSL
:. : . .. . .:::. :. . . . :. : :. .:. ::
NP_001 TSSTTSATTTSRISGPETTPSPVPTTSTTSATTTSTTSAPT--------TSTTSAPTSST
2380 2390 2400 2410 2420
260 270 280 290 300 310
pF1KSD LMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSSLLMSSP--G
:. .. . :. :.... ::.:.:. : .. . :: .. .. .: .: :
NP_001 T-SSPQTSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTRTTSAPKSSTTSAATTSTTSG
2430 2440 2450 2460 2470 2480
320 330 340 350 360 370
pF1KSD SEVMSTPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALPSGVMPTQTMPAPGSGAMSPWS
:. :. .. .. .: :: . . : : :. ::. : . :.: ... : .
NP_001 PETTPRPVPTTSTTSSPTTSTTSAPTTSTTS-ASTTSTTSGAGTTPS-PVPTTSTTSAPT
2490 2500 2510 2520 2530 2540
380 390 400 410 420 430
pF1KSD TQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVPASGA
:..... . :. . ::.... :.: . : . .: .::.... : :.: :..
NP_001 TSTTSAPISST--TSATTTSTTSGPGTTP--SPVPTTSTTSAPTTSTTSG-PGTTP-SAV
2550 2560 2570 2580 2590
440 450 460 470 480 490
pF1KSD MTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGA-MPTGSMKAVAKQYKRATASG
:::. ..:.... :. .:.:.: . ..... .:. . .::.: ... .:.::
NP_001 PTTSITSAPTTSTNSAP-ISSTTSATTTSRISGPETTPSPVPTASTTSASTT---STTSG
2600 2610 2620 2630 2640 2650
500 510 520 530 540
pF1KSD KMSTP----------LRRAPTSGAMSTQPVTATASETMSMPQLT---VPASGSMSMLQMR
.:: . . :..: .:. ..:... : : : : ::.... :
NP_001 PGTTPSPVPTTSTISVPTTSTTSASTTSTTSASTTSTTSGPGTTPSPVPTTSTTS-----
2660 2670 2680 2690 2700 2710
550 560 570 580 590 600
pF1KSD APVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMS
::.. . : : :... ::... : :... :.: .. .:::. :.. .
NP_001 APTTSTTSAPTTSTISAPTTSTTS--ATTTSTTSAPTPRRTSAPTTSTISASTTSTTSAT
2720 2730 2740 2750 2760
610 620 630 640 650 660
pF1KSD CPQMRS-LASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMPQMTDT
. : .....: : . : : : . : :.. . : .:.. : :: . :
NP_001 TTSTTSATTTSTISAPTTSTTLSPTTSTTSTTITSTTSAP-------ISSTTSTPQTSTT
2770 2780 2790 2800 2810 2820
670 680 690 700 710 720
pF1KSD ASGGLSASLMRDTASGAM-STSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSGKMLS
.. :.. :.:. . .:: .: ... : : :. . .:.: . .. . :
NP_001 SAPTTSTTSGPGTTSSPVPTTSTTSAPTTSTTSAPTTRTTS---VPTSSTTSTATTSTTS
2830 2840 2850 2860 2870
730 740 750 760 770 780
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSETMSTPLMRTSDPGER
: .: .: : : :. .::. . :.::. . .. : :: :: :
NP_001 GPGTTPSP-----VPTTSTTS------APTTRTTSAPTTSTTSAPTTST----TSAP---
2880 2890 2900 2910 2920
790 800 810 820 830 840
pF1KSD PSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVKAP
: : :.... .:.: . .: .:: :. ...:.: ..:... :. ...:
NP_001 TSSTTSATTTSTISVPTT-STTSVPGTTPSPVPTTSTISVPTTSTTSASTTST---TSGP
2930 2940 2950 2960 2970
850 860 870 880 890 900
pF1KSD ISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPASGGVSSP
. .: : .:. :: . .::. ::.: . ::... :.:
NP_001 GTTPSPVPTTSTTS----------APTTSTTSA----PTTS------TISAPTTSTPSAP
2980 2990 3000 3010
910 920 930 940 950
pF1KSD LVR---APASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSKPLMRAP
. ::...: :.: .. : :: .: . ..:.::...:: . : .:
NP_001 TTSTTLAPTTSTTSAPTTSTTSTPTSSTT---SSPQTSTTSASTTSITSGPGTTP-SPVP
3020 3030 3040 3050 3060 3070
960 970 980 990 1000 1010
pF1KSD ASGTMPMPLMS---AMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVSGRM
...: : : : ... .: : : .. .::: ..:.: :.. .:. : .
NP_001 TTSTTSAPTTSTTSAATTSTISAPTTSTTSAPTTSTTSASTA-SKTSGLGTTPSPIPTTS
3080 3090 3100 3110 3120 3130
1020 1030 1040 1050 1060 1070
pF1KSD ATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGMSTPLM
.:.: .:...: ..: ..: :. : :.: ... . :. ..:.. ::
NP_001 TTSPPTTSTTSASTAS--KTSGPGTTPSPVPTTST------IFAPRTSTTSASTTST---
3140 3150 3160 3170 3180
1080 1090 1100 1110 1120 1130
pF1KSD RASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMTATTPETAKPP
. :::: .: .: .... ...::::.
NP_001 -TPGPGTTPSP--------VPTTSTASVSKTSTSHVSISKTTHSQPVTRDCHLRCTWTKW
3190 3200 3210 3220 3230
1140 1150 1160 1170 1180 1190
pF1KSD PKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMAFLVSLHL
NP_001 FDIDFPSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESHPEVSIEHLGQVVQCS
3240 3250 3260 3270 3280 3290
>>NP_060876 (OMIM: 158372) mucin-4 isoform a precursor [ (5412 aa)
initn: 217 init1: 56 opt: 515 Z-score: 254.9 bits: 61.6 E(85289): 1.8e-07
Smith-Waterman score: 654; 24.8% identity (54.0% similar) in 1264 aa overlap (31-1146:1904-3120)
10 20 30 40 50
pF1KSD MSIPLHSLRFNNTMREENVEPQNKQMAFCRPMTETRAD-VQILHSHVQLPIVSTSASDPG
:. : :. :. :. ..::..: :... :
NP_060 LVTDASSVSTGDTTPLPVTDTNSASTGDTTPLHVTDASSVSTGHA-TSLPVTSLSSASTG
1880 1890 1900 1910 1920 1930
60 70 80 90 100 110
pF1KSD GTSTQLMTSPVFDT--MSAPL-----MGVPNSGALSPPLMPASD--SGALSPLLMPASDS
:. .::: . ..:: .::.. : : :. ::. .: .:: :..:.
NP_060 DTTPLPVTSPSSASSGHTTPLPVTDASSVPTGHATSLPVTDASSVSTGHATPL--PVTDA
1940 1950 1960 1970 1980 1990
120 130 140 150
pF1KSD GALS-----PLLMPALDSGTLS-----PL----LSTSEYGVMSPGMMTIPDFGTMSA---
...: :: :. :....: :: ::.. : .: . . : .. :.
NP_060 SSVSTGHATPL--PVTDTSSVSTGQATPLPVTSLSSASTGDTTP--LPVTDTSSASTGQD
2000 2010 2020 2030 2040
160 170 180 190 200
pF1KSD -----TLMVAPDSAEISPLAMPAPSSGVV--CTPIMSTSSSEAMST---PLMLAPDSGEL
: . . .... .:: . :::. . ::.. :..: ..:: .:. :.. .
NP_060 TPLPVTSLSSVSTGDTTPLPVTNPSSASTGHATPLLVTDAS-SISTGHATSLLVTDASSV
2050 2060 2070 2080 2090 2100
210 220 230 240 250
pF1KSD SP---ILMQDMNPGVMST-QPVPAPSSEAMSPLQITDEDTEAMSKVLMTALASGEISSLL
: ..: . . .:: . .: : . :: . . :: . . .....:. .::
NP_060 STGHATALHDTDASSLSTGDTTPLPVT---SPSSTSTGDTTPLPVTETSSVSTGHATSLP
2110 2120 2130 2140 2150 2160
260 270 280 290 300
pF1KSD MSGTDSEAI---SSLIM---SAVASGGTSPQP---TSTQNSG-GIPTPLMS--DLDSGIM
.. :.: . .:: . :....: ..: : ::. ..: . : :. : . ..:
NP_060 VTDTSSASTGHATSLPVTDTSSASTGHATPLPVTDTSSASTGQATPLPVTSPSSASTGHA
2170 2180 2190 2200 2210 2220
310 320 330 340 350
pF1KSD SSLLMS--SPGSEVMSTPL--LSVPDAGEMSTLPKPAPDAEAMSPALMTALP----SGVM
::.. : .: ..::: :. .:. .: : :. :: ..: . :.:: :.:
NP_060 IPLLVTDTSSASTGQATPLPVTSLSSASTGDTTPLPVTDASSVSTGHATSLPVTSLSSVS
2230 2240 2250 2260 2270 2280
360 370 380 390 400 410
pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAM--STPL-M
.: : : . :: :... . . . ....: . :: .:.:.. .::: .
NP_060 TGDTTPLP---VTSPSSASTGHATPLHVTDASSASTGHATPLPVTSLSSASTGDTTPLPV
2290 2300 2310 2320 2330
420 430 440 450 460 470
pF1KSD GAPAS---GNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTS
.:.: :. . :. : ::.. : . .: .. :..:: .. : .. .:
NP_060 TSPSSASTGHATPLHVT-DASSVSTGDTTPLPVTS-------SSSASSGHTTPLPVTDAS
2340 2350 2360 2370 2380 2390
480 490 500 510 520
pF1KSD GAMPTGSMKAVAKQYKRATASGKMS-TPLR--RAPTSGAMSTQPVT--ATASETMSMPQL
.: ::. . ....:. . :. . ..: . ::: ..:: . : :
NP_060 SA-STGDTTPLPVTDTSSASTGHATHLPVTGLSSASTGDTTRLPVTNVSSASTGHATP-L
2400 2410 2420 2430 2440
530 540 550 560 570 580
pF1KSD TVPASGSMSMLQMRA-PVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGS
: ...: : . : ... :. .: .:.:..... . . . .. ..:
NP_060 PVTSTSSASTGDTTPLPGTDTSSVSTGHTTPLLVTDASSVSTGDTTRLPVTSPSSASTGH
2450 2460 2470 2480 2490 2500
590 600 610 620 630 640
pF1KSD TSTLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEA--MPTLLM
:. : . :: :. : . : :. : : .:.. : ......: .:.
NP_060 TTPLPVTDTPSA--STGDTTPLPVTNASS-LSTRHATSLHVTSPSSASTGHATSLPVTDT
2510 2520 2530 2540 2550 2560
650 660 670 680 690
pF1KSD RDTVSG-ALSMP-QMTDTASGGLSASL-MRDTASGAMSTSQMT-------ATVSGGMSMP
. .: : .: :..:: : .. : . :: :. ::.: : ..:: : . :
NP_060 SAASTGHATPLPVTSTSSASTGDTTPLPVTDTYSA--STGQATPLPVTSLSSVSTGDTTP
2570 2580 2590 2600 2610 2620
700 710 720 730 740 750
pF1KSD LMRAQDPGVMPASLMRAKVSGKMLSQP--MSTQDPGGMSMSPMKSMTAGG---MQMNSPT
: : . :.: .... .... :: . . .. ..:...: . ..::.
NP_060 L-----PVTSPSSASTGHATPLLVTDASSASTGQATPLPVTSLSSVSTGDTTPLPVTSPS
2630 2640 2650 2660 2670
760 770 780 790
pF1KSD S----DVMSTP---TVRAWTSETMSTPLMRTS-----DPGERPSLLTRASSSGEMSLPLM
: . : : : : :..: : :. :: : : : .::.:. . ::.
NP_060 SASTGHATSLPVTDTSSASTGDTTSLPVTDTSSAYTGDTTSLPVTDTSSSSTGDTT-PLL
2680 2690 2700 2710 2720 2730
800 810 820 830 840 850
pF1KSD RAPASGEIATPLRSPAYGAMSAPQMTATASGMMSSMPQVK-APISGAMSMPL---TRSTA
. .:. ..: .: . . . .....: . .: .. . .: . . :: . :.:
NP_060 VTETSS-VSTGDTTP----LPVTDTSSASTGHATPLPVTNTSSVSTGHATPLHVTSPSSA
2740 2750 2760 2770 2780 2790
860 870 880 890 900
pF1KSD SGGMSMPLMRAPDSRVTS---TSQMMPTAS----GDMCTLPVRAP--ASGGVSSPLVRAP
: : . :: . : :.. :: . :: : .::: : ::.: ..:: .
NP_060 STGHTTPLPVTDASSVSTGHATSLPVTDASSVFTGHATSLPVTIPSSASSGHTTPLPVTD
2800 2810 2820 2830 2840 2850
910 920 930 940 950
pF1KSD ASGT-----MSTPLRRPSACETV-STELMRASAS----GHMSTAQTTAM--VSGGMSKPL
::.. : :. :. : .: : ..:: :: . :.. :: : . ::
NP_060 ASSVSTGHATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPLTSLSSVSTGDTTPL
2860 2870 2880 2890 2900 2910
960 970 980 990 1000
pF1KSD ----MRAPASG-TMPMPL--MSAMASGEMS-MPLMET--MASGATSTLQTSVANSRS---
. ..: . :.:. .:....:. . .:. .: ..: ...: .. ..: :
NP_060 PVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSASTGHATSLPVTDTSSASTGH
2920 2930 2940 2950 2960 2970
1010 1020 1030 1040 1050
pF1KSD ---MSLSQTTYTVSGRMATAPIR--ASASGARSTSFM---RASVSGSMPMPLPRATASGC
. ..:. . .:. . :. .::: ...::. .:.: . :: .. :.
NP_060 ATPLPDTDTSSASTGHATLLPVTDTSSASIGHATSLPVTDTSSISTGHATPLHVTSPSSA
2980 2990 3000 3010 3020 3030
1060 1070 1080 1090 1100 1110
pF1KSD GMGMSMPQMTATDSRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINI
. : . : . .::. . :: ..: ...:..: .:: . .::.. :::.: .
NP_060 STGHATP-LPVTDTSSASTG---HANPLHVTSPSSASTGHATP-LPVTDTSSASTGHATP
3040 3050 3060 3070 3080
1120 1130 1140 1150 1160 1170
pF1KSD TASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDE
: . ::: . : . : : ::
NP_060 LPVTSLSSVSTGDTTPLPVTSPSSA--STGHTTPLPVTDTSSASTGQATALPVTSTSSAS
3090 3100 3110 3120 3130 3140
1180 1190 1200 1210 1220 1230
pF1KSD EKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIYDSLSEI
NP_060 TGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTSPSSASTGHATPLLVTDA
3150 3160 3170 3180 3190 3200
>--
initn: 221 init1: 58 opt: 415 Z-score: 208.0 bits: 52.9 E(85289): 7.6e-05
Smith-Waterman score: 611; 25.1% identity (53.5% similar) in 1173 aa overlap (48-1124:3137-4223)
20 30 40 50 60 70
pF1KSD NVEPQNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSA-
::..:::... : : : : :: :: ::
NP_060 VTSPSSASTGHTTPLPVTDTSSASTGQATALPVTSTSSASTGDT-TPL---PVTDTSSAS
3110 3120 3130 3140 3150 3160
80 90 100 110 120
pF1KSD -----PL----MGVPNSGALSP-PLM-PASDS-GALSPLLMPASDS---GALSPLLMPAL
:: .. ..: .: :. :.: : : .:::. ..: : .:: . .:
NP_060 TGQATPLPVTSLSSVSTGDTTPLPVTSPSSASTGHATPLLVTDASSASTGQATPLPVTSL
3170 3180 3190 3200 3210 3220
130 140 150 160 170
pF1KSD DS---GTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLMVAPDSAEISPLAMPAPSSG-VV
.: : .:: :: .. . ..: : ::. . :.. . . .: ..
NP_060 SSVSTGDTTPLPVTSPSSASTGHATSLPVTDTSSAS---TGDTTSLPVTDTSSAYTGDTT
3230 3240 3250 3260 3270
180 190 200 210 220
pF1KSD CTPIMSTSSSEAM-STPLMLAPDS----GELSPILMQDMNP---GVMSTQPVPAPSSEAM
:. .:::: . .:::... : :. .:.:. : . : . : .::: .
NP_060 SLPVTDTSSSSTGDTTPLLVTETSSVSTGHATPLLVTDASSASTGHATPLHVTSPSSAST
3280 3290 3300 3310 3320 3330
230 240 250 260 270 280
pF1KSD ---SPLQITDEDTEAMSKVLMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQP-
.:. .: :: ..: : : .:: : :. . .:....: ..: :
NP_060 GDTTPVPVT--DTSSVSTGHATPLPVTGLSS--ASTGDTTRLPVTDISSASTGQATPLPV
3340 3350 3360 3370 3380 3390
290 300 310 320 330
pF1KSD --TSTQNSGG-IPTPLMS--DLDSGIMSSLLMSSPGS----EVMSTPLLSVPDAGEMSTL
::. ..: .: :. : . ..: . : ..: .: .. .:. :. .:. :
NP_060 TNTSSVSTGDTMPLPVTSPSSASTGHATPLPVTSTSSASTGHATPVPVTSTSSASTGHTT
3400 3410 3420 3430 3440 3450
340 350 360 370 380 390
pF1KSD PKPAPDAEAMSPALMTALP----SGVMPTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRA
: :. :. . : . : :: :.. .: : . : :... :. . : . :
NP_060 PLPVTDTSSASTGDTTPLPVTSPSSASTGHTTPLH---VTIPSSASTGDTSTL--PVTGA
3460 3470 3480 3490 3500 3510
400 410 420 430 440
pF1KSD TASGVMSAPPVRALDSGAMST----PL----MGAPASGNMSTLQKTVPASGAMTTSLMTV
..... : :. . :....:: :: ... ..:. . : : ::.: : . .
NP_060 SSASTGHATPLPVTDTSSVSTGHATPLPVTSLSSVSTGDTTPLPVT-DASSASTGQATPL
3520 3530 3540 3550 3560
450 460 470 480 490 500
pF1KSD PSSGVMSTEQMSATASRVMSAQLTMAKTSGAMP-TGSMKAVAKQYKRATASGKMSTPLRR
: ... :. ..: : .:. . . . .: : . .: . . : .. :.
NP_060 PVTSLSSVSTGDTTPLLVTDASSVSTGHATPLPVTDTSSASTGDTTRLPVTDTSSA----
3570 3580 3590 3600 3610 3620
510 520 530 540 550 560
pF1KSD APTSGAMSTQPVTATASETM--SMPQLTVPASGSMSMLQMRAPVSEAMSMPQMRTMASGL
..: . :::. .: . . : :.. ::. . ::... : : .
NP_060 --STGQATPLPVTSLSSVSTGDTTPLLVTDASSVSTGHATPLPVTDTSSASTGDTTRLPV
3630 3640 3650 3660 3670 3680
570 580 590 600 610 620
pF1KSD TSAAQMKAMTSGAMSTPLMTAQTSGSTSTLLMRDTASGVMSCPQMRSLASGALSKPLMTP
:.... .. . . . . ....:: :. : . .:.: .: .. : ...: .
NP_060 TDTSSASTGQATPLPVTIPSSSSSGHTTPLPVTSTSS--VSTGHVTPLH---VTSPSSAS
3690 3700 3710 3720 3730
630 640 650 660 670
pF1KSD KASGTMFTEKMTTTASEAMPT-LLMRD--TVSGALSMP-QMTD--TASGGLSASL-MRDT
. : . :..:: . : ::. : .:: . . : .:: .:: : .. : . ::
NP_060 TGHVTPLPVTSTSSASTGHATPLLVTDASSVSTGHATPLPVTDASSASTGDTTPLPVTDT
3740 3750 3760 3770 3780 3790
680 690 700 710 720
pF1KSD ASGAMSTSQMT-------ATVSGGMSMPL----MRAQDPG---VMPASLMRAKVSGKMLS
.:. ::.: : ..:: : . :: . . : .:... . .: .
NP_060 SSA--STGQATPLPVTSLSSVSTGDTTPLPVTDASSASTGHATPLPVTIPSSVSTGDTMP
3800 3810 3820 3830 3840 3850
730 740 750 760 770
pF1KSD QPMSTQDPGGMSMSPMKSMTAGGMQMNSPTSDVMSTPTVRAWTSET-MSTPLMRTSDPGE
:... :.. : . . . :.. : :.:. :.. . .. : .::: :.
NP_060 LPVTS--PSSASTGHATPLPVTGLSSAS-TGDTTPLPVTDTSSASTRHATPLPVTDT---
3860 3870 3880 3890 3900 3910
780 790 800 810 820 830
pF1KSD RPSLLTRASSSGEMSLPLMR-APASGEIATPLRSPAYGAMSAPQMTATASGMMSSMP--Q
. ::.. ::. . :: :::: :. .. :: ..: . .: .
NP_060 -----SSASTDDTTRLPVTDVSSASTGHATPL--PVTSTSSA------STGDTTPLPVTD
3920 3930 3940 3950
840 850 860 870 880 890
pF1KSD VKAPISG-AMSMPLT-RSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRAPAS
... .: : :.:.: ::.:: : . :: : ::.::.. ..: ::: . .:
NP_060 TSSVSTGHATSLPVTSRSSASTGHATPL---P---VTDTSSV---STGHATPLPVTSTSS
3960 3970 3980 3990 4000
900 910 920 930 940
pF1KSD --GGVSSPL-VRAPASGTMS----TPLRRPSACETVSTELMRASASGHMSTAQTTAM-VS
: ..:: : .:.:.. . .:. :. : .: . .. .. .::...: . :.
NP_060 VSTGHATPLPVTSPSSASTGHATPVPVTSTSSASTGDTTPLPVTNASSLSTGHATPLHVT
4010 4020 4030 4040 4050 4060
950 960 970 980 990 1000
pF1KSD GGMSKPLMRAPASGTMPMPLMSAMASGEMS-MPLMETMASGATSTLQTSVANSRSMSLSQ
. : :. .: :.:. :. ..:. . .:: :: ..:.... . ...
NP_060 SPSSAS--RGDTS-TLPVTDASSASTGHATPLPL--------TSLSSVSTGDTTPLPVTD
4070 4080 4090 4100 4110
1010 1020 1030 1040 1050 1060
pF1KSD TTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATD
:. . .:. . :. ::. .:.. . :.:. .... : :.: :..
NP_060 TSSASTGQATPLPV---------TSLSSVSTGDTTPLPVTIPSSASSGHTTSLPVTDASS
4120 4130 4140 4150 4160
1070 1080 1090 1100 1110 1120
pF1KSD -SRGMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSH---INITASGSKPTS
: : .::: : : :: ... : .: . .::.. :::.: . .: ..: :.
NP_060 VSTGHGTPL-----PVT-STSSASTG--DTTPLPVTDTSSASTGHATPLPVTDTSSASTG
4170 4180 4190 4200 4210 4220
1130 1140 1150 1160 1170 1180
pF1KSD HMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLD
: :
NP_060 HATPLPVTSLSSVSTGHATPLAVSSATSASTVSSDSPLKMETPGMTTPSLKTDGGRRTAT
4230 4240 4250 4260 4270 4280
>>XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A isofor (3076 aa)
initn: 76 init1: 76 opt: 369 Z-score: 189.8 bits: 48.7 E(85289): 0.00078
Smith-Waterman score: 492; 21.4% identity (53.4% similar) in 1089 aa overlap (127-1145:16-1056)
100 110 120 130 140 150
pF1KSD SGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLM
:: . . . : ... .: . ::.:
XP_011 MQLLGLLGLLWMLKASPWATGTLSTATSISQVPFPRAEAASAVLS
10 20 30 40
160 170 180 190 200
pF1KSD VAPDSAEIS--PLAMP---APSSGVVCTPIMSTSSSEA---MSTPLMLAPDSGELSPILM
.: : ... ::..: .:. : . :. ..: .: :. .: :.. :
XP_011 NSPHSRDLAGWPLGVPQLASPAPGHRENAPMTLTTSPHDTLISETLLNSPVSSNTSTTPT
50 60 70 80 90 100
210 220 230 240 250 260
pF1KSD QDMNPGVMSTQP---VPAPSSEAMSPLQITDEDTEAMSKVLMT---ALASGEISSLLMSG
. . : .: : : . ..: . : .. .. : . : :..:. :. . .
XP_011 SKFAFKVETTPPTVLVYSATTECVYPTSFIITISHPTSICVTTTQVAFTSSYTSTPVTQK
110 120 130 140 150 160
270 280 290 300 310 320
pF1KSD TDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSS--LLMSSPGSEVM
. . :. :... .: :: . .: ... . ::... :.. .. . .. .: .
XP_011 PVTTVTSTYSMTTTEKG-TSAMTSSPSTTTARETPIVTVTPSSVSATDTTFHTTISSTTR
170 180 190 200 210 220
330 340 350 360 370
pF1KSD STPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALP--SGVMPTQTMPAPGSGAMSPWSTQ
.: .: .: . : .:.: ... :. .. : :.. :.:. . . : .: .:.
XP_011 TTERTPLP-TGSIHTTTSPTPVFTTLKTAVTSTSPITSSITSTNTVTSMTTTASQPTATN
230 240 250 260 270 280
380 390 400 410 420 430
pF1KSD NVDSE---MMSNPPVRAT---ASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVP
...: ..:. :: .: .::. .. :. .: . .: ..:.: . : . :
XP_011 TLSSPTRTILSSTPVLSTETITSGITNTTPLSTLVTTLPTTISRSTPTSETTYTTSPTST
290 300 310 320 330 340
440 450 460 470 480
pF1KSD ASGAMTTSLMTVPSSGVMSTE-QMSATASRVMSAQLT------MAKTSGAMPTGSMKAVA
.. . : ... .:..::: .. :.: . ... . .. :. . . : . .
XP_011 VTDSTTKIAYSTSMTGTLSTETSLPPTSSSLPTTETATTPMTNLVTTTTEISSHSTPSFS
350 360 370 380 390 400
490 500 510 520 530
pF1KSD KQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS------GSMSML
.. .:.: . .. ::::.: :. . . .: . ..: .:.:.. :: ..:
XP_011 SSTIYSTVSTSTTAISSLPPTSGTMVTSTTMTPSSLSTDIP-FTTPTTITHHSVGSTGFL
410 420 430 440 450 460
540 550 560 570 580
pF1KSD QMRAPVSEAMSMPQMRTMASGL---------TSAAQMKAMTSGAMST--PLMTAQTSGST
. .. .... . .:.... : .... .:::.. . : ... : :
XP_011 TTATDLTSTFTVSSSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPNVRPTFVSTLSTPT
470 480 490 500 510 520
590 600 610 620 630 640
pF1KSD STLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDT
:.:: :. .: . : :. . .. . .: :: . . ::. : :: :
XP_011 SSLLTTFPATYSFSSSMSASSAGTTHTESISSPPASTSTL---HTTAESTLAPTTTTSFT
530 540 550 560 570
650 660 670 680 690 700
pF1KSD VSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQM------TATVSGGMSMPLMRAQDP
.: .. :. : ...: .... .::. .:. : ... .:. : . ..
XP_011 TSTTMEPPSTTAATTGTGQTTFTSSTATFPETTTPTPTTDMSTESLTTAMTSPPITSSVT
580 590 600 610 620 630
710 720 730 740 750
pF1KSD GVMPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKS---MTAGGMQMNSPTSDVMSTPTV
.. .. : . .: .. ... .: .:. : .:.: .. :. : . ::
XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP
640 650 660 670 680 690
760 770 780 790 800 810
pF1KSD RAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-MRAPASGEIATPLRSPAYGAM
: .: : : . .: : :. ..:. :.. : : .: . : :: .
XP_011 NA-SSMTTSETTYPNSPTG--PG----TNSTTEITYPTTMTETSSTATSLPPTSPLVS--
700 710 720 730 740 750
820 830 840 850 860 870
pF1KSD SAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDS---RVTSTSQ
.: . ....... .. . . ... . :::: .. . .: . :::::.
XP_011 TAKTAKTPTTNLVTTTTKTTSHSTTSFTSSTVYSTAST-YTTAITSVPTTLGTMVTSTSM
760 770 780 790 800
880 890 900 910 920 930
pF1KSD MMPTAS-GDMCTLPVR-APASGGVSS--PLVRAPAS-GTMSTPLRRPSACETVSTELMRA
. :.: : . :. .:.: :.:. :.. .: :.:. ::.. : .. .
XP_011 ISSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSSPTVQNT
810 820 830 840 850 860
940 950 960 970 980
pF1KSD SASGHMSTAQTTAMV-SGGMSKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATS
: .:...:.: . ::: : . ..: : : ..: :. . .:. ....
XP_011 EIS--ISVSMTSATTPSGG---PTF----TSTENTPTRSLLTSFPMTHSFSSSMSESSAG
870 880 890 900 910 920
990 1000 1010 1020 1030 1040
pF1KSD TLQT-SVANSRSMSLSQTTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRAT
: .: :... :. :: :. . ..: : . .::: ....: : : .:
XP_011 TTHTESISSPRG-----TTSTLHTTVESTP-----SPTTTTSF----TTSTMMEP-PSST
930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KSD ASGCGMGMS-MPQMTATDSRGMSTPLMRASGPGT-MSTPQTAFGVMSTPEIKATDSGEAS
.: : :.. .:. ::: : . : : .:: . . .. : : .... . .
XP_011 VSTTGRGQTTFPSSTAT------FPETTTLTPTTDISTVSLTTAMTSPPPVSSSITPTNT
970 980 990 1000 1010
1110 1120 1130 1140 1150 1160
pF1KSD TSHINITASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEE
. . :. :. .. : . : ::: :.:
XP_011 MTSMRTTTYWPTATNTLSPLTSSILSSTP--VPSTEMITSHTTNTTPLSTLVTTLLTTIT
1020 1030 1040 1050 1060 1070
1170 1180 1190 1200 1210 1220
pF1KSD EMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIY
XP_011 RSTPTSETTYPTSPTSIVSDSTTEITYSTSITGTLSTATTLPPTSSSLPTTETATMTPTT
1080 1090 1100 1110 1120 1130
>--
initn: 145 init1: 60 opt: 381 Z-score: 195.4 bits: 49.8 E(85289): 0.00038
Smith-Waterman score: 556; 22.2% identity (53.0% similar) in 1124 aa overlap (52-1141:1082-2128)
30 40 50 60 70 80
pF1KSD QNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPLMGV
.. .. : . .. . : . :.:. . :.
XP_011 TEMITSHTTNTTPLSTLVTTLLTTITRSTPTSETTYPTSPTSIVSDSTTEITYSTSITGT
1060 1070 1080 1090 1100 1110
90 100 110 120 130
pF1KSD PNSGALSPPL---MPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM
.... :: .:........: . . . : :.. :.:. .::: ..
XP_011 LSTATTLPPTSSSLPTTETATMTPTTTLITTTPNTTSLSTPSFTSSTIYSTVSTSTTAIS
1120 1130 1140 1150 1160 1170
140 150 160 170 180
pF1KSD SPGMMTIPDFGTMSATLMVAP-----DSAEISPLAMPAPSSG-----VVCTPIMST---S
: . : ::: .. ..: :. .: .. :: : .. : . :: :
XP_011 SAS----PTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVGSTGFLTTATDLTSTFTVS
1180 1190 1200 1210 1220
190 200 210 220 230 240
pF1KSD SSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKV
:: :::: .. :.: : ... . ...: . .:: . : ::. :. :..
XP_011 SSSAMSTSVI--PSS----PSIQNTETSSLVSMTSATTPS---LRPT-ITSTDSTLTSSL
1230 1240 1250 1260 1270
250 260 270 280 290 300
pF1KSD LMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSG
: : .. .:: . ... . . . : : :: .: .: .:. :: : :
XP_011 LTTFPSTYSFSSSMSASSAGTTHTETISSLPASTNT---IHTTAESALAPTTTTSFTTSP
1280 1290 1300 1310 1320 1330
310 320 330 340 350
pF1KSD IMS--SLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPD--AEAMSPALMTALP--SGVM
: : ... :. . : :. : .:: :. : .:... :. .. : :..
XP_011 TMEPPSTTVATTGTGQTTFPS-STATFLETTTLT-PTTDFSTESLTTAMTSTPPITSSIT
1340 1350 1360 1370 1380 1390
360 370 380 390 400 410
pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAP
::.:: . . . : : .. .: :. .:...:. :: . . . : :
XP_011 PTDTMTSMRT--TTSWPTA---TNTLS--PL---TSSILSSTPVPSTEV-TTSHTTNTNP
1400 1410 1420 1430 1440
420 430 440 450 460 470
pF1KSD ASGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTG
.: ..:: :. : :: . ::: . .. . .. . . : . ... ::.
XP_011 VSTLVTTLPITITRS--TLTSETAYPSSPTSTVTESTTEITYPTTMTETSSTATSLPPTS
1450 1460 1470 1480 1490
480 490 500 510 520 530
pF1KSD SMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS-GSMSM
:. ..:. : :.. .: . .. ..... . .::: : . .::.. :.:
XP_011 SLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTAS-TPTTAITSVPTTLGTMVT
1500 1510 1520 1530 1540 1550
540 550 560 570 580 590
pF1KSD LQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGST-STLLMRDTA
: . . ..: .: :. . .. ::.. :.:: :: : :.. : :
XP_011 STSMIPSTVSTGIP-----TSQPTTITPSSVGISGSL--PMMTDLTSVYTVSSMSARPT-
1560 1570 1580 1590 1600 1610
600 610 620 630 640 650
pF1KSD SGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMP
: . : : ... .. . . . : ..: :: .: . . .. . . :...:
XP_011 SVIPSSPTVQNTETSIFVSMMSATTPSGGPTFTSTENTPTRSLLTSFPVTHSFSSSMSAS
1620 1630 1640 1650 1660 1670
660 670 680 690 700 710
pF1KSD QMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSG
.. : . ..:. .: .:.. : . . ::. . .. :.: . . .:
XP_011 SVGTTHTQSISSP--PAITSTLHTTAESTPSPTTTMSFTTFTKMET---PSSTVATTGTG
1680 1690 1700 1710 1720
720 730 740 750 760 770
pF1KSD KMLSQPMSTQDPGGMSMSPMKSMTAGGMQM---NSP--TSDVMSTPTVRAWTSETMSTPL
. .. .: ...: .....:... ..: ::.. :: :: :: : .:::
XP_011 QTTFTSSTATSPKTTTLTPTSDISTGSFKTAVSSTPPITSSITSTYTV---TSMTTTTPL
1730 1740 1750 1760 1770 1780
780 790 800 810 820 830
pF1KSD MRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMM
:. . ::. . .::: .: .: .:: : : ..: . ..: ..
XP_011 GPTAT-NTLPSFTSSVSSS--TPVPSTEAITSGTTNTTPLSTLVTTFSNSDTSSTPTSE-
1790 1800 1810 1820 1830
840 850 860 870 880 890
pF1KSD SSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRA
...: . ...:.. ::.: : .:. : : ::: . ::.:. . :. . .
XP_011 TTYP---TSLTSALTDSTTRTTYSTNMTGTL-----STVTS---LRPTSSSLLTTVTATV
1840 1850 1860 1870 1880
900 910 920 930 940
pF1KSD PASGGVSSPL-VRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGM-
:... :.. . . .. .... . .. :: : : ..: . :..::.. . ..
XP_011 PTTNLVTTTTKITSHSTPSFTSSI---ATTETPSHSTPRFTSS--IRTTETTSYSTPSFT
1890 1900 1910 1920 1930 1940
950 960 970 980 990 1000
pF1KSD SKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYT
:. . .: . : ...... : ...:. :.: :: .: :. : :
XP_011 SSNTITETTSHSTP-SYITSITTTETPSSSTPSFSSSITTTETTS--HSTPGFTSSITTT
1950 1960 1970 1980 1990
1010 1020 1030 1040 1050 1060
pF1KSD VSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRATASGCGMGMSMPQMTATDSRGM
. .: . .: . ...:: : ..:. . .. . .. .:.: . .
XP_011 ETTSHSTPSFTSSITTTETTSHDTPSFTSSITTSETPSHSTPSSTSL----ITTTKTTSH
2000 2010 2020 2030 2040 2050
1070 1080 1090 1100 1110 1120
pF1KSD STPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEAS--TSHINITASGSKPTSHMTATT
::: . .: : .: ..: . :. : : .. :: :. : ..:. :. .:..
XP_011 STPSFTSSITTTETTSHSAHSFTSSITTTETTSHNTRSFTSSITTTETNSHSTTSFTSSI
2060 2070 2080 2090 2100 2110
1130 1140 1150 1160 1170 1180
pF1KSD PETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSERMA
:.. . .:::
XP_011 T-TTETTSHSTPSFSSSITTTETPLHSTPGLTSWVTTTKTTSHITPGLTSSITTTETTSH
2120 2130 2140 2150 2160 2170
>>XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A isofor (3143 aa)
initn: 76 init1: 76 opt: 369 Z-score: 189.7 bits: 48.7 E(85289): 0.0008
Smith-Waterman score: 492; 21.4% identity (53.4% similar) in 1089 aa overlap (127-1145:16-1056)
100 110 120 130 140 150
pF1KSD SGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVMSPGMMTIPDFGTMSATLM
:: . . . : ... .: . ::.:
XP_016 MQLLGLLGLLWMLKASPWATGTLSTATSISQVPFPRAEAASAVLS
10 20 30 40
160 170 180 190 200
pF1KSD VAPDSAEIS--PLAMP---APSSGVVCTPIMSTSSSEA---MSTPLMLAPDSGELSPILM
.: : ... ::..: .:. : . :. ..: .: :. .: :.. :
XP_016 NSPHSRDLAGWPLGVPQLASPAPGHRENAPMTLTTSPHDTLISETLLNSPVSSNTSTTPT
50 60 70 80 90 100
210 220 230 240 250 260
pF1KSD QDMNPGVMSTQP---VPAPSSEAMSPLQITDEDTEAMSKVLMT---ALASGEISSLLMSG
. . : .: : : . ..: . : .. .. : . : :..:. :. . .
XP_016 SKFAFKVETTPPTVLVYSATTECVYPTSFIITISHPTSICVTTTQVAFTSSYTSTPVTQK
110 120 130 140 150 160
270 280 290 300 310 320
pF1KSD TDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSGIMSS--LLMSSPGSEVM
. . :. :... .: :: . .: ... . ::... :.. .. . .. .: .
XP_016 PVTTVTSTYSMTTTEKG-TSAMTSSPSTTTARETPIVTVTPSSVSATDTTFHTTISSTTR
170 180 190 200 210 220
330 340 350 360 370
pF1KSD STPLLSVPDAGEMSTLPKPAPDAEAMSPALMTALP--SGVMPTQTMPAPGSGAMSPWSTQ
.: .: .: . : .:.: ... :. .. : :.. :.:. . . : .: .:.
XP_016 TTERTPLP-TGSIHTTTSPTPVFTTLKTAVTSTSPITSSITSTNTVTSMTTTASQPTATN
230 240 250 260 270 280
380 390 400 410 420 430
pF1KSD NVDSE---MMSNPPVRAT---ASGVMSAPPVRALDSGAMSTPLMGAPASGNMSTLQKTVP
...: ..:. :: .: .::. .. :. .: . .: ..:.: . : . :
XP_016 TLSSPTRTILSSTPVLSTETITSGITNTTPLSTLVTTLPTTISRSTPTSETTYTTSPTST
290 300 310 320 330 340
440 450 460 470 480
pF1KSD ASGAMTTSLMTVPSSGVMSTE-QMSATASRVMSAQLT------MAKTSGAMPTGSMKAVA
.. . : ... .:..::: .. :.: . ... . .. :. . . : . .
XP_016 VTDSTTKIAYSTSMTGTLSTETSLPPTSSSLPTTETATTPMTNLVTTTTEISSHSTPSFS
350 360 370 380 390 400
490 500 510 520 530
pF1KSD KQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS------GSMSML
.. .:.: . .. ::::.: :. . . .: . ..: .:.:.. :: ..:
XP_016 SSTIYSTVSTSTTAISSLPPTSGTMVTSTTMTPSSLSTDIP-FTTPTTITHHSVGSTGFL
410 420 430 440 450 460
540 550 560 570 580
pF1KSD QMRAPVSEAMSMPQMRTMASGL---------TSAAQMKAMTSGAMST--PLMTAQTSGST
. .. .... . .:.... : .... .:::.. . : ... : :
XP_016 TTATDLTSTFTVSSSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPNVRPTFVSTLSTPT
470 480 490 500 510 520
590 600 610 620 630 640
pF1KSD STLLMRDTASGVMSCPQMRSLASGALSKPLMTPKASGTMFTEKMTTTASEAMPTLLMRDT
:.:: :. .: . : :. . .. . .: :: . . ::. : :: :
XP_016 SSLLTTFPATYSFSSSMSASSAGTTHTESISSPPASTSTL---HTTAESTLAPTTTTSFT
530 540 550 560 570
650 660 670 680 690 700
pF1KSD VSGALSMPQMTDTASGGLSASLMRDTASGAMSTSQM------TATVSGGMSMPLMRAQDP
.: .. :. : ...: .... .::. .:. : ... .:. : . ..
XP_016 TSTTMEPPSTTAATTGTGQTTFTSSTATFPETTTPTPTTDMSTESLTTAMTSPPITSSVT
580 590 600 610 620 630
710 720 730 740 750
pF1KSD GVMPASLMRAKVSGKMLSQPMSTQDPGGMSMSPMKS---MTAGGMQMNSPTSDVMSTPTV
.. .. : . .: .. ... .: .:. : .:.: .. :. : . ::
XP_016 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP
640 650 660 670 680 690
760 770 780 790 800 810
pF1KSD RAWTSETMSTPLMRTSDPGERPSLLTRASSSGEMSLPL-MRAPASGEIATPLRSPAYGAM
: .: : : . .: : :. ..:. :.. : : .: . : :: .
XP_016 NA-SSMTTSETTYPNSPTG--PG----TNSTTEITYPTTMTETSSTATSLPPTSPLVS--
700 710 720 730 740 750
820 830 840 850 860 870
pF1KSD SAPQMTATASGMMSSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDS---RVTSTSQ
.: . ....... .. . . ... . :::: .. . .: . :::::.
XP_016 TAKTAKTPTTNLVTTTTKTTSHSTTSFTSSTVYSTAST-YTTAITSVPTTLGTMVTSTSM
760 770 780 790 800
880 890 900 910 920 930
pF1KSD MMPTAS-GDMCTLPVR-APASGGVSS--PLVRAPAS-GTMSTPLRRPSACETVSTELMRA
. :.: : . :. .:.: :.:. :.. .: :.:. ::.. : .. .
XP_016 ISSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSSPTVQNT
810 820 830 840 850 860
940 950 960 970 980
pF1KSD SASGHMSTAQTTAMV-SGGMSKPLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATS
: .:...:.: . ::: : . ..: : : ..: :. . .:. ....
XP_016 EIS--ISVSMTSATTPSGG---PTF----TSTENTPTRSLLTSFPMTHSFSSSMSESSAG
870 880 890 900 910 920
990 1000 1010 1020 1030 1040
pF1KSD TLQT-SVANSRSMSLSQTTYTVSGRMATAPIRASASGARSTSFMRASVSGSMPMPLPRAT
: .: :... :. :: :. . ..: : . .::: ....: : : .:
XP_016 TTHTESISSPRG-----TTSTLHTTVESTP-----SPTTTTSF----TTSTMMEP-PSST
930 940 950 960
1050 1060 1070 1080 1090 1100
pF1KSD ASGCGMGMS-MPQMTATDSRGMSTPLMRASGPGT-MSTPQTAFGVMSTPEIKATDSGEAS
.: : :.. .:. ::: : . : : .:: . . .. : : .... . .
XP_016 VSTTGRGQTTFPSSTAT------FPETTTLTPTTDISTVSLTTAMTSPPPVSSSITPTNT
970 980 990 1000 1010
1110 1120 1130 1140 1150 1160
pF1KSD TSHINITASGSKPTSHMTATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEE
. . :. :. .. : . : ::: :.:
XP_016 MTSMRTTTYWPTATNTLSPLTSSILSSTP--VPSTEMITSHTTNTTPLSTLVTTLLTTIT
1020 1030 1040 1050 1060 1070
1170 1180 1190 1200 1210 1220
pF1KSD EMEIDEEKQMKGFLDDSERMAFLVSLHLGAAERWFILQMEVGEPLSHENKSFLRRSQGIY
XP_016 RSTPTSETTYPTSPTSIVSDSTTEITYSTSITGTLSTATTLPPTSSSLPTTETATMTPTT
1080 1090 1100 1110 1120 1130
>--
initn: 145 init1: 60 opt: 381 Z-score: 195.3 bits: 49.8 E(85289): 0.00039
Smith-Waterman score: 559; 22.6% identity (52.2% similar) in 1127 aa overlap (52-1141:1082-2127)
30 40 50 60 70 80
pF1KSD QNKQMAFCRPMTETRADVQILHSHVQLPIVSTSASDPGGTSTQLMTSPVFDTMSAPLMGV
.. .. : . .. . : . :.:. . :.
XP_016 TEMITSHTTNTTPLSTLVTTLLTTITRSTPTSETTYPTSPTSIVSDSTTEITYSTSITGT
1060 1070 1080 1090 1100 1110
90 100 110 120 130
pF1KSD PNSGALSPPL---MPASDSGALSPLLMPASDSGALSPLLMPALDSGTLSPLLSTSEYGVM
.... :: .:........: . . . : :.. :.:. .::: ..
XP_016 LSTATTLPPTSSSLPTTETATMTPTTTLITTTPNTTSLSTPSFTSSTIYSTVSTSTTAIS
1120 1130 1140 1150 1160 1170
140 150 160 170 180
pF1KSD SPGMMTIPDFGTMSATLMVAP-----DSAEISPLAMPAPSSG-----VVCTPIMST---S
: . : ::: .. ..: :. .: .. :: : .. : . :: :
XP_016 SAS----PTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVGSTGFLTTATDLTSTFTVS
1180 1190 1200 1210 1220
190 200 210 220 230 240
pF1KSD SSEAMSTPLMLAPDSGELSPILMQDMNPGVMSTQPVPAPSSEAMSPLQITDEDTEAMSKV
:: :::: .. :.: : ... . ...: . .:: . : ::. :. :..
XP_016 SSSAMSTSVI--PSS----PSIQNTETSSLVSMTSATTPS---LRPT-ITSTDSTLTSSL
1230 1240 1250 1260 1270
250 260 270 280 290 300
pF1KSD LMTALASGEISSLLMSGTDSEAISSLIMSAVASGGTSPQPTSTQNSGGIPTPLMSDLDSG
: : .. .:: . ... . . . : : :: .: .: .:. :: : :
XP_016 LTTFPSTYSFSSSMSASSAGTTHTETISSLPASTNT---IHTTAESALAPTTTTSFTTSP
1280 1290 1300 1310 1320 1330
310 320 330 340 350
pF1KSD IMS--SLLMSSPGSEVMSTPLLSVPDAGEMSTLPKPAPD--AEAMSPALMTALP--SGVM
: : ... :. . : :. : .:: :. : .:... :. .. : :..
XP_016 TMEPPSTTVATTGTGQTTFPS-STATFLETTTLT-PTTDFSTESLTTAMTSTPPITSSIT
1340 1350 1360 1370 1380 1390
360 370 380 390 400 410
pF1KSD PTQTMPAPGSGAMSPWSTQNVDSEMMSNPPVRATASGVMSAPPVRALDSGAMSTPLMGAP
::.:: . . . : : .. .: :. .:...:. :: . . . : :
XP_016 PTDTMTSMRT--TTSWPTA---TNTLS--PL---TSSILSSTPVPSTEV-TTSHTTNTNP
1400 1410 1420 1430 1440
420 430 440 450 460 470
pF1KSD ASGNMSTLQKTVPASGAMTTSLMTVPSSGVMSTEQMSATASRVMSAQLTMAKTSGAMPTG
.: ..:: :. : :: . ::: . .. . .. . . : . ... ::.
XP_016 VSTLVTTLPITITRS--TLTSETAYPSSPTSTVTESTTEITYPTTMTETSSTATSLPPTS
1450 1460 1470 1480 1490
480 490 500 510 520 530
pF1KSD SMKAVAKQYKRATASGKMSTPLRRAPTSGAMSTQPVTATASETMSMPQLTVPAS-GSMSM
:. ..:. : :.. .: . .. ..... . .::: : . .::.. :.:
XP_016 SLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTAS-TPTTAITSVPTTLGTMVT
1500 1510 1520 1530 1540 1550
540 550 560 570 580 590
pF1KSD LQMRAPVSEAMSMPQMRTMASGLTSAAQMKAMTSGAMSTPLMTAQTSGST-STLLMRDTA
: . . ..: .: :. . .. ::.. :.:: :: : :.. : :
XP_016 STSMIPSTVSTGIP-----TSQPTTITPSSVGISGSL--PMMTDLTSVYTVSSMSARPT-
1560 1570 1580 1590 1600 1610
600 610 620 630 640 650
pF1KSD SGVMSCPQMRSLASGALSKPL-MTPKASGTMFTEKMTTTASEAMPTLLMRDTVSGALSMP
: . : : ... .. . . . : ..: :: .: . . .. . . :...:
XP_016 SVIPSSPTVQNTETSIFVSMMSATTPSGGPTFTSTENTPTRSLLTSFPVTHSFSSSMSAS
1620 1630 1640 1650 1660 1670
660 670 680 690 700 710
pF1KSD QMTDTASGGLSASLMRDTASGAMSTSQMTATVSGGMSMPLMRAQDPGVMPASLMRAKVSG
.. : . ..:. .: .:.. : . . ::. . .. :.: . . .:
XP_016 SVGTTHTQSISSP--PAITSTLHTTAESTPSPTTTMSFTTFTKMET---PSSTVATTGTG
1680 1690 1700 1710 1720
720 730 740 750 760 770
pF1KSD KMLSQPMSTQDPGGMSMSPMKSMTAGGMQM---NSP--TSDVMSTPTVRAWTSETMSTPL
. .. .: ...: .....:... ..: ::.. :: :: :: : .:::
XP_016 QTTFTSSTATSPKTTTLTPTSDISTGSFKTAVSSTPPITSSITSTYTV---TSMTTTTPL
1730 1740 1750 1760 1770 1780
780 790 800 810 820 830
pF1KSD MRTSDPGERPSLLTRASSSGEMSLPLMRAPASGEIATPLRSPAYGAMSAPQMTATASGMM
:. . ::. . .::: .: .: .:: : : ..: . ..: ..
XP_016 GPTAT-NTLPSFTSSVSSS--TPVPSTEAITSGTTNTTPLSTLVTTFSNSDTSSTPTSE-
1790 1800 1810 1820 1830
840 850 860 870 880 890
pF1KSD SSMPQVKAPISGAMSMPLTRSTASGGMSMPLMRAPDSRVTSTSQMMPTASGDMCTLPVRA
...: . ...:.. ::.: : .:. : : ::: . ::.:. . :. . .
XP_016 TTYP---TSLTSALTDSTTRTTYSTNMTGTL-----STVTS---LRPTSSSLLTTVTATV
1840 1850 1860 1870 1880
900 910 920 930 940 950
pF1KSD PASGGVSSPLVRAPASGTMSTPLRRPSACETVSTELMRASASGHMSTAQTTAMVSGGMSK
:... :.. : : :: ...: . .. ..... ::. . . :
XP_016 PTTNLVTTT--------TKITSHSTPSFTSSIATTETPSHSTPRFTSSITTTE-TPSHST
1890 1900 1910 1920 1930
960 970 980 990 1000 1010
pF1KSD PLMRAPASGTMPMPLMSAMASGEMSMPLMETMASGATSTLQTSVANSRSMSLSQTTYTVS
: : .: : . : :. :: .: : .: .:...... : : .::
XP_016 P--RFTSSITNTKTTSHSSPSFTSSITTTET-TSHNTPSLTSSITTTKTTSHSTPSYT--
1940 1950 1960 1970 1980 1990
1020 1030 1040 1050 1060
pF1KSD GRMATAPIRASASGARSTSFMRASVSGSMPMP-LPRATASGCGMGMSMPQMTA---TDSR
. :. .: : :: . .. . : : : . .. . : :..:. :..
XP_016 -SLITTTTTTSHSTPSFTSSITTTETTSHNTPSLTSSITTTETTSHSTPSFTSSITTETT
2000 2010 2020 2030 2040 2050
1070 1080 1090 1100 1110 1120
pF1KSD GMSTPLMRASGPGTMSTPQTAFGVMSTPEIKATDSGEASTSHINITASGSKPTSHMT---
. ::: . . : : ..... : : .:.. :: .. . . .. ::: :
XP_016 SHSTPSFTSLITITEITSHSTLSY--TTSITTTETPSHSTLSFTSSITTTETTSHSTPSF
2060 2070 2080 2090 2100 2110
1130 1140 1150 1160 1170 1180
pF1KSD ATTPETAKPPPKEVPSFGMLTPALCYLLEEQEAARGSCSVEEEMEIDEEKQMKGFLDDSE
... :.. : . .:::
XP_016 TSSITTSEMPSHSTPSFTSSITTTENATHSTPNFTSSITTTETTSHSTPSFTSLITTTET
2120 2130 2140 2150 2160 2170
1388 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:48:41 2016 done: Thu Nov 3 05:48:44 2016
Total Scan time: 18.390 Total Display time: 1.090
Function used was FASTA [36.3.4 Apr, 2011]