FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1237, 1482 aa
1>>>pF1KA1237 1482 - 1482 aa - 1482 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.4636+/-0.000457; mu= -8.5756+/- 0.029
mean_var=427.6664+/-88.498, 0's: 0 Z-trim(121.4): 142 B-trim: 256 in 2/53
Lambda= 0.062019
statistics sampled from 37856 (38014) to 37856 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.723), E-opt: 0.2 (0.446), width: 16
Scan time: 16.240
The best scores are: opt bits E(85289)
XP_005247723 (OMIM: 614182) PREDICTED: protein HEG (1481) 9583 873.1 0
NP_065784 (OMIM: 614182) protein HEG homolog 1 pre (1381) 5587 515.6 1.1e-144
NP_001291288 (OMIM: 158373) mucin-5AC precursor [H (5654) 459 57.2 4.3e-06
NP_001035194 (OMIM: 608424) mucin-17 precursor [Ho (4493) 441 55.5 1.1e-05
NP_002448 (OMIM: 158370) mucin-2 precursor [Homo s (5289) 386 50.6 0.00038
NP_001309397 (OMIM: 158372) mucin-4 isoform f prec (7418) 388 50.9 0.00044
XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A is (3076) 372 49.2 0.0006
XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A is (3143) 372 49.2 0.00061
XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A is (3245) 372 49.2 0.00062
XP_006720482 (OMIM: 155760,165800,608361,612813) P (2568) 369 48.9 0.00062
XP_011514549 (OMIM: 158371) PREDICTED: mucin-3A is (3296) 372 49.2 0.00063
XP_011514548 (OMIM: 158371) PREDICTED: mucin-3A is (3313) 372 49.2 0.00063
NP_005951 (OMIM: 158371) mucin-3A precursor [Homo (3323) 372 49.2 0.00063
NP_001186930 (OMIM: 102500,600275,610205) neurogen (1235) 327 44.9 0.0048
NP_001157570 (OMIM: 118661,143200) versican core p (1642) 323 44.6 0.0077
XP_005270958 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081
XP_016856862 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081
XP_011539822 (OMIM: 102500,600275,610205) PREDICTE (2432) 327 45.1 0.0081
XP_016856861 (OMIM: 102500,600275,610205) PREDICTE (2455) 327 45.1 0.0082
XP_011539821 (OMIM: 102500,600275,610205) PREDICTE (2467) 327 45.1 0.0082
NP_077719 (OMIM: 102500,600275,610205) neurogenic (2471) 327 45.1 0.0082
>>XP_005247723 (OMIM: 614182) PREDICTED: protein HEG hom (1481 aa)
initn: 9490 init1: 9490 opt: 9583 Z-score: 4650.4 bits: 873.1 E(85289): 0
Smith-Waterman score: 9583; 99.9% identity (99.9% similar) in 1482 aa overlap (1-1482:1-1481)
10 20 30 40 50 60
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR
::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::
XP_005 MASPRASRWPPPLLLLLLPLLLL-PPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KA1 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA
180 190 200 210 220 230
250 260 270 280 290 300
pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL
::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 MGLSEEWTVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF
300 310 320 330 340 350
370 380 390 400 410 420
pF1KA1 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF
360 370 380 390 400 410
430 440 450 460 470 480
pF1KA1 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG
420 430 440 450 460 470
490 500 510 520 530 540
pF1KA1 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ
480 490 500 510 520 530
550 560 570 580 590 600
pF1KA1 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH
540 550 560 570 580 590
610 620 630 640 650 660
pF1KA1 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS
600 610 620 630 640 650
670 680 690 700 710 720
pF1KA1 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA
660 670 680 690 700 710
730 740 750 760 770 780
pF1KA1 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP
720 730 740 750 760 770
790 800 810 820 830 840
pF1KA1 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP
780 790 800 810 820 830
850 860 870 880 890 900
pF1KA1 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV
840 850 860 870 880 890
910 920 930 940 950 960
pF1KA1 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KA1 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KA1 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KA1 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM
1080 1090 1100 1110 1120 1130
1150 1160 1170 1180 1190 1200
pF1KA1 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT
1140 1150 1160 1170 1180 1190
1210 1220 1230 1240 1250 1260
pF1KA1 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE
1200 1210 1220 1230 1240 1250
1270 1280 1290 1300 1310 1320
pF1KA1 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC
1260 1270 1280 1290 1300 1310
1330 1340 1350 1360 1370 1380
pF1KA1 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND
1320 1330 1340 1350 1360 1370
1390 1400 1410 1420 1430 1440
pF1KA1 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP
1380 1390 1400 1410 1420 1430
1450 1460 1470 1480
pF1KA1 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF
::::::::::::::::::::::::::::::::::::::::::
XP_005 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF
1440 1450 1460 1470 1480
>>NP_065784 (OMIM: 614182) protein HEG homolog 1 precurs (1381 aa)
initn: 8862 init1: 5561 opt: 5587 Z-score: 2718.5 bits: 515.6 E(85289): 1.1e-144
Smith-Waterman score: 8759; 93.0% identity (93.1% similar) in 1482 aa overlap (1-1482:1-1381)
10 20 30 40 50 60
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR
::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::
NP_065 MASPRASRWPPPLLLLLLPLLLL-PPAAPGTRDPPPSPARRALSLAPLAGAGLELQLERR
10 20 30 40 50
70 80 90 100 110 120
pF1KA1 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KA1 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 HVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA
180 190 200 210 220 230
250 260 270 280 290 300
pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL
::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 MGLSEEWTVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSLTVSLGPVSKTEGF
300 310 320 330 340 350
370 380 390 400 410 420
pF1KA1 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 PKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTF
360 370 380 390 400 410
430 440 450 460 470 480
pF1KA1 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 GEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEG
420 430 440 450 460 470
490 500 510 520 530 540
pF1KA1 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQ
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 VNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERS----------
480 490 500 510 520
550 560 570 580 590 600
pF1KA1 ALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMH
NP_065 ------------------------------------------------------------
610 620 630 640 650 660
pF1KA1 QETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSS
.:::::::::::::::::::::::::::::
NP_065 ------------------------------IAGISYGQVRGTAIEQRTSSDHTDHTYLSS
530 540 550
670 680 690 700 710 720
pF1KA1 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 TFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYA
560 570 580 590 600 610
730 740 750 760 770 780
pF1KA1 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 QPSTESPVLHTSNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP
620 630 640 650 660 670
790 800 810 820 830 840
pF1KA1 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 SVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQTTLP
680 690 700 710 720 730
850 860 870 880 890 900
pF1KA1 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 QSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPSLV
740 750 760 770 780 790
910 920 930 940 950 960
pF1KA1 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 SLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTPGT
800 810 820 830 840 850
970 980 990 1000 1010 1020
pF1KA1 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 LSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPLTS
860 870 880 890 900 910
1030 1040 1050 1060 1070 1080
pF1KA1 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 VPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTT
920 930 940 950 960 970
1090 1100 1110 1120 1130 1140
pF1KA1 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 VSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAM
980 990 1000 1010 1020 1030
1150 1160 1170 1180 1190 1200
pF1KA1 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 CNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKT
1040 1050 1060 1070 1080 1090
1210 1220 1230 1240 1250 1260
pF1KA1 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 LNMCFSALPSYIRSTVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAE
1100 1110 1120 1130 1140 1150
1270 1280 1290 1300 1310 1320
pF1KA1 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 VCQLLGSQRRIFRAGSLCKRKSPECDKDTSICTDLDGVALCQCKSGYFQFNKMDHSCRAC
1160 1170 1180 1190 1200 1210
1330 1340 1350 1360 1370 1380
pF1KA1 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 EDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTCCRKNKND
1220 1230 1240 1250 1260 1270
1390 1400 1410 1420 1430 1440
pF1KA1 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_065 ISKLIFKSGDFQMSPYAEYPKNPRSQEWGREAIEMHENGSTKNLLQMTDVYYSPTSVRNP
1280 1290 1300 1310 1320 1330
1450 1460 1470 1480
pF1KA1 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF
::::::::::::::::::::::::::::::::::::::::::
NP_065 ELERNGLYPAYTGLPGSRHSCIFPGQYNPSFISDESRRRDYF
1340 1350 1360 1370 1380
>>NP_001291288 (OMIM: 158373) mucin-5AC precursor [Homo (5654 aa)
initn: 457 init1: 190 opt: 459 Z-score: 230.3 bits: 57.2 E(85289): 4.3e-06
Smith-Waterman score: 547; 22.5% identity (51.5% similar) in 1273 aa overlap (96-1296:3637-4823)
70 80 90 100 110 120
pF1KA1 PPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAW-KHWPESNTEAHVEN
::::: .. ..: : . . . . .
NP_001 MCLNYEVRVLCCETPKGCPVTSTSVTAPSTPSGRATSPTQSTSSWQKSRTTTLVTSSITS
3610 3620 3630 3640 3650 3660
130 140 150 160 170 180
pF1KA1 ITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGR----SGSSSRT
: .. .: .. .. ::. . ....:: . : : :... . ..:. .
NP_001 TTQTSTTSAPTTSTTPASIPSTTSAPTTSTTSAPTTSTTSAPTTSTTSTPQTTTSSAPTS
3670 3680 3690 3700 3710 3720
190 200 210 220 230 240
pF1KA1 NFTILPVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERA
. : :. .. :. : .. . .. : :..: .: :.. .: .: :
NP_001 STTSAPTTSTISAPTTSTISAPTTSTTSAPTASTTSAPTSTSSAPTTNTTSAPTTSTTSA
3730 3740 3750 3760 3770 3780
250 260 270 280 290 300
pF1KA1 MGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPL
: : .:::. . : . . . .::. . .:: : : ..:.:
NP_001 PITST--ISAPTTSTTSTPQTSTISSPTTSTTSTPQTSTTSS-PTTS-------TTSAPT
3790 3800 3810 3820 3830
310 320 330 340 350
pF1KA1 LDLSSSSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRT--LRSLTVSLGPVSKTE
. .:. .. . .:...:. .:.: . .:.... : ... ... :.:.:
NP_001 TSTTSAPTTSTTSTPQTSISSAPTSSTTSAPTASTISAPTTSTTSFHTTSTTSPPTSSTS
3840 3850 3860 3870 3880 3890
360 370 380 390 400
pF1KA1 GFPKDSRIATTSSSVL----LSPSAVESRRNSRVTGNPGDEEFIEPSTENEFGL------
. :. :. ....::. .:: : . .. :. . .. . .:...
NP_001 STPQTSKTSAATSSTTSGSGTTPSPVPTTSTASVSKTSTSHVSVSKTTHSQPVTRDCHPR
3900 3910 3920 3930 3940 3950
410 420 430 440 450 460
pF1KA1 -TSLRWQN-DSPTFGEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNS--
: .: . : :. : : ....:. : . . . : . : : ::: ..:
NP_001 CTWTKWFDVDFPSPGPH--GGDKETYN-NIIRSGEKICR-----RPEEITRLQCRAESHP
3960 3970 3980 3990 4000
470 480 490 500 510
pF1KA1 TTSADVTGS--SASYPEGV---NASVLTQFS---DSTVQSGGSHTALGDRSYSESSSTSS
.: . :. . : ::. : . :. . :. .: : : .. :
NP_001 EVSIEHLGQVVQCSREEGLVCRNQDQQGPFKMCLNYEVRVLCCETPKGCPVTSTPVTAPS
4010 4020 4030 4040 4050 4060
520 530 540 550 560 570
pF1KA1 SESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLR
. : ...: :. . :: . ..... . :...: : .:. .. :
NP_001 TPSGRATSPTQSTSSWQKSRTTTLVTTSTTSTPQTSTTSAP-----TTSTIPASTPSTTS
4070 4080 4090 4100 4110 4120
580 590 600 610 620 630
pF1KA1 SVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTDDMGLVSRSLAASSALGVAGISY
. : ..:: ::: . .: :. : : . .: .:: ... :
NP_001 APTTSTTSAPTTS----TTSAPTHRTTSGPT-----------TSTTLAPTTSTTSAP---
4130 4140 4150 4160
640 650 660 670 680 690
pF1KA1 GQVRGTAIEQRTSSDHTDHTYLSSTFTKGERALLSITDNSSSSDIVESSTSYIKISNSSH
:.: .. : .::.. . . .: .:. :. . :.:: . :..:
NP_001 -----------TTSTNSAPT--TSTISASTTSTISAPTTSTISSPTSSTTSTPQTSKTSA
4170 4180 4190 4200 4210
700 710 720 730 740 750
pF1KA1 SEYSSFFHAQTERSNI--SSYDGEYAQPSTESPVLHTSNLPSYTPTINMPNTSVV-LDTD
. :. . : : . .: . . .: .:. :.. :. ::. .:.::.. :
NP_001 ATSSTTSGSGTTPSPVPTTSTTSASTTSTTSAPTTSTTSGPGTTPS-PVPSTSTTSAATT
4220 4230 4240 4250 4260 4270
760 770 780 790 800 810
pF1KA1 AEFVSDSSSSSSSSSSSSSSGP---PLPLPSVSQSHHLFSSILPSTRASVHLLKSTSDAS
. . .. ..:. .:: .::: : :.:..: . .: . .. . .:: .:
NP_001 STTSAPTTRTTSAPTSSMTSGPGTTPSPVPTTSTTSAPTTSTTSGPGTTPSPVPTTSTTS
4280 4290 4300 4310 4320 4330
820 830 840 850 860
pF1KA1 TPWSSSPS-----PLPVSLTTSTSAPLSVSQTTLPQSSSTPVLPRARETPVTSFQTSTMT
.: .:. : : :: :..:::: ...:: ...:: : . .:: . ::: .
NP_001 APITSTTSGPGSTPSPVPTTSTTSAP--TTSTTSASTASTTSGPGTTPSPVPT--TSTTS
4340 4350 4360 4370 4380
870 880 890 900 910
pF1KA1 SFMTMLHSSQTADLKSQ--STPHQEKVITESKSPSLVSLPTESTKAV----TTNSPLPP-
. : :..::. : ::: . . ...:. . :. ..... :: ::.:
NP_001 APTTRTTSASTASTTSGPGSTPSPVPTTSTTSAPTTRTTPASTASTTSGPGTTPSPVPTT
4390 4400 4410 4420 4430 4440
920 930 940 950 960 970
pF1KA1 SLTESSTEQT--LPATSTNLAQMSPTFTTTILKTSQPLMTTPGTLSSTASLVTGPIAVQT
: : .:: .: ::.:::. : .. ..:. : .:. :: : . :.: ... : .:
NP_001 STTSASTTSTISLPTTSTTSAPIT-SMTSGPGTTPSPVPTTSTTSAPTTSTTSASTA-ST
4450 4460 4470 4480 4490 4500
980 990 1000 1010 1020 1030
pF1KA1 TAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGL--IPLTSVPTSAKEMTTKLGV
:.: . . : :: :: .. .: . . . .::. :. :::.. ::
NP_001 TSGPGTTPS-P---VPTTSTTSAPTTSTTSASTASTTSGPGTSLSPVPTTS---TT----
4510 4520 4530 4540 4550
1040 1050 1060 1070 1080
pF1KA1 TAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQSP-----TTVSSSASVNS
.: . .. . ::.::: :. .:. :: ..: . ..: :: :: :..:..
NP_001 SAPTTSTTSGPGTTPSPVPTTSTTS---APTTSTTSGPGTTPSPVPTTSTTPVSKTSTSH
4560 4570 4580 4590 4600 4610
1090 1100 1110 1120 1130 1140
pF1KA1 CAVNPCLHNGECVADNT-----SRGYHCRCP-PSWQGDDCSVDVNECLSNPCPS-TAMCN
.:. :. ..: .. . : :. .: : .: .: : .:
NP_001 LSVSKTTHSQPVTSDCHPLCAWTKWFDVDFPSPGPHGGD-----KETYNNIIRSGEKICR
4620 4630 4640 4650 4660
1150 1160 1170 1180 1190 1200
pF1KA1 NTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKTLN
. .: . . : .: .: . :.. . .. .. . .... .. : ...:
NP_001 RPEEITRLQCRAESHPEVNIEHLGQ--VVQCSREEGLVCRNQDQQGPFKMCLNYEVRVLC
4670 4680 4690 4700 4710 4720
1210 1220 1230 1240 1250 1260
pF1KA1 MCFSALPSYIRS-TVHASRESNAVVISLQTTFSLASNVTLFDLADRMQKCVNSCKSSAEV
: . . : : ... .::. ::.:.. :: :. ..:. . .: :...
NP_001 -CETPRGCPVTSVTPYGTSPTNALYPSLSTSMVSAS-VASTSVASS-SVASSSVAYSTQT
4730 4740 4750 4760 4770 4780
1270 1280 1290 1300 1310
pF1KA1 CQLLGSQRRIFRAGSLCKRKSPE--------CDKDTSICTDLDGVALCQCKSGYFQFNKM
: . . :.. ::: :. :..: .. .:
NP_001 C-FCNVADRLYPAGSTIYRHRDLAGHCYYALCSQDCQVVRGVDSDCPSTTLPPAPATSPS
4790 4800 4810 4820 4830 4840
1320 1330 1340 1350 1360 1370
pF1KA1 DHSCRACEDGYRLENETCMSCPFGLGGLNCGNPYQLITVVIAAAGGGLLLILGIALIVTC
NP_001 ISTSEPVTELGCPNAVPPRKKGETWATPNCSEATCEGNNVISLRPRTCPRVEKPTCANGY
4850 4860 4870 4880 4890 4900
>--
initn: 494 init1: 190 opt: 459 Z-score: 230.3 bits: 57.2 E(85289): 4.3e-06
Smith-Waterman score: 631; 22.8% identity (53.4% similar) in 1060 aa overlap (96-1114:2233-3226)
70 80 90 100 110 120
pF1KA1 PPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGSADAAWKHWPESNTEAHVENI
::::: .. ..:. .: : . : .
NP_001 MCLNYEVRVLCCETPKGCPVTSTPVTAPSTPSGRATSPTQSTSSWQ---KSRTTTLVTTS
2210 2220 2230 2240 2250
130 140 150 160 170 180
pF1KA1 TFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRSGSSSRTNFTIL
: : : .. . ::. . ...:: . : : :.. . :..
NP_001 TTSTPQ----TSTTYAHTTSTTSAPTARTTSAPTTRTTSASPASTTSGPGNTPS------
2260 2270 2280 2290 2300
190 200 210 220 230 240
pF1KA1 PVGYSLEIATALTSQSGNLASESLHLPSSSSEFDERIAAFQTKSGTASEMGTERAMGLSE
:: . :.. :: .. .. . :.:: : :: .. . . ...
NP_001 PVPTTSTISAPTTSITSAPTTSTTSAPTSS-----------TTSGPGTTPSPVPTTSITS
2310 2320 2330 2340 2350
250 260 270 280 290 300
pF1KA1 EWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWLHFYRTAASSPLLDLSS
.:::: . : : . . :. . :::. . :...: ..
NP_001 A----PTTSTTSAPTTSTTSA-RTSSTTSATTTSRISGPETTPSPVPTTSTTSATTTSTT
2360 2370 2380 2390 2400 2410
310 320 330 340 350 360
pF1KA1 SSESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRS----LTVSLGPVSKTEGFP
:. .: . :. .:: ::.: . :. : .:: : : ... .:...: . :
NP_001 SAPTTSTTSAPTSSTTSS-PQTSTTSAPTTSTTSGPGTTPSPVPTTSTTSAPTTRTTSAP
2420 2430 2440 2450 2460 2470
370 380 390 400 410
pF1KA1 KDSRIATTSSSVLLSPSAV-ESRRNSRVTGNPGDEEFIEPSTE----NEFGLTSLRWQND
:.: .....:. .: .. . .. .:..: :.: . . :: .
NP_001 KSSTTSAATTSTTSGPETTPRPVPTTSTTSSPTTSTTSAPTTSTTSASTTSTTSGAGTTP
2480 2490 2500 2510 2520 2530
420 430 440 450 460 470
pF1KA1 SPTFGEHQLASSSEVQNGSPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSAS
::. .. . ...:.:.: ... ... : : . :.::::: .: :..:
NP_001 SPVPTTSTTSAPTTSTTSAPISSTTSAT-TTSTTSGPGTTPSPVPTTSTTSAPTT-STTS
2540 2550 2560 2570 2580 2590
480 490 500 510 520 530
pF1KA1 YPEGVNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSR
: :.. :.. : ... . ....: ::.::.. . :.:. : . .
NP_001 GP-GTTPSAVPTTSITSAPTTSTNSA------PISSTTSATTTSRISGPETTPSPVPTAS
2600 2610 2620 2630 2640
540 550 560 570 580 590
pF1KA1 EPGQALGDSSANAEDRTSGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPA
. . ..... : ::. .: .. :.. .. : . : . .. ::::: . .:.
NP_001 TTSASTTSTTSGPGTTPSPVPTTSTISVPTTSTTSAST--TSTTSASTTSTTSGPGTTPS
2650 2660 2670 2680 2690 2700
600 610 620 630 640 650
pF1KA1 AAMHQETEGASLHVNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHT
. : .: .:. . . : .. . .... . .. .. .:::. : .
NP_001 PVPTTSTTSAP----TTSTTSAPTTSTISAPTTSTTSATTTSTTSAPTPRRTSAPTT--S
2710 2720 2730 2740 2750
660 670 680 690 700 710
pF1KA1 YLSSTFTKGERALLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYD
.:.. :. : . : ...... . . :. .: .. . ... ..: . :::
NP_001 TISASTTSTTSATTTSTTSATTTSTISAPTTSTTLSPTTSTTSTTI--TSTTSAPISSTT
2760 2770 2780 2790 2800 2810
720 730 740 750 760
pF1KA1 GEYAQPSTESPVLHTSNLPSYT--P-----TINMPNTSVVLDTDAEFVS-DSSSSSSSSS
. .: .:. :.. :. : : : . :.::.. .. .: .::..:...
NP_001 STPQTSTTSAPTTSTTSGPGTTSSPVPTTSTTSAPTTSTTSAPTTRTTSVPTSSTTSTAT
2820 2830 2840 2850 2860 2870
770 780 790 800 810 820
pF1KA1 SSSSSGP---PLPLPSVSQSHHLFSSILPSTRA-SVHLLKSTSDASTPWSSSPSPLPVSL
.:..::: : :.:..: .. :.::. :. ..:: .: .:.:. .:
NP_001 TSTTSGPGTTPSPVPTTS------TTSAPTTRTTSAPTTSTTSAPTTSTTSAPTSSTTSA
2880 2890 2900 2910 2920
830 840 850 860 870 880
pF1KA1 TTST--SAPLSVSQTTLPQSSSTPVLPRARE--TPVTSFQTSTMTSFMTMLHSSQTADLK
::.. :.: ..: :..: .. .:: : . .:.:: ... :: . .. .
NP_001 TTTSTISVP-TTSTTSVPGTTPSPV-PTTSTISVPTTSTTSASTTSTTSGPGTTPSPVPT
2930 2940 2950 2960 2970 2980
890 900 910 920 930
pF1KA1 SQSTPHQEKVITESKSPSLVSLPTEST-KAVTTNSPLPPSLTESSTEQT-LPATSTNLAQ
...: : . . : .: :: :: .: ::.. : :. . .:. : .: :. .
NP_001 TSTTSAPTTSTTSAPTTSTISAPTTSTPSAPTTSTTLAPTTSTTSAPTTSTTSTPTSSTT
2990 3000 3010 3020 3030 3040
940 950 960 970 980 990
pF1KA1 MSPTFTTTILKTSQPLMTTPGTLSS---TASLVTGPIAVQTTAGKQLSLTHPEILV---P
:: .:: .:.. . . ::: : :.: ...: . :.:. ... : . :
NP_001 SSPQTSTTSASTTS-ITSGPGTTPSPVPTTSTTSAPTTSTTSAATTSTISAPTTSTTSAP
3050 3060 3070 3080 3090 3100
1000 1010 1020 1030 1040 1050
pF1KA1 QISTEGGISTERNRVIVDATTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQ
:: .. :: . . .: . :: ::. . :: .: . . . ::.:::
NP_001 TTSTTSA-STASKTSGLGTTPSPIPTTSTTSPPTTSTT----SASTASKTSGPGTTPSP-
3110 3120 3130 3140 3150
1060 1070 1080 1090 1100
pF1KA1 TTVVSTAEDLAPKSATFAVQSS--------TQSPTTVSSSASVNSCAVNPCLHNGECVAD
: .:. .::...: ..... : ::. ..:.:::.. ... . ..
NP_001 --VPTTSTIFAPRTSTTSASTTSTTPGPGTTPSPVPTTSTASVSKTSTSHVSISKTTHSQ
3160 3170 3180 3190 3200 3210
1110 1120 1130 1140 1150 1160
pF1KA1 NTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICN
..: : ::
NP_001 PVTRDCHLRCTWTKWFDIDFPSPGPHGGDKETYNNIIRSGEKICRRPEEITRLQCRAESH
3220 3230 3240 3250 3260 3270
>>NP_001035194 (OMIM: 608424) mucin-17 precursor [Homo s (4493 aa)
initn: 262 init1: 93 opt: 441 Z-score: 223.0 bits: 55.5 E(85289): 1.1e-05
Smith-Waterman score: 556; 23.0% identity (52.2% similar) in 1130 aa overlap (25-1089:2438-3538)
10 20 30 40 50
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLE
: .: :: : :.. . .:::. .
NP_001 PVVSSEASTHSTTPVDTSTPVTTSTEASSSPTTAEGTSIPTSPPSE---GTTPLASMPVS
2410 2420 2430 2440 2450 2460
60 70 80 90 100 110
pF1KA1 LQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRAPRGGS--ADAAWKH
: : : . : : . . : : . : .:.. .. .
NP_001 TTPVVSSEAGTLSTTPVDTSTPMTTSTEASSSPTTAEDIVVPISTASEGSTLLTSIPVST
2470 2480 2490 2500 2510 2520
120 130 140 150 160 170
pF1KA1 WPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARG
: .. :: . . : ... : . . ... : : .: :. : : .
NP_001 TPVASPEASTLSTTPVDSNSPVVTSTEISSSATSAEGTSMPTSTYSEGSTPLRSMPVSTK
2530 2540 2550 2560 2570 2580
180 190 200 210 220
pF1KA1 RSGSSSRTNFTILPVGYSLEIATALTSQSGNLASESLHLP-SSSSEFDERIAAF--QTKS
.:: .... :: :. ..:. ..:. .... .: :. :: . .... .:
NP_001 PLASSEASTLSTTPVDTSIPVTTSTETSSSPTTAKDTSMPISTPSEVSTSLTSILVSTMP
2590 2600 2610 2620 2630 2640
230 240 250 260 270 280
pF1KA1 GTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGPDLSWL
..:: .: . .. . .: .. .:.: ::. . : .::... : : . :
NP_001 VASSEASTLSTTPVDTRTLVTTSTGTSS--SPTTAEGSSM-PTSTPGER---STPLTNIL
2650 2660 2670 2680 2690
290 300 310 320 330 340
pF1KA1 HFYRTAASSPLLDLSSS--SESTEKLNNSTGLQSSSVSQTKTMHVATVFTDGGPRTLRSL
:.: ::.. . :: ... . .: .... .:...: . : : :.
NP_001 VSTTLLANSEASTLSTTPVDTSTPVTTSAEASSSPTTAEGTSMRIST--PSDGSTPLTSI
2700 2710 2720 2730 2740 2750
350 360 370 380 390 400
pF1KA1 TVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTGNPGDEEFIEPSTENEFG
:: ::...:. .. . :: : : : : ...::. : . :: :.
NP_001 LVSTLPVASSEASTVSTTAVDTSIPVTTSTEASSSPTTAEVTSMPTST----PS-ETSTP
2760 2770 2780 2790 2800 2810
410 420 430 440 450 460
pF1KA1 LTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTETVSRS-------VAPMRGGEITAHWL
:::. .. . .: :.. :....:.. . .: : :.:. . . :
NP_001 LTSMPVNHTPVASSEAGTLSTTPVDTSTPVTTSTKASSSPTTAEGIVVPISTASEGSTLL
2820 2830 2840 2850 2860 2870
470 480 490 500 510
pF1KA1 LTNSTTSADVTGSSASY----PEGVNASVLTQFSDSTVQSGGSHTALGDRSYSESSSTSS
. .... :..: :: : .. : :. :. . . :.. . :: :. .
NP_001 TSIPVSTTPVASSEASTLSTTPVDTSIPVTTSTEGSSSPTTAEGTSMPISTPSEVSTPLT
2880 2890 2900 2910 2920 2930
520 530 540 550
pF1KA1 SESLNSSAPRG--ERSTLE----DSREPGQALGDSSAN---AE----------DRTSGVP
: : :..: . : ::: :.: : . ...:.. :: .: . .
NP_001 S-ILVSTVPVAGSEASTLSTTPVDTRTPVTTSAEASSSPTTAEGTSMPISTPGERRTPLT
2940 2950 2960 2970 2980 2990
560 570 580 590 600 610
pF1KA1 SLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAA------MHQETEGASLHVN
:... :. ...... :. . :.: ..:.. ..::..: . .::.. ..
NP_001 SMSVSTMPVASSEASTLSRTPADTSTPVTTSTEASSSPTTAEGTGIPISTPSEGSTPLTS
3000 3010 3020 3030 3040 3050
620 630 640 650 660 670
pF1KA1 VTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLS-STFTKGERALL
. .. . .. .:.:... .. .. :. : .: .. : . ::...: :
NP_001 IP--VSTTPVAIPEASTLSTTPVDSNSPVVTSTEVSSSPTPAEGTSMPISTYSEGSTPLT
3060 3070 3080 3090 3100
680 690 700 710 720
pF1KA1 SI---TDNSSSSDIVESSTSYIKISN--SSHSEYSSFFHAQTERSNISSYDGEYAQPSTE
.. : .:: : ::. . :. .. .: : .. : .: .: . : :
NP_001 GVPVSTTPVTSSAISTLSTTPVDTSTPVTTSTEAHSSPTTSEGTSMPTSTPSEGSTPLTY
3110 3120 3130 3140 3150 3160
730 740 750 760 770 780
pF1KA1 SPVLHTSNLPSYTPTINM-P-NTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVS
:: . : :.. : .::. . :..: .:.... ..: .:. : :: ::
NP_001 MPVSTMLVVSSEDSTLSATPVDTSTPVTTSTEATSSTTAEGTSIPTSTPSEGMTPLTSVP
3170 3180 3190 3200 3210 3220
790 800 810 820 830
pF1KA1 QSHHLFSS----ILPST--RASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLS---V
:. .: :: .: ... : :: .:.: .. . .:.: . :.::. :
NP_001 VSNTPVASSEASILSTTPVDSNTPLTTSTEASSSPPTAEGTSMPTSTPSEGSTPLTSMPV
3230 3240 3250 3260 3270 3280
840 850 860 870 880 890
pF1KA1 SQTTLPQS--SSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVIT
: ::. .: :. . : ::::... .. . .. : :. . ::: . ..
NP_001 STTTVASSETSTLSTTPADTSTPVTTYSQASSSPPIADGTSMPTSTYSEGSTPLTN--MS
3290 3300 3310 3320 3330 3340
900 910 920 930 940 950
pF1KA1 ESKSPSLVS-LPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTS
: .: . : : :: : :..:. : ::.: : : .:.. ::. :: : .:
NP_001 FSTTPVVSSEASTLSTTPVDTSTPVTTS-TEASLSPTT-AEGTSIPTSSPSEGTTPL-AS
3350 3360 3370 3380 3390 3400
960 970 980 990 1000 1010
pF1KA1 QPLMTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDA
.:. ::: . : . .: : :. .: . . . .. : . ..: . .
NP_001 MPVSTTPVVSSEVNTLSTTPVDSNTLVTTSTEASSSPTIAEGTSLPTSTTSEGSTPL---
3410 3420 3430 3440 3450 3460
1020 1030 1040 1050 1060
pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYS-PASRSLGTSPSPQTT-VVSTAEDLAPKSATF
...::...:....: .: . .. : :.. : :. :: :. :.: . : ...:
NP_001 --SIMPLSTTPVASSEASTLSTTPVDTSTPVTTSSPTNSSPTTAEVTSMPTSTAGEGSTP
3470 3480 3490 3500 3510
1070 1080 1090 1100 1110 1120
pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE
.. ... ..:: ::. :
NP_001 LTNMPVSTTPVASSEASTLSTTPVDSNTFVTSSSQASSSPATLQVTTMRMSTPSEGSSSL
3520 3530 3540 3550 3560 3570
>>NP_002448 (OMIM: 158370) mucin-2 precursor [Homo sapie (5289 aa)
initn: 268 init1: 90 opt: 386 Z-score: 195.4 bits: 50.6 E(85289): 0.00038
Smith-Waterman score: 506; 19.6% identity (48.1% similar) in 1119 aa overlap (26-1086:1931-3009)
10 20 30 40 50
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAPLAGAGLEL
:. ::. : :.: . ... . .
NP_002 TTTVTPTPTPTSTQSTTPTPITTTNTVTPTPTPTGTQTPTPTPITTTTTMVTPTPTITST
1910 1920 1930 1940 1950 1960
60 70 80 90 100 110
pF1KA1 QLERRPEREPPPTPPRERRGPATPGP-SYRAPEPGAATQRGPSGRAPRGGSADAAWKHWP
: : ::: :: : : . : . : .: .... :
NP_002 QT-------PTPTPITTTTVTPTPTPTSTQRTTPTSITTTTTVTPTPTPTGTQTP-TTTP
1970 1980 1990 2000 2010
120 130 140 150 160 170
pF1KA1 ESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENLTLLAETADARGRS
..: . . . : .: .: : ... : . . . .: .: . .. . .
NP_002 ITTTTTVTPTPTPTGTQTPTTTPISTTTMVTPTPTPTGTQTLTPTPITTTTTVTPTPTPT
2020 2030 2040 2050 2060 2070
180 190 200 210 220
pF1KA1 GSSSRTNFTILPVGYSLEIATALTSQSGNLA---SESLHLPS-----SSSEFDERIAAFQ
:... :. : . : .:. .:. . . :. ... :..
NP_002 GTQTPTSTPISTTTTVTPTPTPTGTQTPTLTPITTTTTVTPTPTPTGTQTPTTTPITTTT
2080 2090 2100 2110 2120 2130
230 240 250 260 270 280
pF1KA1 TKSGTASEMGTERAM--GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTPSRKRNSSGP
: . : . ::. . ... .: :.. .:. : .: ... :
NP_002 TVTPTPTPTGTKSTTPTSITTTTMVTPTPPPTGTQTPTTTPITTTTTVTPTPTPTGTQTP
2140 2150 2160 2170 2180 2190
290 300 310 320 330
pF1KA1 DLSWLHFYRTAASSPLLDLSSSSESTEKLNNST--------GLQSSSVSQ-TKTMHVATV
. . :.. .: ... :: .:.: : :.... : : :. .
NP_002 TPTPITTTTTVTPTPTPTGTQTPTSTPITTNTTVTPTPTPTGTPSTTLTPITTTTMVTPT
2200 2210 2220 2230 2240 2250
340 350 360 370 380
pF1KA1 FTDGGPRTLRSLTVS----LGPVSKTEGF--PKDSRIATTSS-------SVLLSPSAVES
: : .: : .: . :. : : . :.::.. . .:...
NP_002 PTPTGTQTPTSTPISTTTTVTPTPTPTGTQTPTPTPISTTTTVTPTPTPTSTQTPTTTPI
2260 2270 2280 2290 2300 2310
390 400 410 420 430 440
pF1KA1 RRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTET
.. :: :: :.: .:. . .:: ..... . .:.: : :
NP_002 TTTTTVTPNPTPTGTQTPTTTP---ITTTTTVTPTPT------PTGTQTPTTTPISTTTT
2320 2330 2340 2350 2360
450 460 470 480 490
pF1KA1 VSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTVQSGG---S
:. . .: :. . :..:.. : .... : .. .. : . . . .: .
NP_002 VTPTPTPTGTQTPTTTAITTTTTVTPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPT
2370 2380 2390 2400 2410 2420
500 510 520 530 540 550
pF1KA1 HTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPS-
: ... . . : .. . . .: .:. .: : . . . .. : .:.
NP_002 STPISNTTTVTPTPTPTGTQTPTVTPITTTTTVTPTRTPTGTKSTTPTSITTTTMVTPTP
2430 2440 2450 2460 2470 2480
560 570 580 590 600
pF1KA1 --LGTHTLATVTGNGERTLRSV-------TLTNTSMSTTSGEAGSPAAAMHQETEGASLH
:::: .:. . :. . : : : ..::. . .:. . : .:
NP_002 TPTGTHTPTTTPITTTTTVTPTPTPTGTQTPTPTPITTTTTVTPTPTPTGTQTP--TSTP
2490 2500 2510 2520 2530 2540
610 620 630 640 650 660
pF1KA1 VNVTDDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSSTFTKGERAL
...: . . .... . . : : .. .: : : .: : .
NP_002 ITTTTTVTPTPTPTGTQTPTTTPITTNTTVTPTPTP---TGTQTPTTVLITTTTTMTPTP
2550 2560 2570 2580 2590
670 680 690 700 710 720
pF1KA1 LSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVL
. .:.. . ..:. . . .. ... : . . .: : .:.
NP_002 TPTSTKSTTVTPITTTTTVTPTPTPTGTQSTTLTPITTTTTVTPTPTPTGTQTPTTTPIS
2600 2610 2620 2630 2640 2650
730 740 750 760 770 780
pF1KA1 HTSN-LPSYTPT-----INMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVS
:.. .:. ::: . : :... : . . ... .:. :.... : :. .
NP_002 TTTTVIPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPTSTPISTTTTVTPTATPTGT
2660 2670 2680 2690 2700 2710
790 800 810 820 830
pF1KA1 QSHHLFSSILPSTRASVHLLKSTSDAS-TPWSSS----PSPLPVSLTTSTSAPLSVSQTT
:. : .: .:. .:. . :: ... :.: :.: : ::.:.... :.
NP_002 QTPTLTPITTTTTVTSTPTPTGTQTPTPTPITTTTTVTPTPTPTSTQTPTSTPITTTTTV
2720 2730 2740 2750 2760 2770
840 850 860 870 880 890
pF1KA1 LPQSSSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKVITESKSPS
: ::. : . .::.:. :.: : : .. : . : ..: . .:.
NP_002 TP----TPT-PTGTQTPTTTHITTTTTVTPTPTPTGTQAPTPTAIT--TTTTVTPTPTPT
2780 2790 2800 2810 2820 2830
900 910 920 930 940 950
pF1KA1 LVSLPTESTKAVTTNSPLPPSLTESSTEQTLPATSTNLAQMSPTFTTTILKTSQPLMTTP
.. :: : .::.. . :. : ..:.. :.. :. . ..:: : : :. : :::
NP_002 GTQTPT--TTPITTTTTVTPTPTPTGTQSPTPTAITTTTTVTPTPTPT--GTQTPT-TTP
2840 2850 2860 2870 2880
960 970 980 990 1000 1010
pF1KA1 GTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQISTEGGISTERNRVIVDATTGLIPL
: ..:.. . : ..:.:. .. : : : : : .: . :. :: .
NP_002 ITTTTTVTPTPTPTGTQSTTLTPITTT---TTVTPIPTPTGTQTPTSTPIT--TTITVTP
2890 2900 2910 2920 2930 2940
1020 1030 1040 1050 1060 1070
pF1KA1 TSVPTSAKEMT-TKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKSATFAVQSSTQS
: .::... : : ...:. .:. ::. .: :: ..:. ..: . ..:. : .
NP_002 TPTPTGTQTPTPTPISTTTTVTPTPTPTGTQ-TPTTTPITTTTTVTPTPTPTGTQTPTTT
2950 2960 2970 2980 2990 3000
1080 1090 1100 1110 1120 1130
pF1KA1 PTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNECLSNPCPS
: .......
NP_002 PISTTTTVTPTPTPTGTQTPTSTPITTTTTVTPTPTPTGTQTPTPTPITTTTTVTPTPTP
3010 3020 3030 3040 3050 3060
>>NP_001309397 (OMIM: 158372) mucin-4 isoform f precurso (7418 aa)
initn: 157 init1: 95 opt: 388 Z-score: 194.4 bits: 50.9 E(85289): 0.00044
Smith-Waterman score: 504; 23.6% identity (51.8% similar) in 1087 aa overlap (63-1094:5206-6246)
40 50 60 70 80 90
pF1KA1 DPPPSPARRALSLAPLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAA-
: : .: : .:: : .: ...
NP_001 PGTDTSSVSTGHTTPLLVTDASSVSTGDTTRLPVTSPSSASTGHTTPLPVTDTPSASTGD
5180 5190 5200 5210 5220 5230
100 110 120 130 140
pF1KA1 TQRGPSGRAPRGGSADAAWKHW--PESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSG
: : : .. :. : : : . .:. . : :..:. ... . ...
NP_001 TTPLPVTNASSLSTRHATSLHVTSPSSASTGHATPLPV----TDTSAASTGHATPLPVTS
5240 5250 5260 5270 5280 5290
150 160 170 180 190 200
pF1KA1 KSHAASDAPENLTLLAETADARGRSGSSSRTNFTILPVGYSLEIATALTSQSGNLASESL
: :.. : . .. . :.. :: . . .:.. . .. :.... . :
NP_001 TSSASTGDTTPLPVTDTSSASTGHATPLPVTNTSSVSTGHATPLHVTSPSSASTGHTTPL
5300 5310 5320 5330 5340 5350
210 220 230 240 250 260
pF1KA1 HLPSSSSEFDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEAT----TSAWSPSFLP
. ..:: . ... . .... : . ... : . .:: :: : :
NP_001 PVTDASSVSTGHATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPLTSLSSVSTGD
5360 5370 5380 5390 5400 5410
270 280 290 300 310 320
pF1KA1 ALEMGELTTPSRKRNSSGP-DLSWLHFYRTAASSPLLDLSSSSESTEKLNNSTGLQSSSV
. . : : . ... : .. : :. ..:: ..:: :: ...:.: ...
NP_001 TTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSAST---GHATSLPVTDT
5420 5430 5440 5450 5460
330 340 350 360 370
pF1KA1 SQTKTMHVATV-FTDGGPRTL---RSLTVSLGPVSKTEGFPKDSRIATTSSSVL--LSPS
:...: :.. . :: . . : :. .: : . : .. :::. .:
NP_001 SSASTGHATPLPVTDTSSISTGHATPLHVT-SPSSASTGHATPLPVTDTSSASTGHATPL
5470 5480 5490 5500 5510 5520
380 390 400 410 420 430
pF1KA1 AVESRRNSRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNGSPMS
: : .: ::. ::. . : : .:. . . : :. : . : .:
NP_001 PVTSL-SSVSTGDTTPLPVTSPSSASTGHATPL-LVTDASSASTGQ-ATPLPVTSLSSVS
5530 5540 5550 5560 5570 5580
440 450 460 470 480 490
pF1KA1 QTETVSRSV-APMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTVQSG
.:. : .: .. : : ...:.::. ::...: : ..:. : . : .
NP_001 TGDTTPLPVTSPSSASTGHATSLPVTDTSSAS-TGDTTSLPVTDTSSAYTGDTTSLPVTD
5590 5600 5610 5620 5630 5640
500 510 520 530 540 550
pF1KA1 GSHTALGDRS---YSESSSTSSSESLNSSAPRGERSTLEDSRE-PGQALGDSSANAEDRT
: .. :: . .:.::.:.... . .: . :.. .. : . : :::.. : :
NP_001 TSSSSTGDTTPLLVTETSSASTGDT--TPVPVTDTSSVSTGHATPLPVTGLSSASTGD-T
5650 5660 5670 5680 5690 5700
560 570 580 590 600 610
pF1KA1 SGVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVT
. .: . .: :. : . .:::: .:. :... . . : . . ::
NP_001 TRLPVTDISSAST----GQAT--PLPVTNTSSVSTGDTMPLPVTSPSSASTGHATPLPVT
5710 5720 5730 5740 5750
620 630 640 650 660
pF1KA1 DDMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL-----SSTFTKGERA
. . . . . ... : :.. . . :: : :: .:. . :. .
NP_001 STSSASTGHATPVPVTSTSLASTGHTTPLPVTS-PSSASTGHTTPLPVTDTSSASTGDTT
5760 5770 5780 5790 5800 5810
670 680 690 700 710 720
pF1KA1 LLSITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPV
: .: :.:: . ... .. : .:. . .: . . .. :: . .: : ::
NP_001 PLPVT-NASSLSTGHTTPLHVTIPSSASTGDTSTLPV----TGASSASTGHATPL---PV
5820 5830 5840 5850 5860
730 740 750 760 770
pF1KA1 LHTSNLPS--YTPTINMPNTSVVL-DTDAEFVSDSSSSSS--------SSSSSSSSGPPL
::.. . :: .:: :: :.:.::.:. ...::.:.:
NP_001 TDTSSVSTGHATPLPVTSFSSVSTGDTTPLPVTDASSASTGHATPLPVTDTSSASTGDTT
5870 5880 5890 5900 5910 5920
780 790 800 810 820 830
pF1KA1 PLPSVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSPSPLPVSLTTSTSAPLSVSQT
::: .. : .: .: : :.:.: ..: .::::.. .:.: : :
NP_001 PLPVTDASS---ASTGQATPLPVTSLSSVSTGDT------TPLPVTIPSSAS---SGHTT
5930 5940 5950 5960 5970
840 850 860 870 880 890
pF1KA1 TLPQS-SSTPVLPRARETPVTSFQTSTMTSFMTMLHSSQTADLKSQSTPHQEKV-ITESK
.:: : .:. .: ::::... . . .: ..: .: :: : . .:...
NP_001 SLPVSDTSSASTGQATPLPVTSLSSVSTGDTTPLL----VTDASSVSTGHATPLPVTDTS
5980 5990 6000 6010 6020
900 910 920 930 940
pF1KA1 SPSL---VSLPTESTKAVTTN--SPLP-PSLTESSTEQTLPATSTNLAQMSPTFTT----
: : . ::. .:....:. .::: ::. :: .: : :: ...: .:
NP_001 SASTGDTTRLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLLVTNTSSVSTGHATSLPV
6030 6040 6050 6060 6070 6080
950 960 970 980 990 1000
pF1KA1 TILKTSQPLMTTPGTLSSTASLVTG---PIAVQTTAGKQLSLTHPEILVPQIS-TEGGIS
:: ..:. ::: ..::.:. :: :. : . .... . . : .. : . : ..
NP_001 TIPSSSSSGHTTPLPVTSTSSVSTGHVTPLHVTSPSSSSTGQATPLPVTSTSSVSTGHVT
6090 6100 6110 6120 6130 6140
1010 1020 1030 1040 1050
pF1KA1 TERNRVIVDATTGL---IPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVST
. .:.:: .:.::. ... .: : :: : .. : .:. .::
NP_001 PLHVTSPSSASTGHATPLPVTSTSSASTGHATPLPVTDASSVSTGHATPLPVTDTSSAST
6150 6160 6170 6180 6190 6200
1060 1070 1080 1090 1100 1110
pF1KA1 AEDLA-PKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPS
.. : . : ..... .: :.: .::.. ..:
NP_001 GDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGHATPLAVSSATSASTVSSDSPLKMETS
6210 6220 6230 6240 6250 6260
1120 1130 1140 1150 1160 1170
pF1KA1 WQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNLVRTFVTEFKLKR
NP_001 GMTTPSLKTDGGRRTATSPPPTTSQTIISTIPSTAMHTRSTAAPIPILPERGVSLFPYGA
6270 6280 6290 6300 6310 6320
>--
initn: 76 init1: 76 opt: 411 Z-score: 205.5 bits: 53.0 E(85289): 0.0001
Smith-Waterman score: 519; 25.6% identity (52.6% similar) in 1154 aa overlap (19-1094:1333-2421)
10 20 30 40
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAP-GTRDPPPS------PARR
:: . : .: : : : :. .
NP_001 HVTDASSVSTGHATSLPVTSLSSASTGDTTPLPVTSPSSASSGHTTPLPVTDASSVPTGH
1310 1320 1330 1340 1350 1360
50 60 70 80 90
pF1KA1 ALSLAPLAGAGLELQLERRPEREPPPTPPRERRGPATPGP--SYRAPEPGAATQRGPSGR
: :: :.. :. . : : : ::: : . . : :: :
NP_001 ATSL-PVTDASSVSTGHATP--LPVTDASSVSTGHATPLPVTDTSSVSTGQATPL-PVTS
1370 1380 1390 1400 1410
100 110 120 130 140 150
pF1KA1 APRGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPE
....:.. : ..: . . ..:.::. . . . ... : :..
NP_001 LSSASTGDTT--PLPVTDTSSASTGQDTPLPVTSLSSVSTGDTTPLPVTSPSSASTGHAT
1420 1430 1440 1450 1460 1470
160 170 180 190 200 210
pF1KA1 NLTLLAETADARGRSGSSSRTNFTILPVGYS--LEIATALTSQSGNLASESLHLPSSSSE
: . .. . :.. : :. . . .:.. :... : . ..:. . . :::.:
NP_001 PLLVTDASSVSTGHATSLLVTDASSVSTGHATALHVTDASSLSTGDTTPLPVTSPSSAST
1480 1490 1500 1510 1520 1530
220 230 240 250 260 270
pF1KA1 FDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTT-PS
: : ...:: : .: .: .. .. :.:. .: ::. . . .: .
NP_001 GDTTPLPV-TDTSSAS---TGHATSLP---VTDTSSASTGHATP--LPVTDTSSASTGQA
1540 1550 1560 1570 1580
280 290 300 310 320 330
pF1KA1 RKRNSSGPDLSWLHFYRTAASSPLLDLSSSSESTEKLNN--STGLQSSSVSQTKTMHV--
.::. . :. . ::: ..:: :: . . :.:.:.:...: . :
NP_001 TPLPVTGPSSA-----STGHAIPLLVTDTSSASTGQATPLPVTSLSSASTGDTTPLPVTD
1590 1600 1610 1620 1630 1640
340 350 360 370 380 390
pF1KA1 ATVFTDGGPRTLRSLTVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTGNP
:. . : .: ..::. :: . : ...:: .: : . .: ::.
NP_001 ASSVSTGHATSLP--VTSLSSVSTGDTTPLPVTSPSSASSGHTTPLPV-TDASSVSTGDT
1650 1660 1670 1680 1690
400 410 420 430 440
pF1KA1 GDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQL------ASSSEVQNGSPMSQTETVSRS
::. . : : . : . . : :::. . . .:. :.: : :
NP_001 TPLPVTSPSSASSGHTTPLPVTSPSSASSGHTTPLPVTDASSASTGDTTPLPVTDTSSAS
1700 1710 1720 1730 1740 1750
450 460 470 480 490 500
pF1KA1 VAPMRGGEITA-HWLLTNSTTSADVTG-SSASYPEGVNASVLTQFSDSTVQSGGSHTALG
.. .:. :..:: ::. :::: : .:. : : :....: . : :
NP_001 TGHATHLPVTGLSSASTGDTTRLPVTNVSSAS--TG-HATPLPVTSTSSASTGDT-TPLP
1760 1770 1780 1790 1800 1810
510 520 530 540 550 560
pF1KA1 DRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGTHTL
. : :. .. : ..: . :: . .: : . . :::.. .:. .: : .
NP_001 GTDTSSVSTGHTTPLLVTDA--SSVSTGDTTRLP--VTSPSSAST-GHTTPLPVTDTPSA
1820 1830 1840 1850 1860 1870
570 580 590 600 610 620
pF1KA1 ATVTGNGERTLRSVTLTNTSMST---TSGEAGSPAAAMHQETEGASLHVNVTDDMGLVSR
.: :. : :: . .:.:: :: .. ::..: . : . . ::: :
NP_001 ST----GDTTPLPVT-NASSLSTRHTTSLHVTSPSSA----STGHATSLPVTDT---SSV
1880 1890 1900 1910
630 640 650 660 670 680
pF1KA1 SLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYLSSTFTKGERALLSITDNSSSSDI
: . .. : :.. : ... : : :: :: .:: :. . : .::.::.:
NP_001 STGHATPLHVTSPSSASTGDT-----TPLPVTD-TYSAST---GQATPLPVTDTSSAST-
1920 1930 1940 1950 1960
690 700 710 720 730
pF1KA1 VESSTSYIKISNSSHSEYSSFFHAQT-ERSNISSYDGEYAQP-STESP----VLHTSNLP
..:. . ....: . : :: .: :: . .: : . :: . ::. ::
NP_001 --GDTTPLPVTDTSSA---STGHATPLPVTNTSSVSTGHATPLHVTSPSSASTGHTTPLP
1970 1980 1990 2000 2010 2020
740 750 760 770 780
pF1KA1 -SYTPTINMPN-TSV-VLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLP-----SVSQSHH
. . ... . ::. : :... :.. ..: . ::.::: ::: ::: .:
NP_001 VTDASSVSTGHATSLPVTDASSVFTGHATSLPVTIPSSASSGHTTPLPVTDASSVSTGH-
2030 2040 2050 2060 2070 2080
790 800 810 820 830
pF1KA1 LFSSILPSTRAS-VHLLKST----SDASTPWSSSPSPLPVSLTTSTSA----PLSVSQTT
.. :: : :: : ..: .:::. .. .::::. :.:.:. :: ... .
NP_001 --ATSLPVTDASSVSTGHATPLPVTDASSVSTGHATPLPVTDTSSVSTGHATPLPLTSLS
2090 2100 2110 2120 2130 2140
840 850 860 870 880 890
pF1KA1 LPQSSSTPVLPRARETPVTSFQTSTM--TSFMTMLHSSQT----ADLKSQSTPHQEKV-I
....: :: . . ... :.. . ::. .. .. : .: .: :: : .. .
NP_001 SVSTGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTPLPVTDTSSASTGHATSLPV
2150 2160 2170 2180 2190 2200
900 910 920 930 940
pF1KA1 TESKSPSL---VSLPTESTKAVTTNSPLPPSLTESSTEQT-----LPATSTNLAQMSPTF
:...: : . :: .:....:. : .:..:. .: ::.:.:. :... .
NP_001 TDTSSASTGHATPLPDTDTSSASTGHATPLPVTDTSSASTGHATLLPVTDTSSASIGHAT
2210 2220 2230 2240 2250 2260
950 960 970 980 990
pF1KA1 TTTILKTSQ--PLMTTPGTLSSTASLVTG---PIAVQTTAGKQLSLTHP-EILVPQISTE
. ::. .:: ..: .: :: :. : :.. . . ..: .. :. ..
NP_001 PLPVTDTSSISTGHATPLHVTSPSSASTGHATPLPVTDTSSASTGHANPLHVTSPSSAST
2270 2280 2290 2300 2310 2320
1000 1010 1020 1030 1040 1050
pF1KA1 GGISTERNRVIVDATTGL---IPLTSVPTSAKEMTTKLGVTAEYSPASRSLG-TSPSP--
: . .:.:: .:.::. . . :: : :: ::.: : : :.: :
NP_001 GHATPLPVTDTSSASTGHATPLPVTSLSSVSTGDTTPLPVT---SPSSASTGHTTPLPVT
2330 2340 2350 2360 2370
1060 1070 1080 1090 1100 1110
pF1KA1 QTTVVSTAEDLA-PKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGY
.:. .::.. : : ..: ..... .: :....:... ..:
NP_001 DTSSASTGQATALPVTSTSSASTGDTTPLPVTDTSSASTGQATPLPVTSLSSVSTGDTTP
2380 2390 2400 2410 2420 2430
1120 1130 1140 1150 1160 1170
pF1KA1 HCRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNLVRTFV
NP_001 LPVTSPSSASTGHATPLLVTDASSASTGQATPLPVTDTSSAYTGDTTSLPVTDTSSSSTG
2440 2450 2460 2470 2480 2490
>>XP_011514552 (OMIM: 158371) PREDICTED: mucin-3A isofor (3076 aa)
initn: 198 init1: 109 opt: 372 Z-score: 191.9 bits: 49.2 E(85289): 0.0006
Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681)
50 60 70 80 90 100
pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P
.:: :: .. :. . :: . :
XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP
640 650 660 670 680 690
110 120 130 140 150 160
pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL
..: .. .:.: : ... : .. .:: . :: .:. :
XP_011 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT
700 710 720 730 740 750
170 180 190 200 210
pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD
: :. :. .. : : :.:: : :: .::.:: .:.. :: .
XP_011 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS
760 770 780 790 800 810
220 230 240 250 260 270
pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP
: . : . : : .: .. :. . : .. : .. :: :... :..
XP_011 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS
820 830 840 850 860 870
280 290 300 310 320
pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ
: :.:: .. . : . : :. ..::: :::. ... .. :: .
XP_011 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT
880 890 900 910 920 930
330 340 350 360 370
pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS
:.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :.
XP_011 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT
940 950 960 970 980 990
380 390 400 410 420 430
pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG
:.. : . . .:. : : :.. .::.: . :: . .: . ..
XP_011 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS
1000 1010 1020 1030 1040
440 450 460 470 480 490
pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV
.:. .:: .. .. . :::. : :. . : ..:: .: . ::::.
XP_011 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT
1050 1060 1070 1080 1090 1100
500 510 520 530 540 550
pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS
. : . : : . . .:: : : : .:. : .: .. :. . ..
XP_011 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST
1110 1120 1130 1140 1150
560 570 580 590 600 610
pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD
::. . :. ...... .. :.. :. .: :.. . : .. : ... .
XP_011 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG
1160 1170 1180 1190 1200
620 630 640 650 660 670
pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS
. :... . .:.. :. : . . ..: . : ..:. . : .:. : . : ..
XP_011 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT
1210 1220 1230 1240 1250 1260
680 690 700 710 720 730
pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT
::.. .:... . : ..:.: . .. :..: ::: :.. . . ::
XP_011 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT
1270 1280 1290 1300 1310
740 750 760 770 780 790
pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS
. . .:: : . :... . :.. .... .:: . . ..
XP_011 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT
1320 1330 1340 1350 1360
800 810 820 830 840
pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T
. :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: :
XP_011 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST
1370 1380 1390 1400 1410 1420
850 860 870 880 890 900
pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT
:: : .. : . .:. .....: : . : . : :... . . : ..: . .. ::
XP_011 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT
1430 1440 1450 1460 1470 1480
910 920 930 940 950
pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL
:.. .: . :::. . :: .: . .::: .. . .::. :: .: : :
XP_011 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT
1490 1500 1510 1520 1530 1540
960 970 980 990 1000 1010
pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA
. .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . .
XP_011 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS
1550 1560 1570 1580 1590 1600
1020 1030 1040 1050 1060
pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF
. . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..:
XP_011 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF
1610 1620 1630 1640 1650
1070 1080 1090 1100 1110 1120
pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE
: : .: ..:: ..... ...
XP_011 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS
1660 1670 1680 1690 1700 1710
>>XP_016867720 (OMIM: 158371) PREDICTED: mucin-3A isofor (3143 aa)
initn: 198 init1: 109 opt: 372 Z-score: 191.8 bits: 49.2 E(85289): 0.00061
Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681)
50 60 70 80 90 100
pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P
.:: :: .. :. . :: . :
XP_016 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP
640 650 660 670 680 690
110 120 130 140 150 160
pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL
..: .. .:.: : ... : .. .:: . :: .:. :
XP_016 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT
700 710 720 730 740 750
170 180 190 200 210
pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD
: :. :. .. : : :.:: : :: .::.:: .:.. :: .
XP_016 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS
760 770 780 790 800 810
220 230 240 250 260 270
pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP
: . : . : : .: .. :. . : .. : .. :: :... :..
XP_016 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS
820 830 840 850 860 870
280 290 300 310 320
pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ
: :.:: .. . : . : :. ..::: :::. ... .. :: .
XP_016 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT
880 890 900 910 920 930
330 340 350 360 370
pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS
:.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :.
XP_016 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT
940 950 960 970 980 990
380 390 400 410 420 430
pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG
:.. : . . .:. : : :.. .::.: . :: . .: . ..
XP_016 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS
1000 1010 1020 1030 1040
440 450 460 470 480 490
pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV
.:. .:: .. .. . :::. : :. . : ..:: .: . ::::.
XP_016 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT
1050 1060 1070 1080 1090 1100
500 510 520 530 540 550
pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS
. : . : : . . .:: : : : .:. : .: .. :. . ..
XP_016 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST
1110 1120 1130 1140 1150
560 570 580 590 600 610
pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD
::. . :. ...... .. :.. :. .: :.. . : .. : ... .
XP_016 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG
1160 1170 1180 1190 1200
620 630 640 650 660 670
pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS
. :... . .:.. :. : . . ..: . : ..:. . : .:. : . : ..
XP_016 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT
1210 1220 1230 1240 1250 1260
680 690 700 710 720 730
pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT
::.. .:... . : ..:.: . .. :..: ::: :.. . . ::
XP_016 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT
1270 1280 1290 1300 1310
740 750 760 770 780 790
pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS
. . .:: : . :... . :.. .... .:: . . ..
XP_016 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT
1320 1330 1340 1350 1360
800 810 820 830 840
pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T
. :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: :
XP_016 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST
1370 1380 1390 1400 1410 1420
850 860 870 880 890 900
pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT
:: : .. : . .:. .....: : . : . : :... . . : ..: . .. ::
XP_016 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT
1430 1440 1450 1460 1470 1480
910 920 930 940 950
pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL
:.. .: . :::. . :: .: . .::: .. . .::. :: .: : :
XP_016 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT
1490 1500 1510 1520 1530 1540
960 970 980 990 1000 1010
pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA
. .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . .
XP_016 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS
1550 1560 1570 1580 1590 1600
1020 1030 1040 1050 1060
pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF
. . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..:
XP_016 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF
1610 1620 1630 1640 1650
1070 1080 1090 1100 1110 1120
pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE
: : .: ..:: ..... ...
XP_016 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS
1660 1670 1680 1690 1700 1710
>>XP_011514551 (OMIM: 158371) PREDICTED: mucin-3A isofor (3245 aa)
initn: 198 init1: 109 opt: 372 Z-score: 191.6 bits: 49.2 E(85289): 0.00062
Smith-Waterman score: 513; 22.5% identity (52.1% similar) in 1074 aa overlap (77-1093:670-1681)
50 60 70 80 90 100
pF1KA1 PLAGAGLELQLERRPEREPPPTPPRERRGPATPGPSYRAPEPGAATQRGPSGRA-----P
.:: :: .. :. . :: . :
XP_011 STNTVTSMTTTTSPPTTTNSFTSLTSMPLSSTPVPSTEVVTSGTINTIPPSILVTTLPTP
640 650 660 670 680 690
110 120 130 140 150 160
pF1KA1 RGGSADAAWKHWPESNTEAHVENITFYQNQEDFSTVSSKEGVMVQTSGKSHAASDAPENL
..: .. .:.: : ... : .. .:: . :: .:. :
XP_011 NASSMTTSETTYPNSPTGPGTNSTTEITYPTTMTETSSTATSLPPTSPLVSTAKTAKTPT
700 710 720 730 740 750
170 180 190 200 210
pF1KA1 TLLAETADARGRSGSSSRTNFTILPVGYSLE--IATALTSQSGNLASESLHLPSSSSEFD
: :. :. .. : : :.:: : :: .::.:: .:.. :: .
XP_011 TNLVTTTT---KTTSHSTTSFTSSTV-YSTASTYTTAITSVPTTLGTMVTSTSMISSTVS
760 770 780 790 800 810
220 230 240 250 260 270
pF1KA1 ERIAAFQTKSGTASEMGTERAM----GLSEEWIVHSQEATTSAWSPSFLPALEMGELTTP
: . : . : : .: .. :. . : .. : .. :: :... :..
XP_011 TGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVSNMSARPTTVIPSS-PTVQNTEISIS
820 830 840 850 860 870
280 290 300 310 320
pF1KA1 ----SRKRNSSGPDLSWLHFYRTAA---SSPLL-DLSSS-SESTEKLNNSTGLQSSSVSQ
: :.:: .. . : . : :. ..::: :::. ... .. :: .
XP_011 VSMTSATTPSGGPTFTSTENTPTRSLLTSFPMTHSFSSSMSESSAGTTHTESI-SSPRGT
880 890 900 910 920 930
330 340 350 360 370
pF1KA1 TKTMHVATVFTDGGPRTLRSLTVS--LGPVSKT-----EG---FPKDSRIATTSSSVLLS
:.:.:. :: . .: : :.:.: . : :.: .: :: : :: .. :.
XP_011 TSTLHT-TVESTPSPTTTTSFTTSTMMEPPSSTVSTTGRGQTTFP--SSTATFPETTTLT
940 950 960 970 980 990
380 390 400 410 420 430
pF1KA1 PSAVESRRN--SRVTGNPGDEEFIEPSTENEFGLTSLRWQNDSPTFGEHQLASSSEVQNG
:.. : . . .:. : : :.. .::.: . :: . .: . ..
XP_011 PTTDISTVSLTTAMTSPPPVSSSITPTNT----MTSMRTTTYWPTATNTLSPLTSSILSS
1000 1010 1020 1030 1040
440 450 460 470 480 490
pF1KA1 SPMSQTETVSRSVAPMRGGEITAHWLLTNSTTSADVTGSSASYPEGVNASVLTQFSDSTV
.:. .:: .. .. . :::. : :. . : ..:: .: . ::::.
XP_011 TPVPSTEMITSHTTNTTPLSTLVTTLLTTITRSTPT--SETTYP----TSPTSIVSDSTT
1050 1060 1070 1080 1090 1100
500 510 520 530 540 550
pF1KA1 QSGGSHTALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTS
. : . : : . . .:: : : : .:. : .: .. :. . ..
XP_011 EITYSTSITGTLSTATTLPPTSS-----SLPTTETATM----TPTTTLITTTPNTTSLST
1110 1120 1130 1140 1150
560 570 580 590 600 610
pF1KA1 GVPSLGTHTLATVTGNGERTLRSVTLTNTSMSTTSGEAGSPAAAMHQETEGASLHVNVTD
::. . :. ...... .. :.. :. .: :.. . : .. : ... .
XP_011 --PSFTSSTIYSTVSTSTTAISSASPTSGTMVTSTTMTPSSLSTDTPSTTPTTITYPSVG
1160 1170 1180 1190 1200
620 630 640 650 660 670
pF1KA1 DMGLVSRSLAASSALGVAGISYGQVRGTAIEQRTSSDHTDHTYL---SSTFTKGERALLS
. :... . .:.. :. : . . ..: . : ..:. . : .:. : . : ..
XP_011 STGFLTTATDLTSTFTVS--SSSAMSTSVIPSSPSIQNTETSSLVSMTSATTPSLRPTIT
1210 1220 1230 1240 1250 1260
680 690 700 710 720 730
pF1KA1 ITDNSSSSDIVESSTSYIKISNSSHSEYSSFFHAQTERSNISSYDGEYAQPSTESPVLHT
::.. .:... . : ..:.: . .. :..: ::: :.. . . ::
XP_011 STDSTLTSSLLTTFPSTYSFSSSMSASSAGTTHTET----ISSL------PASTNTI-HT
1270 1280 1290 1300 1310
740 750 760 770 780 790
pF1KA1 SNLPSYTPTINMPNTSVVLDTDAEFVSDSSSSSSSSSSSSSSGPPLPLPSVSQSHHLFSS
. . .:: : . :... . :.. .... .:: . . ..
XP_011 TAESALAPT-----------TTTSFTTSPTMEPPSTTVATTGTGQTTFPSSTATFLETTT
1320 1330 1340 1350 1360
800 810 820 830 840
pF1KA1 ILPSTRASVHLLKSTSDASTPWSSSPSPLPV--SLTTSTSAPLSVSQTTLPQSSS----T
. :.: :.. : .. .. : .:: .: . :. :.:: : ....: : .:: :
XP_011 LTPTTDFSTESLTTAMTSTPPITSSITPTDTMTSMRTTTSWP-TATNTLSPLTSSILSST
1370 1380 1390 1400 1410 1420
850 860 870 880 890 900
pF1KA1 PVLPRARETPVTSFQTSTMTSFMTMLHSSQT-ADLKSQSTPHQEKVITESKSPSLVSLPT
:: : .. : . .:. .....: : . : . : :... . . : ..: . .. ::
XP_011 PV-PSTEVTTSHTTNTNPVSTLVTTLPITITRSTLTSETAYPSSPTSTVTESTTEITYPT
1430 1440 1450 1460 1470 1480
910 920 930 940 950
pF1KA1 ESTKAVTTNSPLPPSLTESSTEQTLPATSTNL--------AQMSPTFTT-TILKT-SQPL
:.. .: . :::. . :: .: . .::: .. . .::. :: .: : :
XP_011 TMTETSSTATSLPPTSSLVSTAETAKTPTTNLVTTTTKTTSHSTTSFTSSTIYSTASTPT
1490 1500 1510 1520 1530 1540
960 970 980 990 1000 1010
pF1KA1 MTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPEILVPQ-ISTEGGIS--TERNRVIVDA
. .. .. ...::. . .:.. . ..: ..:. .. :.. :. . : . .
XP_011 TAITSVPTTLGTMVTSTSMIPSTVSTGIPTSQPTTITPSSVGISGSLPMMTDLTSVYTVS
1550 1560 1570 1580 1590 1600
1020 1030 1040 1050 1060
pF1KA1 TTGLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLGTSPSPQTTVVSTAEDLAPKS--ATF
. . : . .:.: ..:. .. . . : :.:: : .:: :. .: ..:
XP_011 SMSARPTSVIPSSPTVQNTETSIFVSMMSA-----TTPSGGPTFTST-ENTPTRSLLTSF
1610 1620 1630 1640 1650
1070 1080 1090 1100 1110 1120
pF1KA1 AVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNTSRGYHCRCPPSWQGDDCSVDVNE
: : .: ..:: ..... ...
XP_011 PVTHSFSSSMSASSVGTTHTQSISSPPAITSTLHTTAESTPSPTTTMSFTTFTKMETPSS
1660 1670 1680 1690 1700 1710
>>XP_006720482 (OMIM: 155760,165800,608361,612813) PREDI (2568 aa)
initn: 257 init1: 170 opt: 369 Z-score: 191.6 bits: 48.9 E(85289): 0.00062
Smith-Waterman score: 473; 24.2% identity (50.0% similar) in 1230 aa overlap (18-1165:1185-2353)
10 20 30 40
pF1KA1 MASPRASRWPPPLLLLLLPLLLLMPPAAPGTRDPPPSPARRALSLAP
:: .. ::::..: :. ..:
XP_006 TAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLE---
1160 1170 1180 1190 1200 1210
50 60 70 80 90
pF1KA1 LAGAGLELQLERRPEREPPPT--PPRERRGPATPGPSYRAPEPGAATQRG-PSGR-----
:. :.: .. : : : : : . : .. ::. : :::.
XP_006 TAAPGVE-DISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETA
1220 1230 1240 1250 1260 1270
100 110 120 130 140 150
pF1KA1 APRGGSADAAWKHWPESNTEAH--VENITFYQNQEDFSTVSSK-EGVMVQTSGKS-HAAS
:: : : . : : ::.:. . : . :.. : . ::. ..:.
XP_006 AP--GVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAA
1280 1290 1300 1310 1320
160 170 180 190 200 210
pF1KA1 DAPENLTLLAETADARGRSGSSSRTNFTILPVGYSLEIAT-ALTSQSGNLASESLHLPSS
. :... : . .... . ... :: : :: :. .. . :: ..: :. .
XP_006 PGVEDISGL--PSGEVLETAAPGVEDISGLPSGEVLETAAPGVEDISGLPSGEVLETAAP
1330 1340 1350 1360 1370 1380
220 230 240 250 260 270
pF1KA1 SSEFDERIAAFQTKSGTASEMGTERAMGLSEEWIVHSQEATTSAWSPSFLPALEMGELTT
. : . . .. :: :.:. :: .... .. : ::. :. : :.
XP_006 GVEDISGLPSGEVLETTAP--GVEEISGLPSGEVLETTAPGVDEISG--LPSGEVLETTA
1390 1400 1410 1420 1430 1440
280 290 300 310 320 330
pF1KA1 PSRKRNSSGPDLSWLHFYRTAASSPLLDLSSSSE----STEKLNNSTGLQSSSVSQTKTM
:. .. :. :. :. :.: . : : :..: :. ... .:: :. : .:..
XP_006 PGVEEISGLPSGEVLET-STSAVGDLSGLPSGGEVLEISVSGVEDISGLPSGEVVETSA-
1450 1460 1470 1480 1490 1500
340 350 360 370 380 390
pF1KA1 HVATVFTDGGPRTLRSLTVSLGPVSKTEGFPKDSRIATTSSSVLLSPSAVESRRNSRVTG
.: . . : . : ... : ::. . . .: :. . ..:
XP_006 --------SGIEDVSELPSGEGLETSASGVEDLSRLPSGEEVLEISASGF-----GDLSG
1510 1520 1530 1540
400 410 420 430 440
pF1KA1 NPGDEEFIEPSTENEFG--LTSLRWQNDSPTFGEHQLASSSEVQNGSPMSQTETVSRSVA
:. : .: :. .: : :..: : : . ::..: .: : .. . :. . .
XP_006 LPSGGEGLETSA-SEVGTDLSGL----PSGREGLETSASGAEDLSGLPSGKEDLVGSASG
1550 1560 1570 1580 1590 1600
450 460 470 480 490 500
pF1KA1 PMRGGEITAHWLLTNST--TSADVTGSSASYPEGVN-----ASVLTQFSDSTVQSGGSHT
. :.. . : .... ::. .: :. : ::. : : .:: . :: .
XP_006 DLDLGKLPSGTLGSGQAPETSGLPSGFSGEYS-GVDLGSGPPSGLPDFSG--LPSGFPTV
1610 1620 1630 1640 1650
510 520 530 540 550 560
pF1KA1 ALGDRSYSESSSTSSSESLNSSAPRGERSTLEDSREPGQALGDSSANAEDRTSGVPSLGT
.: : . : ..:.. :.. . : .. : : :.. : :. :.::.:: ::
XP_006 SLVDSTLVEVVTASTASELEGRGTIGISGAGEISGLPSSELDISG-----RASGLPS-GT
1660 1670 1680 1690 1700 1710
570 580 590 600
pF1KA1 HTLATVTGNGERT-----LRSVTLTNTSMSTTSGE-----------AGSPAAAMHQE--T
. . ..:. . . : .:. ... :::: .:.:. . .
XP_006 ELSGQASGSPDVSGEIPGLFGVSGQPSGFPDTSGETSGVTELSGLSSGQPGISGEASGVL
1720 1730 1740 1750 1760 1770
610 620 630 640 650
pF1KA1 EGASLHVNVTDDMGLVSR----SLAASSALGVAGISYG---QVRGTAIEQRTSSD----H
:.: ..:: : .: : :. : .: . : : ::. . ::
XP_006 YGTSQPFGITDLSGETSGVPDLSGQPSGLPGFSGATSGVPDLVSGTTSGSGESSGITFVD
1780 1790 1800 1810 1820 1830
660 670 680 690 700
pF1KA1 TDHTYLSSTFTKGERALLSITDNSSSSDIVESS--TSYIKISNS-SHSEYSSFFHAQT-E
:. . .. : : :..: :. .. : .. : .... .:.. : . :: : .:: :
XP_006 TSLVEVAPTTFKEEEGLGSVELSGLPSGEADLSGKSGMVDVSGQFSGTVDSSGFTSQTPE
1840 1850 1860 1870 1880 1890
710 720 730 740 750 760
pF1KA1 RSNISSYDGEYAQPSTESPVLHTSNLPS--Y----TPTINMPNTSVVLDTDAEFVSDSSS
:.. : .: . :... . :.::: : ::. ..:..:.: : .: :... .
XP_006 FSGLPSGIAEVSGESSRAEI--GSSLPSGAYYGSGTPS-SFPTVSLVDRTLVESVTQAPT
1900 1910 1920 1930 1940 1950
770 780 790 800 810
pF1KA1 SSSSSSSSSS----SGPPLPLPSVSQSHHLFSSILPSTRASVHLLKSTSDASTPWSSSP-
.. .. . :. :: :..: : : .. : : . : .::. :.
XP_006 AQEAGEGPSGILELSGAHSGAPDMSGEHSGFLDL--SGLQSGLIEPSGEPPGTPYFSGDF
1960 1970 1980 1990 2000
820 830 840 850 860 870
pF1KA1 -SPLPVSLTTSTSAPLSVSQTTLPQSS--STPVLPRARETPVTSF--QTSTMTSFMTMLH
: :: .:.. : . ::. . .. . . : ... : .: ...
XP_006 ASTTNVSGESSVAMGTSGEASGLPEVTLITSEFVEGVTEPTISQELGQRPPVTHTPQLFE
2010 2020 2030 2040 2050 2060
880 890 900 910 920
pF1KA1 SS---QTADLKSQSTPHQEKVITESKS-PSLVSLPTESTKAVTTNSPLPPSLTESSTEQT
:: .:: : .:: .: .: : : . .: : : . :.:
XP_006 SSGKVSTAGDISGATPVLPGSGVEVSSVPESSSETSAYPEAGFGASAAPEASREDSGSPD
2070 2080 2090 2100 2110 2120
930 940 950 960 970 980
pF1KA1 LPATSTNLAQMSPTFTTTILKTSQPLMTTPGTLSSTASLVTGPIAVQTTAGKQLSLTHPE
: :.. . . . .. . ... : : .:.: :.: .. . .: :.
XP_006 LSETTSAFHEANLERSSGLGVSGSTLTFQEGE-ASAAPEVSGESTTTSDVG-----TEAP
2130 2140 2150 2160 2170 2180
990 1000 1010 1020 1030 1040
pF1KA1 ILVPQISTEGGISTERNRVIVDATT--GLIPLTSVPTSAKEMTTKLGVTAEYSPASRSLG
: : .: :: . . :. :.. ::.: : . :. . .. : ::
XP_006 GLPSATPTASGDRTEISGDLSGHTSQLGVVISTSIPESEWTQQTQRPAETHLEIESSSLL
2190 2200 2210 2220 2230 2240
1050 1060 1070 1080 1090 1100
pF1KA1 TSPSPQTTVVSTAEDLAPKSATFAVQSSTQSPTTVSSSASVNSCAVNPCLHNGECVADNT
: . .: .: :: .: .:.. .. . . ...: . ::: .:: : : .
XP_006 YS-GEETHTVETA--TSPTDASIPASPEWKRESESTAAAPARSCAEEPC-GAGTC---KE
2250 2260 2270 2280 2290
1110 1120 1130 1140 1150 1160
pF1KA1 SRGYH-CRCPPSWQGDDCSVDVNECLSNPCPSTAMCNNTQGSFICKCPVGYQLEKGICNL
..:. : :::.. :. :..:..::::.:: . : : .. :: : : .: : .:..
XP_006 TEGHVICLCPPGYTGEHCNIDIDECLSSPCLNGATCVDAIDSFTCLCLPSY--EGDLCEI
2300 2310 2320 2330 2340 2350
1170 1180 1190 1200 1210 1220
pF1KA1 VRTFVTEFKLKRTFLNTTVEKHSDLQEVENEITKTLNMCFSALPSYIRSTVHASRESNAV
XP_006 DQEVCEEGWNKYQGHCYRHFPDRETWVDAERRCREQQSHLSSIVTPEEQEFVNNNAQDYQ
2360 2370 2380 2390 2400 2410
1482 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:49:25 2016 done: Wed Nov 2 20:49:27 2016
Total Scan time: 16.240 Total Display time: 0.670
Function used was FASTA [36.3.4 Apr, 2011]