FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6766, 590 aa
1>>>pF1KE6766 590 - 590 aa - 590 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9691+/-0.000348; mu= 21.5171+/- 0.022
mean_var=81.2568+/-16.598, 0's: 0 Z-trim(114.8): 102 B-trim: 0 in 0/55
Lambda= 0.142280
statistics sampled from 24762 (24868) to 24762 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.658), E-opt: 0.2 (0.292), width: 16
Scan time: 7.930
The best scores are: opt bits E(85289)
NP_001188467 (OMIM: 300003) arylsulfatase F precur ( 590) 4127 857.2 0
NP_001188468 (OMIM: 300003) arylsulfatase F precur ( 590) 4127 857.2 0
NP_004033 (OMIM: 300003) arylsulfatase F precursor ( 590) 4127 857.2 0
XP_011543824 (OMIM: 300003) PREDICTED: arylsulfata ( 607) 4127 857.2 0
NP_001660 (OMIM: 300002) arylsulfatase D isoform a ( 593) 2464 515.9 1.5e-145
NP_001011719 (OMIM: 300586) arylsulfatase H [Homo ( 562) 2415 505.8 1.6e-142
NP_000038 (OMIM: 300180,302950) arylsulfatase E is ( 589) 2363 495.1 2.6e-139
XP_005274576 (OMIM: 300180,302950) PREDICTED: aryl ( 589) 2363 495.1 2.6e-139
XP_005274575 (OMIM: 300180,302950) PREDICTED: aryl ( 598) 2363 495.1 2.7e-139
NP_001269557 (OMIM: 300180,302950) arylsulfatase E ( 614) 2363 495.2 2.7e-139
XP_016885014 (OMIM: 300180,302950) PREDICTED: aryl ( 614) 2363 495.2 2.7e-139
XP_005274578 (OMIM: 300180,302950) PREDICTED: aryl ( 535) 2205 462.7 1.4e-129
NP_001269560 (OMIM: 300180,302950) arylsulfatase E ( 544) 2205 462.7 1.4e-129
XP_016885016 (OMIM: 300003) PREDICTED: arylsulfata ( 561) 2019 424.5 4.6e-118
XP_011543825 (OMIM: 300003) PREDICTED: arylsulfata ( 578) 2019 424.5 4.7e-118
XP_005274572 (OMIM: 300002) PREDICTED: arylsulfata ( 475) 1986 417.7 4.5e-116
NP_000342 (OMIM: 300747,308100) steryl-sulfatase i ( 583) 1939 408.1 4.1e-113
NP_001307682 (OMIM: 300747,308100) steryl-sulfatas ( 578) 1934 407.1 8.4e-113
NP_001307683 (OMIM: 300747,308100) steryl-sulfatas ( 578) 1934 407.1 8.4e-113
NP_001307680 (OMIM: 300747,308100) steryl-sulfatas ( 590) 1934 407.1 8.5e-113
NP_001307679 (OMIM: 300747,308100) steryl-sulfatas ( 590) 1934 407.1 8.5e-113
NP_001307681 (OMIM: 300747,308100) steryl-sulfatas ( 590) 1934 407.1 8.5e-113
XP_016885017 (OMIM: 300003) PREDICTED: arylsulfata ( 297) 1918 403.5 5.1e-112
XP_011543826 (OMIM: 300003) PREDICTED: arylsulfata ( 462) 1917 403.5 8e-112
XP_005274571 (OMIM: 300002) PREDICTED: arylsulfata ( 548) 1230 262.5 2.6e-69
XP_011543823 (OMIM: 300180,302950) PREDICTED: aryl ( 402) 1226 261.6 3.6e-69
XP_016885015 (OMIM: 300180,302950) PREDICTED: aryl ( 427) 1226 261.6 3.8e-69
NP_033667 (OMIM: 300002) arylsulfatase D isoform b ( 382) 1222 260.7 6.2e-69
NP_001310472 (OMIM: 253000,612222) N-acetylgalacto ( 337) 474 107.2 9.4e-23
XP_016878602 (OMIM: 253000,612222) PREDICTED: N-ac ( 390) 467 105.8 2.8e-22
NP_000503 (OMIM: 253000,612222) N-acetylgalactosam ( 522) 400 92.2 4.8e-18
XP_005256358 (OMIM: 253000,612222) PREDICTED: N-ac ( 575) 400 92.2 5.1e-18
XP_006721842 (OMIM: 610008) PREDICTED: arylsulfata ( 329) 394 90.7 8.1e-18
XP_005257229 (OMIM: 610008) PREDICTED: arylsulfata ( 344) 394 90.7 8.4e-18
XP_011522847 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 394 90.8 9.5e-18
XP_016879857 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 394 90.8 9.5e-18
XP_011522846 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 394 90.8 9.7e-18
XP_011522845 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 394 90.8 9.7e-18
XP_016879856 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 394 90.9 1e-17
XP_016879855 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 394 90.9 1e-17
XP_011522843 (OMIM: 610008) PREDICTED: arylsulfata ( 488) 394 90.9 1.1e-17
XP_011522844 (OMIM: 610008) PREDICTED: arylsulfata ( 488) 394 90.9 1.1e-17
NP_001254656 (OMIM: 610008) arylsulfatase G [Homo ( 525) 394 90.9 1.1e-17
XP_016879850 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
NP_055775 (OMIM: 610008) arylsulfatase G [Homo sap ( 525) 394 90.9 1.1e-17
XP_016879854 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
XP_016879852 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
XP_016879853 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
XP_005257227 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
XP_016879851 (OMIM: 610008) PREDICTED: arylsulfata ( 525) 394 90.9 1.1e-17
>>NP_001188467 (OMIM: 300003) arylsulfatase F precursor (590 aa)
initn: 4127 init1: 4127 opt: 4127 Z-score: 4578.9 bits: 857.2 E(85289): 0
Smith-Waterman score: 4127; 99.8% identity (100.0% similar) in 590 aa overlap (1-590:1-590)
10 20 30 40 50 60
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVIKKVANALKE
::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
NP_001 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALKE
490 500 510 520 530 540
550 560 570 580 590
pF1KE6 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
550 560 570 580 590
>>NP_001188468 (OMIM: 300003) arylsulfatase F precursor (590 aa)
initn: 4127 init1: 4127 opt: 4127 Z-score: 4578.9 bits: 857.2 E(85289): 0
Smith-Waterman score: 4127; 99.8% identity (100.0% similar) in 590 aa overlap (1-590:1-590)
10 20 30 40 50 60
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVIKKVANALKE
::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
NP_001 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALKE
490 500 510 520 530 540
550 560 570 580 590
pF1KE6 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
550 560 570 580 590
>>NP_004033 (OMIM: 300003) arylsulfatase F precursor [Ho (590 aa)
initn: 4127 init1: 4127 opt: 4127 Z-score: 4578.9 bits: 857.2 E(85289): 0
Smith-Waterman score: 4127; 99.8% identity (100.0% similar) in 590 aa overlap (1-590:1-590)
10 20 30 40 50 60
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGLPLNETT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSRN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 TELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTTD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 DFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQLG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLPQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 DRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQPP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVIKKVANALKE
::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
NP_004 ASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLHDFVIKKVANALKE
490 500 510 520 530 540
550 560 570 580 590
pF1KE6 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 HQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
550 560 570 580 590
>>XP_011543824 (OMIM: 300003) PREDICTED: arylsulfatase F (607 aa)
initn: 4127 init1: 4127 opt: 4127 Z-score: 4578.7 bits: 857.2 E(85289): 0
Smith-Waterman score: 4127; 99.8% identity (100.0% similar) in 590 aa overlap (1-590:18-607)
10 20 30 40
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIG
:::::::::::::::::::::::::::::::::::::::::::
XP_011 MDSKPILVQQEGIPSCTMRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIG
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 DLGCYGNDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 DLGCYGNDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRR
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 VIQNLAVPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 VIQNLAVPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYY
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 GMPFTLVDSCWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 GMPFTLVDSCWPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMI
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE6 LFIFLLGYAWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LFIFLLGYAWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETF
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE6 LLFFSFLHVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 LLFFSFLHVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFT
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE6 SDHGGHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SDHGGHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSL
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE6 MDILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 MDILPTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDD
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE6 SGSVWKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 SGSVWKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPAT
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE6 EPLYDFVIKKVANALKEHQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQP
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_011 EPLHDFVIKKVANALKEHQETIVPVTYQLSELNQGRTWLKPCCGVFPFCLCDKEEEVSQP
550 560 570 580 590 600
590
pF1KE6 RGPNEKR
:::::::
XP_011 RGPNEKR
>>NP_001660 (OMIM: 300002) arylsulfatase D isoform alpha (593 aa)
initn: 2366 init1: 1982 opt: 2464 Z-score: 2734.0 bits: 515.9 E(85289): 1.5e-145
Smith-Waterman score: 2464; 60.1% identity (82.1% similar) in 577 aa overlap (4-577:15-588)
10 20 30 40
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYG
: : . ..: ::.::. . .. ::::.:::.:::: :::::::
NP_001 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE6 NDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLA
:.:.:::.::.::.::::::::..:: ::.:::.::::::. .:::: .:.. :..: :
NP_001 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE6 VPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTL
.::: ::::.: .:...::.::::::::::.:: ::.:.:::: :.::::.:::::::
NP_001 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE6 VDSCWPDPSRNTEL--AFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIF
...: ::.: :. :...::: .:..:..::::. :. :. :: . .:
NP_001 TNDC--DPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGC
190 200 210 220 230
230 240 250 260 270 280
pF1KE6 LLGYAWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFF
:. .:.:: :.:.:::.:..::::: :...:.:.:::.:..:::.. ::::.
NP_001 LFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFL
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE6 SFLHVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHG
:.:::: :: ::. : : :.:::::::::::: ..::.:.::.: ::.:.:..:::::::
NP_001 SLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHG
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE6 GHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDIL
:::::: ::.::::::::::::::::::::::::::: .::: .::::.: :::::::..
NP_001 GHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVF
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE6 PTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSV
:::... :: .::::::::..:.::::: .: :::::::::..:::.:: :: ::::
NP_001 PTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKD-SGSV
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE6 WKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLY
::.::.:: :.: ..:.:: ..: : :: ::.: :::::::::::::. :::: .::::
NP_001 WKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLY
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE6 DFVIKKVANALKEHQETIVPVTYQLSELN-QGRTWLKPCCGVFPFCLCDKEEEVSQPRGP
:: .:. :..::..:. :: :.: : . ::.:::: :::: : ..
NP_001 HAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
540 550 560 570 580 590
590
pF1KE6 NEKR
>>NP_001011719 (OMIM: 300586) arylsulfatase H [Homo sapi (562 aa)
initn: 2144 init1: 1519 opt: 2415 Z-score: 2679.9 bits: 505.8 E(85289): 1.6e-142
Smith-Waterman score: 2415; 60.2% identity (82.1% similar) in 560 aa overlap (29-586:6-562)
10 20 30 40 50 60
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMRTPHIDR
.:::::.:.::::.::: ::::... ::.:::
NP_001 MTRNARPNIVLLMADDLGVGDLCCYGNNSVSTPNIDR
10 20 30
70 80 90 100 110
pF1KE6 LAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGN-RRVIQNLAVPAGLPLNET
:: ::::::::..:::.:.:::.:::::::::::::::. : :.. :. .::: :::
NP_001 LASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSGGLPTNET
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE6 TLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSCWPDPSR
:.: ::...:: :::::::: ::.: ::.:.:.:: :.:: :.::.:: :...: . .
NP_001 TFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSDCQASKTP
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE6 NTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIFLLGYAWFSSHTS
. . .. .::. . .:.. . : . :.. : :::: .:: . :. ::. .:.::.
NP_001 ELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTSWYSSYGF
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE6 PLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLHVHTPLPTT
:.:.:::.::: .:::: :...:.:.:::..:.::...: :::::::::::::: .
NP_001 TRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHVHTPLISK
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE6 DDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLEARRGHAQL
:.: ::.: ::::::::: ::::::::.:. : :.::::::::.::::: : .::
NP_001 KKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEPLDGAVQL
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE6 GGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVASVSGGSLP
::::::::::::::::::::::::: :::. . :::.:.:::::::: ::.. ..:: :
NP_001 GGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSYIGGGILS
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE6 QDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAHYVTPVFQP
:::::::..:::::.: . ::.::::::::: :::.::: :: ..::::::::: : :
NP_001 QDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKD-CATVWKAHYVTPKFYP
400 410 420 430 440 450
480 490 500 510 520 530
pF1KE6 PASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVIKKVANALK
..:.:: ...: : :. ::::.::::::.::::::. ::.: .:::.: ::::. :..
NP_001 EGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKKMEAAIR
460 470 480 490 500 510
540 550 560 570 580 590
pF1KE6 EHQETIVPVTYQLSELNQ-GRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
::..:..:: :.: .: . ::.::::.:::: ::::... : .:
NP_001 EHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDI-LPMAP
520 530 540 550 560
>>NP_000038 (OMIM: 300180,302950) arylsulfatase E isofor (589 aa)
initn: 2224 init1: 1856 opt: 2363 Z-score: 2622.0 bits: 495.1 E(85289): 2.6e-139
Smith-Waterman score: 2363; 59.2% identity (82.6% similar) in 559 aa overlap (25-579:33-587)
10 20 30 40 50
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
. ..:::.:.:.:::::::.:::::.:::
NP_000 HLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMR
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGL
::.:::::..::.:::::::::::.:::.::::::::.::::::: . ::.: .. .::
NP_000 TPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASGGL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 PLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSC-
: ::::.: .::..::.:::::::: ::::.: ::.:::: ..:::..:::::.:. .:
NP_000 PTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE6 -WPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWL-LIFSMILFIFLLGY
: . ..: :..: . :..:.. :::. :::. . : :. .:.: . ..::.
NP_000 RWELSEKRVNL--EQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE6 AWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLH
..: . .. ::.:::.: :::::: .:. ....:. :::.:... :::: ::::
NP_000 SYFVGALI-VHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLH
250 260 270 280 290
300 310 320 330 340 350
pF1KE6 VHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLE
:: :: : ..: : : :::::::::::: :::.:::..: :: :.::.:::::::: ::
NP_000 VHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLE
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE6 ARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVA
. :..: ::::::::::::::::::::::::: :::: .::::.: :::::::..:::.
NP_000 NQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVV
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE6 SVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAH
..:: .::::::::.::.::: :...::.::::.::: .:::.:: .: :..::.:
NP_000 RLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRD-RGTMWKVH
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE6 YVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVI
.::::::: ..:.:: ..: ::::.:..:.:::::::::::::. ::::.::.. :.
NP_000 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVM
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE6 KKVANALKEHQETIVPVTYQLSEL-NQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
..: .:. :::.:. :: ::..: : : ::.:::: ::.: : .:..
NP_000 ERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>XP_005274576 (OMIM: 300180,302950) PREDICTED: arylsulf (589 aa)
initn: 2224 init1: 1856 opt: 2363 Z-score: 2622.0 bits: 495.1 E(85289): 2.6e-139
Smith-Waterman score: 2363; 59.2% identity (82.6% similar) in 559 aa overlap (25-579:33-587)
10 20 30 40 50
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
. ..:::.:.:.:::::::.:::::.:::
XP_005 HLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMR
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE6 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGL
::.:::::..::.:::::::::::.:::.::::::::.::::::: . ::.: .. .::
XP_005 TPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASGGL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE6 PLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSC-
: ::::.: .::..::.:::::::: ::::.: ::.:::: ..:::..:::::.:. .:
XP_005 PTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE6 -WPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWL-LIFSMILFIFLLGY
: . ..: :..: . :..:.. :::. :::. . : :. .:.: . ..::.
XP_005 RWELSEKRVNL--EQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE6 AWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLH
..: . .. ::.:::.: :::::: .:. ....:. :::.:... :::: ::::
XP_005 SYFVGALI-VHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLH
250 260 270 280 290
300 310 320 330 340 350
pF1KE6 VHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLE
:: :: : ..: : : :::::::::::: :::.:::..: :: :.::.:::::::: ::
XP_005 VHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLE
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE6 ARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVA
. :..: ::::::::::::::::::::::::: :::: .::::.: :::::::..:::.
XP_005 NQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVV
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE6 SVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAH
..:: .::::::::.::.::: :...::.::::.::: .:::.:: .: :..::.:
XP_005 RLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRD-RGTMWKVH
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE6 YVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVI
.::::::: ..:.:: ..: ::::.:..:.:::::::::::::. ::::.::.. :.
XP_005 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVM
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE6 KKVANALKEHQETIVPVTYQLSEL-NQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
..: .:. :::.:. :: ::..: : : ::.:::: ::.: : .:..
XP_005 ERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>XP_005274575 (OMIM: 300180,302950) PREDICTED: arylsulf (598 aa)
initn: 2224 init1: 1856 opt: 2363 Z-score: 2621.9 bits: 495.1 E(85289): 2.7e-139
Smith-Waterman score: 2363; 59.2% identity (82.6% similar) in 559 aa overlap (25-579:42-596)
10 20 30 40 50
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
. ..:::.:.:.:::::::.:::::.:::
XP_005 HLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMR
20 30 40 50 60 70
60 70 80 90 100 110
pF1KE6 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGL
::.:::::..::.:::::::::::.:::.::::::::.::::::: . ::.: .. .::
XP_005 TPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASGGL
80 90 100 110 120 130
120 130 140 150 160 170
pF1KE6 PLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSC-
: ::::.: .::..::.:::::::: ::::.: ::.:::: ..:::..:::::.:. .:
XP_005 PTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCA
140 150 160 170 180 190
180 190 200 210 220 230
pF1KE6 -WPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWL-LIFSMILFIFLLGY
: . ..: :..: . :..:.. :::. :::. . : :. .:.: . ..::.
XP_005 RWELSEKRVNL--EQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
200 210 220 230 240
240 250 260 270 280 290
pF1KE6 AWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLH
..: . .. ::.:::.: :::::: .:. ....:. :::.:... :::: ::::
XP_005 SYFVGALI-VHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLH
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE6 VHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLE
:: :: : ..: : : :::::::::::: :::.:::..: :: :.::.:::::::: ::
XP_005 VHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLE
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE6 ARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVA
. :..: ::::::::::::::::::::::::: :::: .::::.: :::::::..:::.
XP_005 NQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVV
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE6 SVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAH
..:: .::::::::.::.::: :...::.::::.::: .:::.:: .: :..::.:
XP_005 RLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRD-RGTMWKVH
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE6 YVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVI
.::::::: ..:.:: ..: ::::.:..:.:::::::::::::. ::::.::.. :.
XP_005 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVM
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE6 KKVANALKEHQETIVPVTYQLSEL-NQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
..: .:. :::.:. :: ::..: : : ::.:::: ::.: : .:..
XP_005 ERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
550 560 570 580 590
>>NP_001269557 (OMIM: 300180,302950) arylsulfatase E iso (614 aa)
initn: 2224 init1: 1856 opt: 2363 Z-score: 2621.8 bits: 495.2 E(85289): 2.7e-139
Smith-Waterman score: 2363; 59.2% identity (82.6% similar) in 559 aa overlap (25-579:58-612)
10 20 30 40 50
pF1KE6 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYGNDTMR
. ..:::.:.:.:::::::.:::::.:::
NP_001 HSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYGNNTMR
30 40 50 60 70 80
60 70 80 90 100 110
pF1KE6 TPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLAVPAGL
::.:::::..::.:::::::::::.:::.::::::::.::::::: . ::.: .. .::
NP_001 TPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTGASGGL
90 100 110 120 130 140
120 130 140 150 160 170
pF1KE6 PLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTLVDSC-
: ::::.: .::..::.:::::::: ::::.: ::.:::: ..:::..:::::.:. .:
NP_001 PTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSLMGDCA
150 160 170 180 190 200
180 190 200 210 220 230
pF1KE6 -WPDPSRNTELAFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWL-LIFSMILFIFLLGY
: . ..: :..: . :..:.. :::. :::. . : :. .:.: . ..::.
NP_001 RWELSEKRVNL--EQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLLLAS
210 220 230 240 250 260
240 250 260 270 280 290
pF1KE6 AWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFFSFLH
..: . .. ::.:::.: :::::: .:. ....:. :::.:... :::: ::::
NP_001 SYFVGALI-VHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSFLH
270 280 290 300 310 320
300 310 320 330 340 350
pF1KE6 VHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHGGHLE
:: :: : ..: : : :::::::::::: :::.:::..: :: :.::.:::::::: ::
NP_001 VHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGSLE
330 340 350 360 370 380
360 370 380 390 400 410
pF1KE6 ARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDILPTVA
. :..: ::::::::::::::::::::::::: :::: .::::.: :::::::..:::.
NP_001 NQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPTVV
390 400 410 420 430 440
420 430 440 450 460 470
pF1KE6 SVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSVWKAH
..:: .::::::::.::.::: :...::.::::.::: .:::.:: .: :..::.:
NP_001 RLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRD-RGTMWKVH
450 460 470 480 490 500
480 490 500 510 520 530
pF1KE6 YVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLYDFVI
.::::::: ..:.:: ..: ::::.:..:.:::::::::::::. ::::.::.. :.
NP_001 FVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQVM
510 520 530 540 550 560
540 550 560 570 580 590
pF1KE6 KKVANALKEHQETIVPVTYQLSEL-NQGRTWLKPCCGVFPFCLCDKEEEVSQPRGPNEKR
..: .:. :::.:. :: ::..: : : ::.:::: ::.: : .:..
NP_001 ERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
570 580 590 600 610
590 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 16:10:42 2016 done: Tue Nov 8 16:10:43 2016
Total Scan time: 7.930 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]