FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1259, 593 aa
1>>>pF1KE1259 593 - 593 aa - 593 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8059+/-0.000357; mu= 16.5869+/- 0.022
mean_var=85.0602+/-17.083, 0's: 0 Z-trim(115.2): 126 B-trim: 0 in 0/56
Lambda= 0.139063
statistics sampled from 25369 (25496) to 25369 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.299), width: 16
Scan time: 9.360
The best scores are: opt bits E(85289)
NP_001660 (OMIM: 300002) arylsulfatase D isoform a ( 593) 4204 853.7 0
XP_005274572 (OMIM: 300002) PREDICTED: arylsulfata ( 475) 3297 671.6 1.6e-192
NP_001011719 (OMIM: 300586) arylsulfatase H [Homo ( 562) 2645 540.9 4.3e-153
NP_000038 (OMIM: 300180,302950) arylsulfatase E is ( 589) 2616 535.1 2.5e-151
XP_005274576 (OMIM: 300180,302950) PREDICTED: aryl ( 589) 2616 535.1 2.5e-151
XP_005274575 (OMIM: 300180,302950) PREDICTED: aryl ( 598) 2616 535.1 2.6e-151
XP_016885014 (OMIM: 300180,302950) PREDICTED: aryl ( 614) 2616 535.1 2.6e-151
NP_001269557 (OMIM: 300180,302950) arylsulfatase E ( 614) 2616 535.1 2.6e-151
NP_001188467 (OMIM: 300003) arylsulfatase F precur ( 590) 2452 502.2 2e-141
NP_004033 (OMIM: 300003) arylsulfatase F precursor ( 590) 2452 502.2 2e-141
NP_001188468 (OMIM: 300003) arylsulfatase F precur ( 590) 2452 502.2 2e-141
XP_011543824 (OMIM: 300003) PREDICTED: arylsulfata ( 607) 2452 502.2 2.1e-141
XP_005274578 (OMIM: 300180,302950) PREDICTED: aryl ( 535) 2430 497.7 4e-140
NP_001269560 (OMIM: 300180,302950) arylsulfatase E ( 544) 2430 497.7 4.1e-140
XP_005274571 (OMIM: 300002) PREDICTED: arylsulfata ( 548) 2304 472.5 1.7e-132
NP_033667 (OMIM: 300002) arylsulfatase D isoform b ( 382) 2296 470.7 3.8e-132
NP_000342 (OMIM: 300747,308100) steryl-sulfatase i ( 583) 2005 412.5 2e-114
NP_001307680 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2004 412.3 2.3e-114
NP_001307681 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2004 412.3 2.3e-114
NP_001307679 (OMIM: 300747,308100) steryl-sulfatas ( 590) 2004 412.3 2.3e-114
NP_001307682 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2000 411.5 4e-114
NP_001307683 (OMIM: 300747,308100) steryl-sulfatas ( 578) 2000 411.5 4e-114
XP_011543823 (OMIM: 300180,302950) PREDICTED: aryl ( 402) 1357 282.4 2e-75
XP_016885015 (OMIM: 300180,302950) PREDICTED: aryl ( 427) 1357 282.4 2.1e-75
XP_016885017 (OMIM: 300003) PREDICTED: arylsulfata ( 297) 1019 214.5 4.1e-55
XP_016885016 (OMIM: 300003) PREDICTED: arylsulfata ( 561) 1022 215.3 4.5e-55
XP_011543825 (OMIM: 300003) PREDICTED: arylsulfata ( 578) 1022 215.3 4.6e-55
XP_011543826 (OMIM: 300003) PREDICTED: arylsulfata ( 462) 1019 214.6 5.9e-55
NP_001310472 (OMIM: 253000,612222) N-acetylgalacto ( 337) 604 131.3 5.3e-30
NP_001310473 (OMIM: 253000,612222) N-acetylgalacto ( 528) 605 131.6 6.6e-30
XP_016878602 (OMIM: 253000,612222) PREDICTED: N-ac ( 390) 579 126.3 1.9e-28
XP_016878601 (OMIM: 253000,612222) PREDICTED: N-ac ( 508) 580 126.6 2.1e-28
XP_016878600 (OMIM: 253000,612222) PREDICTED: N-ac ( 511) 580 126.6 2.1e-28
XP_011521284 (OMIM: 253000,612222) PREDICTED: N-ac ( 581) 580 126.6 2.3e-28
NP_000503 (OMIM: 253000,612222) N-acetylgalactosam ( 522) 402 90.8 1.2e-17
XP_005256358 (OMIM: 253000,612222) PREDICTED: N-ac ( 575) 402 90.9 1.3e-17
XP_011528993 (OMIM: 250100,607574) PREDICTED: aryl ( 387) 390 88.4 4.9e-17
NP_000478 (OMIM: 250100,607574) arylsulfatase A is ( 509) 390 88.4 6.2e-17
NP_001078894 (OMIM: 250100,607574) arylsulfatase A ( 509) 390 88.4 6.2e-17
NP_001078896 (OMIM: 250100,607574) arylsulfatase A ( 509) 390 88.4 6.2e-17
NP_001078895 (OMIM: 250100,607574) arylsulfatase A ( 509) 390 88.4 6.2e-17
XP_016884289 (OMIM: 250100,607574) PREDICTED: aryl ( 547) 390 88.5 6.5e-17
XP_006721842 (OMIM: 610008) PREDICTED: arylsulfata ( 329) 376 85.5 3e-16
XP_005257229 (OMIM: 610008) PREDICTED: arylsulfata ( 344) 376 85.5 3.1e-16
XP_011522847 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 85.6 3.6e-16
XP_016879857 (OMIM: 610008) PREDICTED: arylsulfata ( 413) 376 85.6 3.6e-16
XP_011522846 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 85.6 3.7e-16
XP_011522845 (OMIM: 610008) PREDICTED: arylsulfata ( 427) 376 85.6 3.7e-16
XP_016879855 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 85.6 4e-16
XP_016879856 (OMIM: 610008) PREDICTED: arylsulfata ( 461) 376 85.6 4e-16
>>NP_001660 (OMIM: 300002) arylsulfatase D isoform alpha (593 aa)
initn: 4204 init1: 4204 opt: 4204 Z-score: 4559.5 bits: 853.7 E(85289): 0
Smith-Waterman score: 4204; 99.8% identity (99.8% similar) in 593 aa overlap (1-593:1-593)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGCLF
::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::::
NP_001 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE1 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV
490 500 510 520 530 540
550 560 570 580 590
pF1KE1 IARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
:::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 IARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
550 560 570 580 590
>>XP_005274572 (OMIM: 300002) PREDICTED: arylsulfatase D (475 aa)
initn: 3297 init1: 3297 opt: 3297 Z-score: 3577.5 bits: 671.6 E(85289): 1.6e-192
Smith-Waterman score: 3297; 99.8% identity (99.8% similar) in 473 aa overlap (1-473:1-473)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGCLF
::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::::
XP_005 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFSVSARAVTGMAGVGCLF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV
:::::::::::::::::::::::::::::::::::::::::::::::::::::
XP_005 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDKR
430 440 450 460 470
490 500 510 520 530 540
pF1KE1 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV
>>NP_001011719 (OMIM: 300586) arylsulfatase H [Homo sapi (562 aa)
initn: 2287 init1: 1853 opt: 2645 Z-score: 2869.5 bits: 540.9 E(85289): 4.3e-153
Smith-Waterman score: 2645; 64.6% identity (84.3% similar) in 560 aa overlap (35-593:2-559)
10 20 30 40 50 60
pF1KE1 ARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYGNNTL
: :: .:::.:.::::::.::: :::::..
NP_001 MTRNA-RPNIVLLMADDLGVGDLCCYGNNSV
10 20 30
70 80 90 100 110 120
pF1KE1 RTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGM-DASNGYRALQWNAGSG
:::::.:: :::::::::::: .::::::::::::. .:::: .: : ::. : .:::
NP_001 STPNIDRLASEGVRLTQHLAAASMCTPSRAAFLTGRYPIRSGMVSAYNLNRAFTWLGGSG
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE1 GLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTLTND
::: ::::::..::..:: :::::::: :..::::.:::.::::::: ::::.:: : .:
NP_001 GLPTNETTFAKLLQHRGYRTGLIGKWHLGLSCASRNDHCYHPLNHGFHYFYGVPFGLLSD
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE1 CDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGCLFFIS
:. .. ::. :: .:: : ::: . : . .: : ... .: .. ::: :
NP_001 CQASKTPELHRWLRIKLWISTVALALVPFLLLIPKFARWFSVPWKVIFVFALLAFLFFTS
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE1 WYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSLLHV
::::.::.:::::::::::.. .::: ::.::::::::...:::.:. :::::.:.:::
NP_001 WYSSYGFTRRWNCILMRNHEIIQQPMKEEKVASLMLKEALAFIERYKREPFLLFFSFLHV
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE1 HIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGHLEA
: ::.. . :.:.:..: ::::::::::..::.:.:.... : : :..:::::.:::::
NP_001 HTPLISKKKFVGRSKYGRYGDNVEEMDWMVGKILDALDQERLANHTLVYFTSDNGGHLEP
280 290 300 310 320 330
370 380 390 400 410 420
pF1KE1 RDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPTVVQ
:: ::::::::::::::::::::::::::::.::.:: :::::.:::::::..::.
NP_001 LDGAVQLGGWNGIYKGGKGMGGWEGGIRVPGIFRWPSVLEAGRVINEPTSLMDIYPTLSY
340 350 360 370 380 390
430 440 450 460 470 480
pF1KE1 LVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKVHYT
. :: . :::::::..:.:::.: ..: ::::::::: .::..:::::: ..:::.::.
NP_001 IGGGILSQDRVIDGQNLMPLLEGRASHSDHEFLFHYCGVYLHTVRWHQKDCATVWKAHYV
400 410 420 430 440 450
490 500 510 520 530 540
pF1KE1 TPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAVIAR
::.:.:::.::::: :.: :::. ::.: ::::::.::::::: ::.::.:::. .:: .
NP_001 TPKFYPEGTGACYGSGICSCSGD-VTYHDPPLLFDISRDPSEALPLNPDNEPLFDSVIKK
460 470 480 490 500
550 560 570 580 590
pF1KE1 VGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
. ::. :::.::.:::::::. : .:::::::::: ::::.: .. : :
NP_001 MEAAIREHRRTLTPVPQQFSVFNTIWKPWLQPCCGTFPFCGCDKEDDILPMAP
510 520 530 540 550 560
>>NP_000038 (OMIM: 300180,302950) arylsulfatase E isofor (589 aa)
initn: 2674 init1: 2613 opt: 2616 Z-score: 2837.7 bits: 535.1 E(85289): 2.5e-151
Smith-Waterman score: 2616; 63.5% identity (82.8% similar) in 576 aa overlap (15-590:12-587)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
:. ::..: . : : . .: .:::::.:::::: ::.::::
NP_000 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYG
10 20 30 40 50
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
:::.::::::.:::.::.::::..:: :::::::::::::. :::: .: :::.:::..
NP_000 NNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
.::::: ::::::.::...::::::::::: :.:: : .:::::::.::::.::::::.:
NP_000 ASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE1 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGCLF
.:: . : . :. .: : ::: :::.::. .. :: : : . :.
NP_000 MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
. : : ... . .:.::::: .::::: ...:. :.:.:..:...:.::::::::.:.
NP_000 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSF
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE1 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
:::::::.: ::::: :::::::::::::..:..:.... .::.:::. ::::::::
NP_000 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE1 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
:: . :..: ::::::::::::::::::::::::::.:::::::::::::::::::::::
NP_000 LENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE1 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV
::.:.::::::::::::..:.::: :. .: ::::.::: . ::::::::.: :..:::
NP_000 VVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKV
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE1 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV
:..:: :.:::::::::: :::: :: :.:: :::::::::::::.. ::: :::... :
NP_000 HFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQV
480 490 500 510 520 530
550 560 570 580 590
pF1KE1 IARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
. :: :: ::..:::::: :.. . .:.:::::::: ::.: : .. :
NP_000 MERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>XP_005274576 (OMIM: 300180,302950) PREDICTED: arylsulf (589 aa)
initn: 2674 init1: 2613 opt: 2616 Z-score: 2837.7 bits: 535.1 E(85289): 2.5e-151
Smith-Waterman score: 2616; 63.5% identity (82.8% similar) in 576 aa overlap (15-590:12-587)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
:. ::..: . : : . .: .:::::.:::::: ::.::::
XP_005 MLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIGDIGCYG
10 20 30 40 50
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
:::.::::::.:::.::.::::..:: :::::::::::::. :::: .: :::.:::..
XP_005 NNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYRVLQWTG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
.::::: ::::::.::...::::::::::: :.:: : .:::::::.::::.::::::.:
XP_005 ASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFYGMPFSL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE1 TNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGCLF
.:: . : . :. .: : ::: :::.::. .. :: : : . :.
XP_005 MGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSALSAVLL
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE1 FISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFLSL
. : : ... . .:.::::: .::::: ...:. :.:.:..:...:.::::::::.:.
XP_005 LASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPFLLFVSF
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE1 LHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHGGH
:::::::.: ::::: :::::::::::::..:..:.... .::.:::. ::::::::
XP_005 LHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFTSDHGGS
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE1 LEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVFPT
:: . :..: ::::::::::::::::::::::::::.:::::::::::::::::::::::
XP_005 LENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSLMDVFPT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE1 VVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDSGSVWKV
::.:.::::::::::::..:.::: :. .: ::::.::: . ::::::::.: :..:::
XP_005 VVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDRGTMWKV
420 430 440 450 460 470
490 500 510 520 530 540
pF1KE1 HYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLYHAV
:..:: :.:::::::::: :::: :: :.:: :::::::::::::.. ::: :::... :
XP_005 HFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASEPVFYQV
480 490 500 510 520 530
550 560 570 580 590
pF1KE1 IARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
. :: :: ::..:::::: :.. . .:.:::::::: ::.: : .. :
XP_005 MERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
540 550 560 570 580
>>XP_005274575 (OMIM: 300180,302950) PREDICTED: arylsulf (598 aa)
initn: 2674 init1: 2613 opt: 2616 Z-score: 2837.6 bits: 535.1 E(85289): 2.6e-151
Smith-Waterman score: 2616; 63.5% identity (82.8% similar) in 576 aa overlap (15-590:21-596)
10 20 30 40 50
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTG
:. ::..: . : : . .: .:::::.:::::: :
XP_005 MSGSRERDNMLHLHHSCLCFRSWLPAMLAVLLSLAPSASSDISASRPNILLLMADDLGIG
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE1 DLGCYGNNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYR
:.:::::::.::::::.:::.::.::::..:: :::::::::::::. :::: .: :::
XP_005 DIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVRSGMVSSIGYR
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE1 ALQWNAGSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFY
.:::...::::: ::::::.::...::::::::::: :.:: : .:::::::.::::.::
XP_005 VLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHHPLHHGFDHFY
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE1 GMPFTLTNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMA
::::.: .:: . : . :. .: : ::: :::.::. .. :: : :
XP_005 GMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIPVSWMPVIWSA
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE1 GVGCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPF
. :.. : : ... . .:.::::: .::::: ...:. :.:.:..:...:.:::::
XP_005 LSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVASFLKRNKHGPF
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE1 LLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFT
:::.:.:::::::.: ::::: :::::::::::::..:..:.... .::.:::. :::
XP_005 LLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEGLSNSTLIYFT
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE1 SDHGGHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSL
::::: :: . :..: ::::::::::::::::::::::::::.:::::::::::::::::
XP_005 SDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPAGRVIGEPTSL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE1 MDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKDS
::::::::.:.::::::::::::..:.::: :. .: ::::.::: . ::::::::.:
XP_005 MDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFLHAARWHQRDR
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE1 GSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSE
:..::::..:: :.:::::::::: :::: :: :.:: :::::::::::::.. ::: ::
XP_005 GTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPSETHILTPASE
490 500 510 520 530 540
540 550 560 570 580 590
pF1KE1 PLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
:... :. :: :: ::..:::::: :.. . .:.:::::::: ::.: : .. :
XP_005 PVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCWCLREDDPQ
550 560 570 580 590
>>XP_016885014 (OMIM: 300180,302950) PREDICTED: arylsulf (614 aa)
initn: 2648 init1: 2613 opt: 2616 Z-score: 2837.5 bits: 535.1 E(85289): 2.6e-151
Smith-Waterman score: 2616; 63.5% identity (82.8% similar) in 576 aa overlap (15-590:37-612)
10 20 30 40
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNIL
:. ::..: . : : . .: .::::
XP_016 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNIL
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 LIMADDLGTGDLGCYGNNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFR
:.:::::: ::.:::::::.::::::.:::.::.::::..:: :::::::::::::. :
XP_016 LLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVR
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE1 SGMDASNGYRALQWNAGSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHH
::: .: :::.:::...::::: ::::::.::...::::::::::: :.:: : .:::::
XP_016 SGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHH
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE1 PLNHGFDYFYGMPFTLTNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFC
::.::::.::::::.: .:: . : . :. .: : ::: :::.::. ..
XP_016 PLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE1 VSARAVTGMAGVGCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVS
:: : : . :.. : : ... . .:.::::: .::::: ...:. :.:.:..:
XP_016 VSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVAS
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE1 YIERHKHGPFLLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNG
...:.::::::::.:.:::::::.: ::::: :::::::::::::..:..:.... .:
XP_016 FLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEG
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE1 LKNSTFTYFTSDHGGHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPA
:.:::. :::::::: :: . :..: ::::::::::::::::::::::::::.:::::::
XP_016 LSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPA
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE1 GRVIGEPTSLMDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHL
::::::::::::::::::.:.::::::::::::..:.::: :. .: ::::.::: . :
XP_016 GRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFL
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE1 HAARWHQKDSGSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPS
:::::::.: :..::::..:: :.:::::::::: :::: :: :.:: ::::::::::::
XP_016 HAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPS
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE1 EARPLTPDSEPLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCS
:.. ::: :::... :. :: :: ::..:::::: :.. . .:.:::::::: ::.:
XP_016 ETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCW
550 560 570 580 590 600
590
pF1KE1 CHEDGDGTP
: .. :
XP_016 CLREDDPQ
610
>>NP_001269557 (OMIM: 300180,302950) arylsulfatase E iso (614 aa)
initn: 2648 init1: 2613 opt: 2616 Z-score: 2837.5 bits: 535.1 E(85289): 2.6e-151
Smith-Waterman score: 2616; 63.5% identity (82.8% similar) in 576 aa overlap (15-590:37-612)
10 20 30 40
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNIL
:. ::..: . : : . .: .::::
NP_001 RCAPGSLDLMLPQAASEGIVFHSLQISLCFRSWLPAMLAVLLSLAPSASSDISASRPNIL
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 LIMADDLGTGDLGCYGNNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFR
:.:::::: ::.:::::::.::::::.:::.::.::::..:: :::::::::::::. :
NP_001 LLMADDLGIGDIGCYGNNTMRTPNIDRLAEDGVKLTQHISAASLCTPSRAAFLTGRYPVR
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE1 SGMDASNGYRALQWNAGSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHH
::: .: :::.:::...::::: ::::::.::...::::::::::: :.:: : .:::::
NP_001 SGMVSSIGYRVLQWTGASGGLPTNETTFAKILKEKGYATGLIGKWHLGLNCESASDHCHH
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE1 PLNHGFDYFYGMPFTLTNDCDPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFC
::.::::.::::::.: .:: . : . :. .: : ::: :::.::. ..
NP_001 PLHHGFDHFYGMPFSLMGDCARWELSEKRVNLEQKLNFLFQVLALVALTLVAGKLTHLIP
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE1 VSARAVTGMAGVGCLFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVS
:: : : . :.. : : ... . .:.::::: .::::: ...:. :.:.:..:
NP_001 VSWMPVIWSALSAVLLLASSYFVGALIVHADCFLMRNHTITEQPMCFQRTTPLILQEVAS
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE1 YIERHKHGPFLLFLSLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNG
...:.::::::::.:.:::::::.: ::::: :::::::::::::..:..:.... .:
NP_001 FLKRNKHGPFLLFVSFLHVHIPLITMENFLGKSLHGLYGDNVEEMDWMVGRILDTLDVEG
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE1 LKNSTFTYFTSDHGGHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPA
:.:::. :::::::: :: . :..: ::::::::::::::::::::::::::.:::::::
NP_001 LSNSTLIYFTSDHGGSLENQLGNTQYGGWNGIYKGGKGMGGWEGGIRVPGIFRWPGVLPA
370 380 390 400 410 420
410 420 430 440 450 460
pF1KE1 GRVIGEPTSLMDVFPTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHL
::::::::::::::::::.:.::::::::::::..:.::: :. .: ::::.::: . :
NP_001 GRVIGEPTSLMDVFPTVVRLAGGEVPQDRVIDGQDLLPLLLGTAQHSDHEFLMHYCERFL
430 440 450 460 470 480
470 480 490 500 510 520
pF1KE1 HAARWHQKDSGSVWKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPS
:::::::.: :..::::..:: :.:::::::::: :::: :: :.:: ::::::::::::
NP_001 HAARWHQRDRGTMWKVHFVTPVFQPEGAGACYGRKVCPCFGEKVVHHDPPLLFDLSRDPS
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE1 EARPLTPDSEPLYHAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCS
:.. ::: :::... :. :: :: ::..:::::: :.. . .:.:::::::: ::.:
NP_001 ETHILTPASEPVFYQVMERVQQAVWEHQRTLSPVPLQLDRLGNIWRPWLQPCCGPFPLCW
550 560 570 580 590 600
590
pF1KE1 CHEDGDGTP
: .. :
NP_001 CLREDDPQ
610
>>NP_001188467 (OMIM: 300003) arylsulfatase F precursor (590 aa)
initn: 2354 init1: 1976 opt: 2452 Z-score: 2659.9 bits: 502.2 E(85289): 2e-141
Smith-Waterman score: 2452; 59.8% identity (82.0% similar) in 577 aa overlap (15-588:4-577)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
: : . ..: ::.::. . .. ::::.:::.:::: :::::::
NP_001 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYG
10 20 30 40
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
:.:.:::.::.::.::::::::..:: ::.:::.::::::. .:::: .:.. :..: :
NP_001 NDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLA
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
.::: ::::.: .:...::.::::::::::.:: ::.:.:::: :.::::.:::::::
NP_001 VPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTL
110 120 130 140 150 160
190 200 210 220 230
pF1KE1 TNDC--DPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGC
...: ::.: :. :...::: .:..:..::::. :. :. : . .:
NP_001 VDSCWPDPSRNTEL--AFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIF
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE1 LFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFL
:. .:.:: :.:.:::.:..::::: :...:.:.:::.:..:::.. ::::.
NP_001 LLGYAWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFF
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE1 SLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHG
:.:::: :: ::. : : :.:::::::::::: ..::.:.::.: ::.:.:..:::::::
NP_001 SFLHVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHG
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE1 GHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVF
:::::: ::.::::::::::::::::::::::::::: .::: .::::.: :::::::..
NP_001 GHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDIL
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE1 PTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKD-SGSV
:::... :: .::::::::..:.::::: .: :::::::::..:::.:: :: ::::
NP_001 PTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSV
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE1 WKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLY
::.::.:: :.: ..:.:: ..: : :: ::.: :::::::::::::. :::: .:::.
NP_001 WKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLH
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE1 HAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
:: .:. :..::..:. :: :.: : . ::.:::: :::: : ..
NP_001 DFVIKKVANALKEHQETIVPVTYQLSELN-QGRTWLKPCCGVFPFCLCDKEEEVSQPRGP
530 540 550 560 570 580
NP_001 NEKR
590
>>NP_004033 (OMIM: 300003) arylsulfatase F precursor [Ho (590 aa)
initn: 2354 init1: 1976 opt: 2452 Z-score: 2659.9 bits: 502.2 E(85289): 2e-141
Smith-Waterman score: 2452; 59.8% identity (82.0% similar) in 577 aa overlap (15-588:4-577)
10 20 30 40 50 60
pF1KE1 MRSAARRGRAAPAARDSLPVLLFLCLLLKTCEPKTANAFKPNILLIMADDLGTGDLGCYG
: : . ..: ::.::. . .. ::::.:::.:::: :::::::
NP_004 MRPRRPLVFMSLVCALLNTCQAHRVHDDKPNIVLIMVDDLGIGDLGCYG
10 20 30 40
70 80 90 100 110 120
pF1KE1 NNTLRTPNIDQLAEEGVRLTQHLAAAPLCTPSRAAFLTGRHSFRSGMDASNGYRALQWNA
:.:.:::.::.::.::::::::..:: ::.:::.::::::. .:::: .:.. :..: :
NP_004 NDTMRTPHIDRLAREGVRLTQHISAASLCSPSRSAFLTGRYPIRSGMVSSGNRRVIQNLA
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE1 GSGGLPENETTFARILQQHGYATGLIGKWHQGVNCASRGDHCHHPLNHGFDYFYGMPFTL
.::: ::::.: .:...::.::::::::::.:: ::.:.:::: :.::::.:::::::
NP_004 VPAGLPLNETTLAALLKKQGYSTGLIGKWHQGLNCDSRSDQCHHPYNYGFDYYYGMPFTL
110 120 130 140 150 160
190 200 210 220 230
pF1KE1 TNDC--DPGRPPEVDAALRAQLWGYTQFLALGILTLAAGQTCGFFCVSARAVTGMAGVGC
...: ::.: :. :...::: .:..:..::::. :. :. : . .:
NP_004 VDSCWPDPSRNTEL--AFESQLWLCVQLVAIAILTLTFGKLSGWVSVPWLLIFSMILFIF
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE1 LFFISWYSSFGFVRRWNCILMRNHDVTEQPMVLEKTASLMLKEAVSYIERHKHGPFLLFL
:. .:.:: :.:.:::.:..::::: :...:.:.:::.:..:::.. ::::.
NP_004 LLGYAWFSSHTSPLYWDCLLMRGHEITEQPMKAERAGSIMVKEAISFLERHSKETFLLFF
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE1 SLLHVHIPLVTTSAFLGKSQHGLYGDNVEEMDWLIGKVLNAIEDNGLKNSTFTYFTSDHG
:.:::: :: ::. : : :.:::::::::::: ..::.:.::.: ::.:.:..:::::::
NP_004 SFLHVHTPLPTTDDFTGTSKHGLYGDNVEEMDSMVGKILDAIDDFGLRNNTLVYFTSDHG
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE1 GHLEARDGHSQLGGWNGIYKGGKGMGGWEGGIRVPGIFHWPGVLPAGRVIGEPTSLMDVF
:::::: ::.::::::::::::::::::::::::::: .::: .::::.: :::::::..
NP_004 GHLEARRGHAQLGGWNGIYKGGKGMGGWEGGIRVPGIVRWPGKVPAGRLIKEPTSLMDIL
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE1 PTVVQLVGGEVPQDRVIDGHSLVPLLQGAEARSAHEFLFHYCGQHLHAARWHQKD-SGSV
:::... :: .::::::::..:.::::: .: :::::::::..:::.:: :: ::::
NP_004 PTVASVSGGSLPQDRVIDGRDLMPLLQGNVRHSEHEFLFHYCGSYLHAVRWIPKDDSGSV
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE1 WKVHYTTPQFHPEGAGACYGRGVCPCSGEGVTHHRPPLLFDLSRDPSEARPLTPDSEPLY
::.::.:: :.: ..:.:: ..: : :: ::.: :::::::::::::. :::: .:::.
NP_004 WKAHYVTPVFQPPASGGCYVTSLCRCFGEQVTYHNPPLLFDLSRDPSESTPLTPATEPLH
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE1 HAVIARVGAAVSEHRQTLSPVPQQFSMSNILWKPWLQPCCGHFPFCSCHEDGDGTP
:: .:. :..::..:. :: :.: : . ::.:::: :::: : ..
NP_004 DFVIKKVANALKEHQETIVPVTYQLSELN-QGRTWLKPCCGVFPFCLCDKEEEVSQPRGP
530 540 550 560 570 580
NP_004 NEKR
590
593 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 11:14:27 2016 done: Sun Nov 6 11:14:28 2016
Total Scan time: 9.360 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]