FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1967, 530 aa
1>>>pF1KE1967 530 - 530 aa - 530 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8168+/-0.000337; mu= 9.0563+/- 0.021
mean_var=192.1702+/-39.814, 0's: 0 Z-trim(121.6): 15 B-trim: 567 in 1/56
Lambda= 0.092519
statistics sampled from 38412 (38427) to 38412 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.761), E-opt: 0.2 (0.451), width: 16
Scan time: 11.300
The best scores are: opt bits E(85289)
NP_004258 (OMIM: 603798) carbohydrate sulfotransfe ( 530) 3624 496.0 1.1e-139
XP_011521387 (OMIM: 217800,605294) PREDICTED: carb ( 395) 577 89.2 2.5e-17
NP_067628 (OMIM: 217800,605294) carbohydrate sulfo ( 395) 577 89.2 2.5e-17
XP_005256012 (OMIM: 217800,605294) PREDICTED: carb ( 395) 577 89.2 2.5e-17
NP_078809 (OMIM: 604817) carbohydrate sulfotransfe ( 411) 576 89.1 2.8e-17
NP_063939 (OMIM: 300375) carbohydrate sulfotransfe ( 486) 558 86.8 1.7e-16
XP_006718138 (OMIM: 143095,245600,603799) PREDICTE ( 479) 416 67.8 8.3e-11
NP_004264 (OMIM: 143095,245600,603799) carbohydrat ( 479) 416 67.8 8.3e-11
XP_011538671 (OMIM: 143095,245600,603799) PREDICTE ( 479) 416 67.8 8.3e-11
NP_003645 (OMIM: 603797) carbohydrate sulfotransfe ( 411) 295 51.6 5.4e-06
XP_006718419 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 293 51.4 6.8e-06
XP_016873948 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 293 51.4 6.8e-06
>>NP_004258 (OMIM: 603798) carbohydrate sulfotransferase (530 aa)
initn: 3624 init1: 3624 opt: 3624 Z-score: 2628.5 bits: 496.0 E(85289): 1.1e-139
Smith-Waterman score: 3624; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530)
10 20 30 40 50 60
pF1KE1 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
430 440 450 460 470 480
490 500 510 520 530
pF1KE1 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
::::::::::::::::::::::::::::::::::::::::::::::::::
NP_004 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
490 500 510 520 530
>>XP_011521387 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa)
initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17
Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...::::::: :.
XP_011 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ
10 20 30 40 50
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : :
XP_011 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR
60 70 80 90 100 110
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: .
XP_011 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV
120 130 140 150 160 170
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :..
XP_011 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN---------
180 190 200 210 220
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. :. :: .: ... .: : .. ..: :.:: .:.:.:
XP_011 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY
230 240 250 260
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: .
XP_011 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN
270 280 290 300 310 320
480 490 500 510 520 530
pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
...::: :: : .:..:.:.: . .:::. : : .: ..:. :. ::
XP_011 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS
330 340 350 360 370 380
XP_011 STASHPRN
390
>>NP_067628 (OMIM: 217800,605294) carbohydrate sulfotran (395 aa)
initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17
Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...::::::: :.
NP_067 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ
10 20 30 40 50
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : :
NP_067 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR
60 70 80 90 100 110
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: .
NP_067 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV
120 130 140 150 160 170
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :..
NP_067 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN---------
180 190 200 210 220
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. :. :: .: ... .: : .. ..: :.:: .:.:.:
NP_067 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY
230 240 250 260
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: .
NP_067 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN
270 280 290 300 310 320
480 490 500 510 520 530
pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
...::: :: : .:..:.:.: . .:::. : : .: ..:. :. ::
NP_067 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS
330 340 350 360 370 380
NP_067 STASHPRN
390
>>XP_005256012 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa)
initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17
Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...::::::: :.
XP_005 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ
10 20 30 40 50
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : :
XP_005 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR
60 70 80 90 100 110
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: .
XP_005 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV
120 130 140 150 160 170
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :..
XP_005 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN---------
180 190 200 210 220
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. :. :: .: ... .: : .. ..: :.:: .:.:.:
XP_005 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY
230 240 250 260
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: .
XP_005 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN
270 280 290 300 310 320
480 490 500 510 520 530
pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
...::: :: : .:..:.:.: . .:::. : : .: ..:. :. ::
XP_005 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS
330 340 350 360 370 380
XP_005 STASHPRN
390
>>NP_078809 (OMIM: 604817) carbohydrate sulfotransferase (411 aa)
initn: 821 init1: 293 opt: 576 Z-score: 431.3 bits: 89.1 E(85289): 2.8e-17
Smith-Waterman score: 865; 40.1% identity (67.0% similar) in 382 aa overlap (153-529:52-400)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...:::::::.:.
NP_078 MWLPRFSSKTVTVLLLAQTTCLLLFIISRPGPSSPAG-GEDRVHVLVLSSWRSGSSFLGQ
30 40 50 60 70 80
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::.:.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : . :
NP_078 LFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLMRSIFLCDMDVFDAYMPQS---R
90 100 110 120 130
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::... :. ::....:: : : :. . ... : ::: : : .. .: ::.: .
NP_078 NLSAF--FNWATSRALCSPPACSAFPRGTISKQD--VCKTLCTRQPFSLAREACRSYSHV
140 150 160 170 180 190
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: .::: :. . .::
NP_078 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAV----LRSR-----EAAGPILARD-
200 210 220 230 240
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. . : :: : : .. .: : .. ..: :.:: .:.:.:
NP_078 ----------NGIVLGTNGKWV--EADPH-LRLIREVCRSHVRIAEAATLKPPPFLRGRY
250 260 270 280 290
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKP---FVVSARNAT
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: . :: : .:.:::
NP_078 RLVRFEDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIG-KPIEAFHTSSRNAR
300 310 320 330 340
480 490 500 510 520 530
pF1KE1 QAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
....::: :: : .: .:.: : . .:::. : : .. .::. :. ::
NP_078 NVSQAWRHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVL-PRGPDHFSWA
350 360 370 380 390 400
NP_078 SPD
410
>>NP_063939 (OMIM: 300375) carbohydrate sulfotransferase (486 aa)
initn: 1093 init1: 408 opt: 558 Z-score: 417.3 bits: 86.8 E(85289): 1.7e-16
Smith-Waterman score: 1211; 45.4% identity (68.2% similar) in 491 aa overlap (48-516:1-465)
20 30 40 50 60 70
pF1KE1 LQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCAGYALLLVLTMLNLLDYK
:: ::. : .:::::: : ::
NP_063 MKGRRRRRREYCK-FALLLVLYTLVLL---
10 20
80 90 100 110 120 130
pF1KE1 WHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARLDLRTPYRPPAAAVG---
: :: : : . .. : : :. . .:. :::.:
NP_063 -----LVPSVLDG------GRDGDKGAEHCP---GLQRSLGVWSLE------AAAAGERE
30 40 50 60
140 150 160 170 180
pF1KE1 -AAPAAAAGMAGVAAPPGNGTRGTGGVGD----KRQLVYVFTTWRSGSSFFGELFNQNPE
.: : :: .:. : . .:.::. ..: .:: .:::.::::.::::::.:.
NP_063 QGAEARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPD
70 80 90 100 110 120
190 200 210 220 230 240
pF1KE1 VFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGS-GGR-----N
::.::::.::.:: :::::: ::::: :::: .:.:::.::..::.: :. ..: :
NP_063 VFYLYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTAN
130 140 150 160 170 180
250 260 270 280 290 300
pF1KE1 LTTLGIFGAATNKVVCSSPLCP-AYRKEV-VGLVDDRVCKK-CPPQRLARFEEECRKYRT
::: ..: ::::.:: :::: : : .. ::::.: .:.. ::: . .: ::::: .
NP_063 LTTAALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPV
190 200 210 220 230 240
310 320 330 340 350 360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
.::: ::..:..::.::::::.:.:::..: :::::: .::..::.::.:::.::.:.:.
NP_063 VVIKDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQ
250 260 270 280 290 300
370 380 390 400 410
pF1KE1 --PRAHRMPFLEAAGHKLGAKKEGV-GGP-ADYHALGAMEVICNSMAKTLQTALQPPDWL
: ::. . ...: . :...... ..: ::. ::.::::.. . : : : ::
NP_063 RGDRFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWL
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE1 QGHYLVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSG-SSSKPFVVSARN
. .:: .:::::: .: :::. : :: . .. :::::: :.. ....:: .:::.
NP_063 RRRYLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARD
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE1 ATQAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
: .:..::: :. .:..::: : : .:.: : : ::
NP_063 AREAVHAWRERLSREQVRQVEAACAPAMRLLAYPR--SGEEGDAEQPREGETPLEMDADG
430 440 450 460 470 480
NP_063 AT
>>XP_006718138 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa)
initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11
Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472)
140 150 160 170 180 190
pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV
: .:... . :: :.:::: ::.:::. ..
XP_006 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI
100 110 120 130 140 150
200 210 220 230 240
pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL
:.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .:
XP_006 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV
: . .: .... .: .:.: . :.: . :: .: : .. : ::. . ..
XP_006 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
.:.::. .. : :: .:: :::.::.:::::::: .::. . : . .
XP_006 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK--------
280 290 300 310 320
370 380 390 400 410 420
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
.:. :. : ..: : .. :.:. . . .:. : ::.:.:..
XP_006 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML
330 340 350 360
430 440 450 460 470 480
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
:::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... .
XP_006 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK
370 380 390 400 410 420
490 500 510 520 530
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
:: .. :. . :. : : ..::. . . . . : .::..
XP_006 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT
430 440 450 460 470
>>NP_004264 (OMIM: 143095,245600,603799) carbohydrate su (479 aa)
initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11
Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472)
140 150 160 170 180 190
pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV
: .:... . :: :.:::: ::.:::. ..
NP_004 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI
100 110 120 130 140 150
200 210 220 230 240
pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL
:.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .:
NP_004 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV
: . .: .... .: .:.: . :.: . :: .: : .. : ::. . ..
NP_004 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
.:.::. .. : :: .:: :::.::.:::::::: .::. . : . .
NP_004 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK--------
280 290 300 310 320
370 380 390 400 410 420
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
.:. :. : ..: : .. :.:. . . .:. : ::.:.:..
NP_004 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML
330 340 350 360
430 440 450 460 470 480
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
:::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... .
NP_004 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK
370 380 390 400 410 420
490 500 510 520 530
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
:: .. :. . :. : : ..::. . . . . : .::..
NP_004 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT
430 440 450 460 470
>>XP_011538671 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa)
initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11
Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472)
140 150 160 170 180 190
pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV
: .:... . :: :.:::: ::.:::. ..
XP_011 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI
100 110 120 130 140 150
200 210 220 230 240
pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL
:.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .:
XP_011 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV
: . .: .... .: .:.: . :.: . :: .: : .. : ::. . ..
XP_011 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
.:.::. .. : :: .:: :::.::.:::::::: .::. . : . .
XP_011 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK--------
280 290 300 310 320
370 380 390 400 410 420
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
.:. :. : ..: : .. :.:. . . .:. : ::.:.:..
XP_011 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML
330 340 350 360
430 440 450 460 470 480
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
:::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... .
XP_011 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK
370 380 390 400 410 420
490 500 510 520 530
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
:: .. :. . :. : : ..::. . . . . : .::..
XP_011 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT
430 440 450 460 470
>>NP_003645 (OMIM: 603797) carbohydrate sulfotransferase (411 aa)
initn: 653 init1: 243 opt: 295 Z-score: 228.5 bits: 51.6 E(85289): 5.4e-06
Smith-Waterman score: 631; 32.5% identity (62.7% similar) in 375 aa overlap (163-527:59-404)
140 150 160 170 180 190
pF1KE1 VGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEVFF
.. . ...: :::::: :.::::. .::.
NP_003 KSFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFY
30 40 50 60 70 80
200 210 220 230 240
pF1KE1 LYEPVWHVWQKLYP--------GDAVSLQGAARDMLSALYRCDLSVFQLY-SPAGSGGRN
:.::..:: . : : .: . ::.::.: .:: ::: .. : .: :
NP_003 LFEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPV---N
90 100 110 120 130 140
250 260 270 280 290 300
pF1KE1 LTTLGIFGAATNKVVCSSPLC-PAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRTLV
:: :: ....:.:: :.: : ..: : . .:: :. : ::. ..
NP_003 HTTDRIFRRGASRVLCSRPVCDPPGPADLV-LEEGDCVRKCGLLNLTVAAEACRERSHVA
150 160 170 180 190 200
310 320 330 340 350 360
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
:: ::: .: : :..:: :.::::.::::::.. .:: .. .:.. .. :
NP_003 IKTVRVPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSET----FRDTYRLWR-----
210 220 230 240 250
370 380 390 400 410 420
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
. ..:.: : . . . ..:........:.:. : ::.:.:..
NP_003 -----LWYGTGRK----------PYNLD-VTQLTTVCEDFSNSVSTGLMRPPWLKGKYML
260 270 280 290
430 440 450 460 470 480
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
::::::. .:.: ...: :.:. .. .. .. : : :. . .: ..::.. .:.
NP_003 VRYEDLARNPMKKTEEIYGFLGIPLDSHVARWIQNNTRGDPTLGKHKYGTVRNSAATAEK
300 310 320 330 340 350
490 500 510 520 530
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
:: :... . ... : : .: :::. . : ::.:. : .:...
NP_003 WRFRLSYDIVAFAQNACQQVLAQLGYKIAASEEELKNPSVSLVEERDFRPFS
360 370 380 390 400 410
530 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 17:41:16 2016 done: Sun Nov 6 17:41:18 2016
Total Scan time: 11.300 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]