FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1967, 530 aa 1>>>pF1KE1967 530 - 530 aa - 530 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8168+/-0.000337; mu= 9.0563+/- 0.021 mean_var=192.1702+/-39.814, 0's: 0 Z-trim(121.6): 15 B-trim: 567 in 1/56 Lambda= 0.092519 statistics sampled from 38412 (38427) to 38412 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.761), E-opt: 0.2 (0.451), width: 16 Scan time: 11.300 The best scores are: opt bits E(85289) NP_004258 (OMIM: 603798) carbohydrate sulfotransfe ( 530) 3624 496.0 1.1e-139 XP_011521387 (OMIM: 217800,605294) PREDICTED: carb ( 395) 577 89.2 2.5e-17 NP_067628 (OMIM: 217800,605294) carbohydrate sulfo ( 395) 577 89.2 2.5e-17 XP_005256012 (OMIM: 217800,605294) PREDICTED: carb ( 395) 577 89.2 2.5e-17 NP_078809 (OMIM: 604817) carbohydrate sulfotransfe ( 411) 576 89.1 2.8e-17 NP_063939 (OMIM: 300375) carbohydrate sulfotransfe ( 486) 558 86.8 1.7e-16 XP_006718138 (OMIM: 143095,245600,603799) PREDICTE ( 479) 416 67.8 8.3e-11 NP_004264 (OMIM: 143095,245600,603799) carbohydrat ( 479) 416 67.8 8.3e-11 XP_011538671 (OMIM: 143095,245600,603799) PREDICTE ( 479) 416 67.8 8.3e-11 NP_003645 (OMIM: 603797) carbohydrate sulfotransfe ( 411) 295 51.6 5.4e-06 XP_006718419 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 293 51.4 6.8e-06 XP_016873948 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 293 51.4 6.8e-06 >>NP_004258 (OMIM: 603798) carbohydrate sulfotransferase (530 aa) initn: 3624 init1: 3624 opt: 3624 Z-score: 2628.5 bits: 496.0 E(85289): 1.1e-139 Smith-Waterman score: 3624; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE1 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA 430 440 450 460 470 480 490 500 510 520 530 pF1KE1 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :::::::::::::::::::::::::::::::::::::::::::::::::: NP_004 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL 490 500 510 520 530 >>XP_011521387 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa) initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17 Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...::::::: :. XP_011 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ 10 20 30 40 50 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : : XP_011 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR 60 70 80 90 100 110 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: . XP_011 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :.. XP_011 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN--------- 180 190 200 210 220 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. :. :: .: ... .: : .. ..: :.:: .:.:.: XP_011 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY 230 240 250 260 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ .::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: . XP_011 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN 270 280 290 300 310 320 480 490 500 510 520 530 pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ...::: :: : .:..:.:.: . .:::. : : .: ..:. :. :: XP_011 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS 330 340 350 360 370 380 XP_011 STASHPRN 390 >>NP_067628 (OMIM: 217800,605294) carbohydrate sulfotran (395 aa) initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17 Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...::::::: :. NP_067 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ 10 20 30 40 50 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : : NP_067 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR 60 70 80 90 100 110 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: . NP_067 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :.. NP_067 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN--------- 180 190 200 210 220 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. :. :: .: ... .: : .. ..: :.:: .:.:.: NP_067 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY 230 240 250 260 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ .::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: . NP_067 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN 270 280 290 300 310 320 480 490 500 510 520 530 pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ...::: :: : .:..:.:.: . .:::. : : .: ..:. :. :: NP_067 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS 330 340 350 360 370 380 NP_067 STASHPRN 390 >>XP_005256012 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa) initn: 822 init1: 299 opt: 577 Z-score: 432.2 bits: 89.2 E(85289): 2.5e-17 Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...::::::: :. XP_005 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ 10 20 30 40 50 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : : XP_005 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR 60 70 80 90 100 110 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: . XP_005 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :.. XP_005 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN--------- 180 190 200 210 220 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. :. :: .: ... .: : .. ..: :.:: .:.:.: XP_005 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY 230 240 250 260 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ .::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: . XP_005 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN 270 280 290 300 310 320 480 490 500 510 520 530 pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ...::: :: : .:..:.:.: . .:::. : : .: ..:. :. :: XP_005 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS 330 340 350 360 370 380 XP_005 STASHPRN 390 >>NP_078809 (OMIM: 604817) carbohydrate sulfotransferase (411 aa) initn: 821 init1: 293 opt: 576 Z-score: 431.3 bits: 89.1 E(85289): 2.8e-17 Smith-Waterman score: 865; 40.1% identity (67.0% similar) in 382 aa overlap (153-529:52-400) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...:::::::.:. NP_078 MWLPRFSSKTVTVLLLAQTTCLLLFIISRPGPSSPAG-GEDRVHVLVLSSWRSGSSFLGQ 30 40 50 60 70 80 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::.:.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : . : NP_078 LFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLMRSIFLCDMDVFDAYMPQS---R 90 100 110 120 130 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::... :. ::....:: : : :. . ... : ::: : : .. .: ::.: . NP_078 NLSAF--FNWATSRALCSPPACSAFPRGTISKQD--VCKTLCTRQPFSLAREACRSYSHV 140 150 160 170 180 190 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: .::: :. . .:: NP_078 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAV----LRSR-----EAAGPILARD- 200 210 220 230 240 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. . : :: : : .. .: : .. ..: :.:: .:.:.: NP_078 ----------NGIVLGTNGKWV--EADPH-LRLIREVCRSHVRIAEAATLKPPPFLRGRY 250 260 270 280 290 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKP---FVVSARNAT .::.:::. .:. .: .: :.:: ..:..: . :.: ::: . :: : .:.::: NP_078 RLVRFEDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIG-KPIEAFHTSSRNAR 300 310 320 330 340 480 490 500 510 520 530 pF1KE1 QAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ....::: :: : .: .:.: : . .:::. : : .. .::. :. :: NP_078 NVSQAWRHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVL-PRGPDHFSWA 350 360 370 380 390 400 NP_078 SPD 410 >>NP_063939 (OMIM: 300375) carbohydrate sulfotransferase (486 aa) initn: 1093 init1: 408 opt: 558 Z-score: 417.3 bits: 86.8 E(85289): 1.7e-16 Smith-Waterman score: 1211; 45.4% identity (68.2% similar) in 491 aa overlap (48-516:1-465) 20 30 40 50 60 70 pF1KE1 LQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCAGYALLLVLTMLNLLDYK :: ::. : .:::::: : :: NP_063 MKGRRRRRREYCK-FALLLVLYTLVLL--- 10 20 80 90 100 110 120 130 pF1KE1 WHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARLDLRTPYRPPAAAVG--- : :: : : . .. : : :. . .:. :::.: NP_063 -----LVPSVLDG------GRDGDKGAEHCP---GLQRSLGVWSLE------AAAAGERE 30 40 50 60 140 150 160 170 180 pF1KE1 -AAPAAAAGMAGVAAPPGNGTRGTGGVGD----KRQLVYVFTTWRSGSSFFGELFNQNPE .: : :: .:. : . .:.::. ..: .:: .:::.::::.::::::.:. NP_063 QGAEARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPD 70 80 90 100 110 120 190 200 210 220 230 240 pF1KE1 VFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGS-GGR-----N ::.::::.::.:: :::::: ::::: :::: .:.:::.::..::.: :. ..: : NP_063 VFYLYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTAN 130 140 150 160 170 180 250 260 270 280 290 300 pF1KE1 LTTLGIFGAATNKVVCSSPLCP-AYRKEV-VGLVDDRVCKK-CPPQRLARFEEECRKYRT ::: ..: ::::.:: :::: : : .. ::::.: .:.. ::: . .: ::::: . NP_063 LTTAALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPV 190 200 210 220 230 240 310 320 330 340 350 360 pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD .::: ::..:..::.::::::.:.:::..: :::::: .::..::.::.:::.::.:.:. NP_063 VVIKDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQ 250 260 270 280 290 300 370 380 390 400 410 pF1KE1 --PRAHRMPFLEAAGHKLGAKKEGV-GGP-ADYHALGAMEVICNSMAKTLQTALQPPDWL : ::. . ...: . :...... ..: ::. ::.::::.. . : : : :: NP_063 RGDRFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWL 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE1 QGHYLVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSG-SSSKPFVVSARN . .:: .:::::: .: :::. : :: . .. :::::: :.. ....:: .:::. NP_063 RRRYLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARD 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE1 ATQAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL : .:..::: :. .:..::: : : .:.: : : :: NP_063 AREAVHAWRERLSREQVRQVEAACAPAMRLLAYPR--SGEEGDAEQPREGETPLEMDADG 430 440 450 460 470 480 NP_063 AT >>XP_006718138 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa) initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11 Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472) 140 150 160 170 180 190 pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV : .:... . :: :.:::: ::.:::. .. XP_006 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI 100 110 120 130 140 150 200 210 220 230 240 pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL :.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .: XP_006 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV : . .: .... .: .:.: . :.: . :: .: : .. : ::. . .. XP_006 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR .:.::. .. : :: .:: :::.::.:::::::: .::. . : . . XP_006 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK-------- 280 290 300 310 320 370 380 390 400 410 420 pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV .:. :. : ..: : .. :.:. . . .:. : ::.:.:.. XP_006 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML 330 340 350 360 430 440 450 460 470 480 pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA :::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... . XP_006 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK 370 380 390 400 410 420 490 500 510 520 530 pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :: .. :. . :. : : ..::. . . . . : .::.. XP_006 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT 430 440 450 460 470 >>NP_004264 (OMIM: 143095,245600,603799) carbohydrate su (479 aa) initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11 Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472) 140 150 160 170 180 190 pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV : .:... . :: :.:::: ::.:::. .. NP_004 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI 100 110 120 130 140 150 200 210 220 230 240 pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL :.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .: NP_004 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV : . .: .... .: .:.: . :.: . :: .: : .. : ::. . .. NP_004 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR .:.::. .. : :: .:: :::.::.:::::::: .::. . : . . NP_004 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK-------- 280 290 300 310 320 370 380 390 400 410 420 pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV .:. :. : ..: : .. :.:. . . .:. : ::.:.:.. NP_004 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML 330 340 350 360 430 440 450 460 470 480 pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA :::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... . NP_004 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK 370 380 390 400 410 420 490 500 510 520 530 pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :: .. :. . :. : : ..::. . . . . : .::.. NP_004 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT 430 440 450 460 470 >>XP_011538671 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa) initn: 483 init1: 178 opt: 416 Z-score: 315.0 bits: 67.8 E(85289): 8.3e-11 Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472) 140 150 160 170 180 190 pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV : .:... . :: :.:::: ::.:::. .. XP_011 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI 100 110 120 130 140 150 200 210 220 230 240 pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL :.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .: XP_011 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV : . .: .... .: .:.: . :.: . :: .: : .. : ::. . .. XP_011 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR .:.::. .. : :: .:: :::.::.:::::::: .::. . : . . XP_011 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK-------- 280 290 300 310 320 370 380 390 400 410 420 pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV .:. :. : ..: : .. :.:. . . .:. : ::.:.:.. XP_011 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML 330 340 350 360 430 440 450 460 470 480 pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA :::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... . XP_011 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK 370 380 390 400 410 420 490 500 510 520 530 pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :: .. :. . :. : : ..::. . . . . : .::.. XP_011 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT 430 440 450 460 470 >>NP_003645 (OMIM: 603797) carbohydrate sulfotransferase (411 aa) initn: 653 init1: 243 opt: 295 Z-score: 228.5 bits: 51.6 E(85289): 5.4e-06 Smith-Waterman score: 631; 32.5% identity (62.7% similar) in 375 aa overlap (163-527:59-404) 140 150 160 170 180 190 pF1KE1 VGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEVFF .. . ...: :::::: :.::::. .::. NP_003 KSFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFY 30 40 50 60 70 80 200 210 220 230 240 pF1KE1 LYEPVWHVWQKLYP--------GDAVSLQGAARDMLSALYRCDLSVFQLY-SPAGSGGRN :.::..:: . : : .: . ::.::.: .:: ::: .. : .: : NP_003 LFEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPV---N 90 100 110 120 130 140 250 260 270 280 290 300 pF1KE1 LTTLGIFGAATNKVVCSSPLC-PAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRTLV :: :: ....:.:: :.: : ..: : . .:: :. : ::. .. NP_003 HTTDRIFRRGASRVLCSRPVCDPPGPADLV-LEEGDCVRKCGLLNLTVAAEACRERSHVA 150 160 170 180 190 200 310 320 330 340 350 360 pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR :: ::: .: : :..:: :.::::.::::::.. .:: .. .:.. .. : NP_003 IKTVRVPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSET----FRDTYRLWR----- 210 220 230 240 250 370 380 390 400 410 420 pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV . ..:.: : . . . ..:........:.:. : ::.:.:.. NP_003 -----LWYGTGRK----------PYNLD-VTQLTTVCEDFSNSVSTGLMRPPWLKGKYML 260 270 280 290 430 440 450 460 470 480 pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA ::::::. .:.: ...: :.:. .. .. .. : : :. . .: ..::.. .:. NP_003 VRYEDLARNPMKKTEEIYGFLGIPLDSHVARWIQNNTRGDPTLGKHKYGTVRNSAATAEK 300 310 320 330 340 350 490 500 510 520 530 pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :: :... . ... : : .: :::. . : ::.:. : .:... NP_003 WRFRLSYDIVAFAQNACQQVLAQLGYKIAASEEELKNPSVSLVEERDFRPFS 360 370 380 390 400 410 530 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 17:41:16 2016 done: Sun Nov 6 17:41:18 2016 Total Scan time: 11.300 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]