FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1865, 386 aa 1>>>pF1KE1865 386 - 386 aa - 386 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0330+/-0.000412; mu= 18.6609+/- 0.025 mean_var=68.0860+/-13.883, 0's: 0 Z-trim(110.7): 50 B-trim: 33 in 1/52 Lambda= 0.155434 statistics sampled from 19020 (19055) to 19020 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.598), E-opt: 0.2 (0.223), width: 16 Scan time: 7.050 The best scores are: opt bits E(85289) XP_005256012 (OMIM: 217800,605294) PREDICTED: carb ( 395) 1337 309.1 1.2e-83 XP_011521387 (OMIM: 217800,605294) PREDICTED: carb ( 395) 1337 309.1 1.2e-83 NP_067628 (OMIM: 217800,605294) carbohydrate sulfo ( 395) 1337 309.1 1.2e-83 NP_078809 (OMIM: 604817) carbohydrate sulfotransfe ( 411) 1334 308.4 1.9e-83 NP_003645 (OMIM: 603797) carbohydrate sulfotransfe ( 411) 745 176.4 1.1e-43 XP_016873948 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 745 176.4 1.1e-43 XP_006718419 (OMIM: 603797) PREDICTED: carbohydrat ( 432) 745 176.4 1.1e-43 NP_004264 (OMIM: 143095,245600,603799) carbohydrat ( 479) 684 162.7 1.6e-39 XP_006718138 (OMIM: 143095,245600,603799) PREDICTE ( 479) 684 162.7 1.6e-39 XP_011538671 (OMIM: 143095,245600,603799) PREDICTE ( 479) 684 162.7 1.6e-39 NP_004258 (OMIM: 603798) carbohydrate sulfotransfe ( 530) 318 80.7 9e-15 NP_063939 (OMIM: 300375) carbohydrate sulfotransfe ( 486) 317 80.4 9.8e-15 >>XP_005256012 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa) initn: 1336 init1: 645 opt: 1337 Z-score: 1622.9 bits: 309.1 E(85289): 1.2e-83 Smith-Waterman score: 1337; 56.8% identity (77.5% similar) in 373 aa overlap (14-376:6-375) 10 20 30 40 50 pF1KE1 MLLPKKMKLLLFLVSQMAILAL-----FFHMYSHNISSLSMKAQPE-RMHVLVLSSWRSG ::. :. :: :. .. . . : : : :.::::::::::: XP_005 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAGGEARVHVLVLSSWRSG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYME ::::::::.:::::::::::::::: :..:..: ::::::::.:.::::::.:::::. XP_005 SSFVGQLFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYL- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHV : : :.:::: :::::: :::. .:. : .: :. ::..: : ....:::::::: XP_005 PWRRNLSDLFQWAVSRALCSPPACSAFPRGAISSEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQ ::::::::::: :::::.::.:::.:::::::::::.::::.: : :. ::.: . XP_005 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDNGIVLGTNGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 KLKKEDQPYYVMQVICQSQLEIYK--TIQSLPKALQERYLLVRYEDLARAPVAQTSRMYE .. : :.. .:.:...: . :.. : :. :: :::.::::: :.:. .: XP_005 WVEA-DPGLRVVREVCRSHVRIAEAATLKP-PPFLRGRYRLVRFEDLAREPLAEIRALYA 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 FVGLEFLPHLQTWVHNITRGKGMGDH--AFHTNARDALNVSQAWRWSLPYEKVSRLQKAC :.:: . :.:..:.::::.:.: : . ::.:..:.::::::::: .::. :. :.:. : XP_005 FTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALNVSQAWRHALPFAKIRRVQELC 290 300 310 320 330 340 360 370 380 pF1KE1 GDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH . :..::::: : ::.::::: :::. XP_005 AGALQLLGYRPVYSEDEQRNLALDLVLPRGLNGFTWASSTASHPRN 350 360 370 380 390 >>XP_011521387 (OMIM: 217800,605294) PREDICTED: carbohyd (395 aa) initn: 1336 init1: 645 opt: 1337 Z-score: 1622.9 bits: 309.1 E(85289): 1.2e-83 Smith-Waterman score: 1337; 56.8% identity (77.5% similar) in 373 aa overlap (14-376:6-375) 10 20 30 40 50 pF1KE1 MLLPKKMKLLLFLVSQMAILAL-----FFHMYSHNISSLSMKAQPE-RMHVLVLSSWRSG ::. :. :: :. .. . . : : : :.::::::::::: XP_011 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAGGEARVHVLVLSSWRSG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYME ::::::::.:::::::::::::::: :..:..: ::::::::.:.::::::.:::::. XP_011 SSFVGQLFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYL- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHV : : :.:::: :::::: :::. .:. : .: :. ::..: : ....:::::::: XP_011 PWRRNLSDLFQWAVSRALCSPPACSAFPRGAISSEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQ ::::::::::: :::::.::.:::.:::::::::::.::::.: : :. ::.: . XP_011 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDNGIVLGTNGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 KLKKEDQPYYVMQVICQSQLEIYK--TIQSLPKALQERYLLVRYEDLARAPVAQTSRMYE .. : :.. .:.:...: . :.. : :. :: :::.::::: :.:. .: XP_011 WVEA-DPGLRVVREVCRSHVRIAEAATLKP-PPFLRGRYRLVRFEDLAREPLAEIRALYA 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 FVGLEFLPHLQTWVHNITRGKGMGDH--AFHTNARDALNVSQAWRWSLPYEKVSRLQKAC :.:: . :.:..:.::::.:.: : . ::.:..:.::::::::: .::. :. :.:. : XP_011 FTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALNVSQAWRHALPFAKIRRVQELC 290 300 310 320 330 340 360 370 380 pF1KE1 GDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH . :..::::: : ::.::::: :::. XP_011 AGALQLLGYRPVYSEDEQRNLALDLVLPRGLNGFTWASSTASHPRN 350 360 370 380 390 >>NP_067628 (OMIM: 217800,605294) carbohydrate sulfotran (395 aa) initn: 1336 init1: 645 opt: 1337 Z-score: 1622.9 bits: 309.1 E(85289): 1.2e-83 Smith-Waterman score: 1337; 56.8% identity (77.5% similar) in 373 aa overlap (14-376:6-375) 10 20 30 40 50 pF1KE1 MLLPKKMKLLLFLVSQMAILAL-----FFHMYSHNISSLSMKAQPE-RMHVLVLSSWRSG ::. :. :: :. .. . . : : : :.::::::::::: NP_067 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAGGEARVHVLVLSSWRSG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYME ::::::::.:::::::::::::::: :..:..: ::::::::.:.::::::.:::::. NP_067 SSFVGQLFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYL- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHV : : :.:::: :::::: :::. .:. : .: :. ::..: : ....:::::::: NP_067 PWRRNLSDLFQWAVSRALCSPPACSAFPRGAISSEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQ ::::::::::: :::::.::.:::.:::::::::::.::::.: : :. ::.: . NP_067 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDNGIVLGTNGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 KLKKEDQPYYVMQVICQSQLEIYK--TIQSLPKALQERYLLVRYEDLARAPVAQTSRMYE .. : :.. .:.:...: . :.. : :. :: :::.::::: :.:. .: NP_067 WVEA-DPGLRVVREVCRSHVRIAEAATLKP-PPFLRGRYRLVRFEDLAREPLAEIRALYA 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 FVGLEFLPHLQTWVHNITRGKGMGDH--AFHTNARDALNVSQAWRWSLPYEKVSRLQKAC :.:: . :.:..:.::::.:.: : . ::.:..:.::::::::: .::. :. :.:. : NP_067 FTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALNVSQAWRHALPFAKIRRVQELC 290 300 310 320 330 340 360 370 380 pF1KE1 GDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH . :..::::: : ::.::::: :::. NP_067 AGALQLLGYRPVYSEDEQRNLALDLVLPRGLNGFTWASSTASHPRN 350 360 370 380 390 >>NP_078809 (OMIM: 604817) carbohydrate sulfotransferase (411 aa) initn: 1284 init1: 622 opt: 1334 Z-score: 1619.0 bits: 308.4 E(85289): 1.9e-83 Smith-Waterman score: 1334; 54.1% identity (77.2% similar) in 381 aa overlap (1-376:22-397) 10 20 30 pF1KE1 MLLPK--KMKLLLFLVSQMAILALFFHMYSHNISSLSMK : ::. . . ..:..: . : :: . :. : : NP_078 MGMRARVPKVAHSTRRPPAARMWLPRFSSKTVTVLLLAQTTCLLLF--IISRPGPS-SPA 10 20 30 40 50 40 50 60 70 80 90 pF1KE1 AQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDL . .:.::::::::::::::.::::.:::::::::::::::: :..:..: :::::::: NP_078 GGEDRVHVLVLSSWRSGSSFLGQLFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE1 IRAVFLCDMSVFDAYMEPGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCS .:..:::::.:::::: : : :..:.: .:::::: :::. .:. : . :. ::. NP_078 MRSIFLCDMDVFDAYM-PQSRNLSAFFNWATSRALCSPPACSAFPRGTISKQDVCKTLCT 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE1 QQPFEVVEKACRSYSHVVLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT .::: ....::::::::::::::::::: :::::.::.:::.:::::::::::.:::: . NP_078 RQPFSLAREACRSYSHVVLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREAA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE1 KGDLMIDSRIVMGQHEQKLKKEDQPYYVMQVICQSQLEIYKTIQSLPKA-LQERYLLVRY : :. ::.: . : . : ... .:.:...: .. : :. :: :::. NP_078 GPILARDNGIVLGTN-GKWVEADPHLRLIREVCRSHVRIAEAATLKPPPFLRGRYRLVRF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE1 EDLARAPVAQTSRMYEFVGLEFLPHLQTWVHNITRGKGMGD--HAFHTNARDALNVSQAW ::::: :.:. .: :.:: . :.:..:.::::.:.:.: .::::..:.: :::::: NP_078 EDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIGKPIEAFHTSSRNARNVSQAW 300 310 320 330 340 350 340 350 360 370 380 pF1KE1 RWSLPYEKVSRLQKACGDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH : .::. :. :.:..:. :..::::: : : ..::.: :::. NP_078 RHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVLPRGPDHFSWASPD 360 370 380 390 400 410 >>NP_003645 (OMIM: 603797) carbohydrate sulfotransferase (411 aa) initn: 708 init1: 241 opt: 745 Z-score: 905.2 bits: 176.4 E(85289): 1.1e-43 Smith-Waterman score: 745; 36.7% identity (64.8% similar) in 341 aa overlap (42-370:60-396) 20 30 40 50 60 70 pF1KE1 FLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYL . :.:.:.. :::::::::::.:: ::::: NP_003 SFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFYL 30 40 50 60 70 80 80 90 100 110 120 pF1KE1 MEPAWHVWMT----FKQSTA----WMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQSS- .:: .:: : : :. . .. : :::.:... ::. .. :..: : ... NP_003 FEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPVNHTTD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE1 -LFQWENSRALCSAPACDII-PQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR .:. ::.::: :.:: : : .. .. : :. . :. .::: :::..: :: NP_003 RIFRRGASRVLCSRPVCDPPGPADLVLEEGDCVRKCGLLNLTVAAEACRERSHVAIKTVR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED ....: :..:: :::....::::::... :: .: : . :. .: . : . NP_003 VPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSETFRDTYRLWRLWYGTGR---KPYN 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE1 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP . ..:.. . .: : :. .:.::::::::: :. .: ..: :.:. . NP_003 LDVTQLTTVCEDFSNSVSTGLMRPPWLKGKYMLVRYEDLARNPMKKTEEIYGFLGIPLDS 270 280 290 300 310 320 310 320 330 340 350 pF1KE1 HLQTWVHNITRGKG-MGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :. :..: ::: .: : . : .:.. ... ::. : :. :. :.:: ... ::: NP_003 HVARWIQNNTRGDPTLGKHKYGT-VRNSAATAEKWRFRLSYDIVAFAQNACQQVLAQLGY 330 340 350 360 370 380 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . . ::.: .: NP_003 KIAASEEELKNPSVSLVEERDFRPFS 390 400 410 >>XP_016873948 (OMIM: 603797) PREDICTED: carbohydrate su (432 aa) initn: 687 init1: 241 opt: 745 Z-score: 904.9 bits: 176.4 E(85289): 1.1e-43 Smith-Waterman score: 745; 36.7% identity (64.8% similar) in 341 aa overlap (42-370:60-396) 20 30 40 50 60 70 pF1KE1 FLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYL . :.:.:.. :::::::::::.:: ::::: XP_016 SFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFYL 30 40 50 60 70 80 80 90 100 110 120 pF1KE1 MEPAWHVWMT----FKQSTA----WMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQSS- .:: .:: : : :. . .. : :::.:... ::. .. :..: : ... XP_016 FEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPVNHTTD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE1 -LFQWENSRALCSAPACDII-PQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR .:. ::.::: :.:: : : .. .. : :. . :. .::: :::..: :: XP_016 RIFRRGASRVLCSRPVCDPPGPADLVLEEGDCVRKCGLLNLTVAAEACRERSHVAIKTVR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED ....: :..:: :::....::::::... :: .: : . :. .: . : . XP_016 VPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSETFRDTYRLWRLWYGTGR---KPYN 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE1 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP . ..:.. . .: : :. .:.::::::::: :. .: ..: :.:. . XP_016 LDVTQLTTVCEDFSNSVSTGLMRPPWLKGKYMLVRYEDLARNPMKKTEEIYGFLGIPLDS 270 280 290 300 310 320 310 320 330 340 350 pF1KE1 HLQTWVHNITRGKG-MGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :. :..: ::: .: : . : .:.. ... ::. : :. :. :.:: ... ::: XP_016 HVARWIQNNTRGDPTLGKHKYGT-VRNSAATAEKWRFRLSYDIVAFAQNACQQVLAQLGY 330 340 350 360 370 380 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . . ::.: .: XP_016 KIAASEEELKNPSSVVMLSVCLSLVAAPGPVMTDESYELLIDLGVHL 390 400 410 420 430 >>XP_006718419 (OMIM: 603797) PREDICTED: carbohydrate su (432 aa) initn: 687 init1: 241 opt: 745 Z-score: 904.9 bits: 176.4 E(85289): 1.1e-43 Smith-Waterman score: 745; 36.7% identity (64.8% similar) in 341 aa overlap (42-370:60-396) 20 30 40 50 60 70 pF1KE1 FLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYL . :.:.:.. :::::::::::.:: ::::: XP_006 SFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFYL 30 40 50 60 70 80 80 90 100 110 120 pF1KE1 MEPAWHVWMT----FKQSTA----WMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQSS- .:: .:: : : :. . .. : :::.:... ::. .. :..: : ... XP_006 FEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPVNHTTD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE1 -LFQWENSRALCSAPACDII-PQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR .:. ::.::: :.:: : : .. .. : :. . :. .::: :::..: :: XP_006 RIFRRGASRVLCSRPVCDPPGPADLVLEEGDCVRKCGLLNLTVAAEACRERSHVAIKTVR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED ....: :..:: :::....::::::... :: .: : . :. .: . : . XP_006 VPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSETFRDTYRLWRLWYGTGR---KPYN 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE1 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP . ..:.. . .: : :. .:.::::::::: :. .: ..: :.:. . XP_006 LDVTQLTTVCEDFSNSVSTGLMRPPWLKGKYMLVRYEDLARNPMKKTEEIYGFLGIPLDS 270 280 290 300 310 320 310 320 330 340 350 pF1KE1 HLQTWVHNITRGKG-MGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :. :..: ::: .: : . : .:.. ... ::. : :. :. :.:: ... ::: XP_006 HVARWIQNNTRGDPTLGKHKYGT-VRNSAATAEKWRFRLSYDIVAFAQNACQQVLAQLGY 330 340 350 360 370 380 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . . ::.: .: XP_006 KIAASEEELKNPSSVVMLSVCLSLVAAPGPVMTDESYELLIDLGVHL 390 400 410 420 430 >>NP_004264 (OMIM: 143095,245600,603799) carbohydrate su (479 aa) initn: 667 init1: 203 opt: 684 Z-score: 830.4 bits: 162.7 E(85289): 1.6e-39 Smith-Waterman score: 684; 33.1% identity (65.7% similar) in 347 aa overlap (38-376:129-470) 10 20 30 40 50 60 pF1KE1 KLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPD : :.: :::.... :.::::::..:.:. . NP_004 LQLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRR-HVLLMATTRTGSSFVGEFFNQQGN 100 110 120 130 140 150 70 80 90 100 110 120 pF1KE1 VFYLMEPAWHVWMT--FKQSTAWMLHMAV--RDLIRAVFLCDMSVFDAYMEPGPRRQSSL .:::.:: ::. : :. . : :. ::... .::::. :.. .. : :. . . NP_004 IFYLFEPLWHIERTVSFEPGGANAAGSALVYRDVLKQLFLCDLYVLEHFITPLPEDHLTQ 160 170 180 190 200 210 130 140 150 160 170 180 pF1KE1 FQWE--NSRALCSAPACDIIPQDEIIPRAHCR-LLCSQQPFEVVEKACRSYSHVVLKEVR :... .::.:: :.: . . ... . ::. :. .. .::: :..:: :: NP_004 FMFRRGSSRSLCEDPVCTPFVK-KVFEKYHCKNRRCGPLNVTLAAEACRRKEHMALKAVR 220 230 240 250 260 270 190 200 210 220 230 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT-KGDLMIDSRIVMGQHEQKLKKE . .:. : :: .:: :.:....::::::::. :: . : .. . . .. :..: NP_004 IRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKKWLDDEGQDGLREE 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE1 DQPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFL . .. :.: . : :. ::.::::::.::.:. .. .::.:.:. . NP_004 E--VQRLRGNCESIRLSAELGLRQPAWLRGRYMLVRYEDVARGPLQKAREMYRFAGIPLT 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE1 PHLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :... :... :.. :. . :. ... . . ::.:.:.. .. .: ::: :: :.:: NP_004 PQVEDWIQKNTQAAHDGSGIYSTQ-KNSSEQFEKWRFSMPFKLAQVVQAACGPAMRLFGY 400 410 420 430 440 450 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . .:. : ..:: NP_004 KLARDAAALTNRSVSLLEERGTFWVT 460 470 >>XP_006718138 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa) initn: 667 init1: 203 opt: 684 Z-score: 830.4 bits: 162.7 E(85289): 1.6e-39 Smith-Waterman score: 684; 33.1% identity (65.7% similar) in 347 aa overlap (38-376:129-470) 10 20 30 40 50 60 pF1KE1 KLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPD : :.: :::.... :.::::::..:.:. . XP_006 LQLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRR-HVLLMATTRTGSSFVGEFFNQQGN 100 110 120 130 140 150 70 80 90 100 110 120 pF1KE1 VFYLMEPAWHVWMT--FKQSTAWMLHMAV--RDLIRAVFLCDMSVFDAYMEPGPRRQSSL .:::.:: ::. : :. . : :. ::... .::::. :.. .. : :. . . XP_006 IFYLFEPLWHIERTVSFEPGGANAAGSALVYRDVLKQLFLCDLYVLEHFITPLPEDHLTQ 160 170 180 190 200 210 130 140 150 160 170 180 pF1KE1 FQWE--NSRALCSAPACDIIPQDEIIPRAHCR-LLCSQQPFEVVEKACRSYSHVVLKEVR :... .::.:: :.: . . ... . ::. :. .. .::: :..:: :: XP_006 FMFRRGSSRSLCEDPVCTPFVK-KVFEKYHCKNRRCGPLNVTLAAEACRRKEHMALKAVR 220 230 240 250 260 270 190 200 210 220 230 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT-KGDLMIDSRIVMGQHEQKLKKE . .:. : :: .:: :.:....::::::::. :: . : .. . . .. :..: XP_006 IRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKKWLDDEGQDGLREE 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE1 DQPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFL . .. :.: . : :. ::.::::::.::.:. .. .::.:.:. . XP_006 E--VQRLRGNCESIRLSAELGLRQPAWLRGRYMLVRYEDVARGPLQKAREMYRFAGIPLT 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE1 PHLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :... :... :.. :. . :. ... . . ::.:.:.. .. .: ::: :: :.:: XP_006 PQVEDWIQKNTQAAHDGSGIYSTQ-KNSSEQFEKWRFSMPFKLAQVVQAACGPAMRLFGY 400 410 420 430 440 450 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . .:. : ..:: XP_006 KLARDAAALTNRSVSLLEERGTFWVT 460 470 >>XP_011538671 (OMIM: 143095,245600,603799) PREDICTED: c (479 aa) initn: 667 init1: 203 opt: 684 Z-score: 830.4 bits: 162.7 E(85289): 1.6e-39 Smith-Waterman score: 684; 33.1% identity (65.7% similar) in 347 aa overlap (38-376:129-470) 10 20 30 40 50 60 pF1KE1 KLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPD : :.: :::.... :.::::::..:.:. . XP_011 LQLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRR-HVLLMATTRTGSSFVGEFFNQQGN 100 110 120 130 140 150 70 80 90 100 110 120 pF1KE1 VFYLMEPAWHVWMT--FKQSTAWMLHMAV--RDLIRAVFLCDMSVFDAYMEPGPRRQSSL .:::.:: ::. : :. . : :. ::... .::::. :.. .. : :. . . XP_011 IFYLFEPLWHIERTVSFEPGGANAAGSALVYRDVLKQLFLCDLYVLEHFITPLPEDHLTQ 160 170 180 190 200 210 130 140 150 160 170 180 pF1KE1 FQWE--NSRALCSAPACDIIPQDEIIPRAHCR-LLCSQQPFEVVEKACRSYSHVVLKEVR :... .::.:: :.: . . ... . ::. :. .. .::: :..:: :: XP_011 FMFRRGSSRSLCEDPVCTPFVK-KVFEKYHCKNRRCGPLNVTLAAEACRRKEHMALKAVR 220 230 240 250 260 270 190 200 210 220 230 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT-KGDLMIDSRIVMGQHEQKLKKE . .:. : :: .:: :.:....::::::::. :: . : .. . . .. :..: XP_011 IRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKKWLDDEGQDGLREE 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE1 DQPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFL . .. :.: . : :. ::.::::::.::.:. .. .::.:.:. . XP_011 E--VQRLRGNCESIRLSAELGLRQPAWLRGRYMLVRYEDVARGPLQKAREMYRFAGIPLT 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE1 PHLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :... :... :.. :. . :. ... . . ::.:.:.. .. .: ::: :: :.:: XP_011 PQVEDWIQKNTQAAHDGSGIYSTQ-KNSSEQFEKWRFSMPFKLAQVVQAACGPAMRLFGY 400 410 420 430 440 450 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . .:. : ..:: XP_011 KLARDAAALTNRSVSLLEERGTFWVT 460 470 386 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 21:34:19 2016 done: Sun Nov 6 21:34:20 2016 Total Scan time: 7.050 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]