FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1865, 386 aa 1>>>pF1KE1865 386 - 386 aa - 386 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6303+/-0.000959; mu= 15.1265+/- 0.057 mean_var=68.5108+/-13.919, 0's: 0 Z-trim(104.5): 22 B-trim: 0 in 0/51 Lambda= 0.154951 statistics sampled from 7932 (7942) to 7932 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.244), width: 16 Scan time: 2.780 The best scores are: opt bits E(32554) CCDS10902.1 CHST4 gene_id:10164|Hs108|chr16 ( 386) 2637 598.7 2.9e-171 CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 ( 395) 1337 308.1 9.1e-84 CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 ( 411) 1334 307.4 1.5e-83 CCDS7913.1 CHST1 gene_id:8534|Hs108|chr11 ( 411) 745 175.7 6.5e-44 CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 ( 479) 684 162.1 9.5e-40 CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 ( 530) 318 80.3 4.4e-15 CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX ( 486) 317 80.1 4.8e-15 >>CCDS10902.1 CHST4 gene_id:10164|Hs108|chr16 (386 aa) initn: 2637 init1: 2637 opt: 2637 Z-score: 3188.1 bits: 598.7 E(32554): 2.9e-171 Smith-Waterman score: 2637; 100.0% identity (100.0% similar) in 386 aa overlap (1-386:1-386) 10 20 30 40 50 60 pF1KE1 MLLPKKMKLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MLLPKKMKLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 SSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 HLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGYR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGYR 310 320 330 340 350 360 370 380 pF1KE1 HVRSEQEQRNLLLDLLSTWTVPEQIH :::::::::::::::::::::::::: CCDS10 HVRSEQEQRNLLLDLLSTWTVPEQIH 370 380 >>CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 (395 aa) initn: 1336 init1: 645 opt: 1337 Z-score: 1617.3 bits: 308.1 E(32554): 9.1e-84 Smith-Waterman score: 1337; 56.8% identity (77.5% similar) in 373 aa overlap (14-376:6-375) 10 20 30 40 50 pF1KE1 MLLPKKMKLLLFLVSQMAILAL-----FFHMYSHNISSLSMKAQPE-RMHVLVLSSWRSG ::. :. :: :. .. . . : : : :.::::::::::: CCDS10 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAGGEARVHVLVLSSWRSG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYME ::::::::.:::::::::::::::: :..:..: ::::::::.:.::::::.:::::. CCDS10 SSFVGQLFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYL- 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHV : : :.:::: :::::: :::. .:. : .: :. ::..: : ....:::::::: CCDS10 PWRRNLSDLFQWAVSRALCSPPACSAFPRGAISSEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 VLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQ ::::::::::: :::::.::.:::.:::::::::::.::::.: : :. ::.: . CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDNGIVLGTNGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 KLKKEDQPYYVMQVICQSQLEIYK--TIQSLPKALQERYLLVRYEDLARAPVAQTSRMYE .. : :.. .:.:...: . :.. : :. :: :::.::::: :.:. .: CCDS10 WVEA-DPGLRVVREVCRSHVRIAEAATLKP-PPFLRGRYRLVRFEDLAREPLAEIRALYA 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 FVGLEFLPHLQTWVHNITRGKGMGDH--AFHTNARDALNVSQAWRWSLPYEKVSRLQKAC :.:: . :.:..:.::::.:.: : . ::.:..:.::::::::: .::. :. :.:. : CCDS10 FTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALNVSQAWRHALPFAKIRRVQELC 290 300 310 320 330 340 360 370 380 pF1KE1 GDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH . :..::::: : ::.::::: :::. CCDS10 AGALQLLGYRPVYSEDEQRNLALDLVLPRGLNGFTWASSTASHPRN 350 360 370 380 390 >>CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 (411 aa) initn: 1284 init1: 622 opt: 1334 Z-score: 1613.5 bits: 307.4 E(32554): 1.5e-83 Smith-Waterman score: 1334; 54.1% identity (77.2% similar) in 381 aa overlap (1-376:22-397) 10 20 30 pF1KE1 MLLPK--KMKLLLFLVSQMAILALFFHMYSHNISSLSMK : ::. . . ..:..: . : :: . :. : : CCDS10 MGMRARVPKVAHSTRRPPAARMWLPRFSSKTVTVLLLAQTTCLLLF--IISRPGPS-SPA 10 20 30 40 50 40 50 60 70 80 90 pF1KE1 AQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYLMEPAWHVWMTFKQSTAWMLHMAVRDL . .:.::::::::::::::.::::.:::::::::::::::: :..:..: :::::::: CCDS10 GGEDRVHVLVLSSWRSGSSFLGQLFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE1 IRAVFLCDMSVFDAYMEPGPRRQSSLFQWENSRALCSAPACDIIPQDEIIPRAHCRLLCS .:..:::::.:::::: : : :..:.: .:::::: :::. .:. : . :. ::. CCDS10 MRSIFLCDMDVFDAYM-PQSRNLSAFFNWATSRALCSPPACSAFPRGTISKQDVCKTLCT 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE1 QQPFEVVEKACRSYSHVVLKEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT .::: ....::::::::::::::::::: :::::.::.:::.:::::::::::.:::: . CCDS10 RQPFSLAREACRSYSHVVLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREAA 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE1 KGDLMIDSRIVMGQHEQKLKKEDQPYYVMQVICQSQLEIYKTIQSLPKA-LQERYLLVRY : :. ::.: . : . : ... .:.:...: .. : :. :: :::. CCDS10 GPILARDNGIVLGTN-GKWVEADPHLRLIREVCRSHVRIAEAATLKPPPFLRGRYRLVRF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE1 EDLARAPVAQTSRMYEFVGLEFLPHLQTWVHNITRGKGMGD--HAFHTNARDALNVSQAW ::::: :.:. .: :.:: . :.:..:.::::.:.:.: .::::..:.: :::::: CCDS10 EDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIGKPIEAFHTSSRNARNVSQAW 300 310 320 330 340 350 340 350 360 370 380 pF1KE1 RWSLPYEKVSRLQKACGDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH : .::. :. :.:..:. :..::::: : : ..::.: :::. CCDS10 RHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVLPRGPDHFSWASPD 360 370 380 390 400 410 >>CCDS7913.1 CHST1 gene_id:8534|Hs108|chr11 (411 aa) initn: 708 init1: 241 opt: 745 Z-score: 901.9 bits: 175.7 E(32554): 6.5e-44 Smith-Waterman score: 745; 36.7% identity (64.8% similar) in 341 aa overlap (42-370:60-396) 20 30 40 50 60 70 pF1KE1 FLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFYL . :.:.:.. :::::::::::.:: ::::: CCDS79 SFHTCPGLAEAGLAERLCEESPTFAYNLSRKTHILILATTRSGSSFVGQLFNQHLDVFYL 30 40 50 60 70 80 80 90 100 110 120 pF1KE1 MEPAWHVWMT----FKQSTA----WMLHMAVRDLIRAVFLCDMSVFDAYMEPGPRRQSS- .:: .:: : : :. . .. : :::.:... ::. .. :..: : ... CCDS79 FEPLYHVQNTLIPRFTQGKSPADRRVMLGASRDLLRSLYDCDLYFLENYIKPPPVNHTTD 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE1 -LFQWENSRALCSAPACDII-PQDEIIPRAHCRLLCSQQPFEVVEKACRSYSHVVLKEVR .:. ::.::: :.:: : : .. .. : :. . :. .::: :::..: :: CCDS79 RIFRRGASRVLCSRPVCDPPGPADLVLEEGDCVRKCGLLNLTVAAEACRERSHVAIKTVR 150 160 170 180 190 200 190 200 210 220 230 240 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDSRIVMGQHEQKLKKED ....: :..:: :::....::::::... :: .: : . :. .: . : . CCDS79 VPEVNDLRALVEDPRLNLKVIQLVRDPRGILASRSETFRDTYRLWRLWYGTGR---KPYN 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE1 QPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFLP . ..:.. . .: : :. .:.::::::::: :. .: ..: :.:. . CCDS79 LDVTQLTTVCEDFSNSVSTGLMRPPWLKGKYMLVRYEDLARNPMKKTEEIYGFLGIPLDS 270 280 290 300 310 320 310 320 330 340 350 pF1KE1 HLQTWVHNITRGKG-MGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :. :..: ::: .: : . : .:.. ... ::. : :. :. :.:: ... ::: CCDS79 HVARWIQNNTRGDPTLGKHKYGT-VRNSAATAEKWRFRLSYDIVAFAQNACQQVLAQLGY 330 340 350 360 370 380 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . . ::.: .: CCDS79 KIAASEEELKNPSVSLVEERDFRPFS 390 400 410 >>CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 (479 aa) initn: 667 init1: 203 opt: 684 Z-score: 827.1 bits: 162.1 E(32554): 9.5e-40 Smith-Waterman score: 684; 33.1% identity (65.7% similar) in 347 aa overlap (38-376:129-470) 10 20 30 40 50 60 pF1KE1 KLLLFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPD : :.: :::.... :.::::::..:.:. . CCDS73 LQLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRR-HVLLMATTRTGSSFVGEFFNQQGN 100 110 120 130 140 150 70 80 90 100 110 120 pF1KE1 VFYLMEPAWHVWMT--FKQSTAWMLHMAV--RDLIRAVFLCDMSVFDAYMEPGPRRQSSL .:::.:: ::. : :. . : :. ::... .::::. :.. .. : :. . . CCDS73 IFYLFEPLWHIERTVSFEPGGANAAGSALVYRDVLKQLFLCDLYVLEHFITPLPEDHLTQ 160 170 180 190 200 210 130 140 150 160 170 180 pF1KE1 FQWE--NSRALCSAPACDIIPQDEIIPRAHCR-LLCSQQPFEVVEKACRSYSHVVLKEVR :... .::.:: :.: . . ... . ::. :. .. .::: :..:: :: CCDS73 FMFRRGSSRSLCEDPVCTPFVK-KVFEKYHCKNRRCGPLNVTLAAEACRRKEHMALKAVR 220 230 240 250 260 270 190 200 210 220 230 pF1KE1 FFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERT-KGDLMIDSRIVMGQHEQKLKKE . .:. : :: .:: :.:....::::::::. :: . : .. . . .. :..: CCDS73 IRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKKWLDDEGQDGLREE 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE1 DQPYYVMQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARAPVAQTSRMYEFVGLEFL . .. :.: . : :. ::.::::::.::.:. .. .::.:.:. . CCDS73 E--VQRLRGNCESIRLSAELGLRQPAWLRGRYMLVRYEDVARGPLQKAREMYRFAGIPLT 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE1 PHLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEKVSRLQKACGDAMNLLGY :... :... :.. :. . :. ... . . ::.:.:.. .. .: ::: :: :.:: CCDS73 PQVEDWIQKNTQAAHDGSGIYSTQ-KNSSEQFEKWRFSMPFKLAQVVQAACGPAMRLFGY 400 410 420 430 440 450 360 370 380 pF1KE1 RHVRSEQEQRNLLLDLLSTWTVPEQIH . .:. : ..:: CCDS73 KLARDAAALTNRSVSLLEERGTFWVT 460 470 >>CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 (530 aa) initn: 750 init1: 313 opt: 318 Z-score: 384.2 bits: 80.3 E(32554): 4.4e-15 Smith-Waterman score: 781; 37.1% identity (65.9% similar) in 364 aa overlap (41-376:163-525) 20 30 40 50 60 70 pF1KE1 LFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFY .:. : :...::::::: :.::.:.:.::. CCDS31 VGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEVFF 140 150 160 170 180 190 80 90 100 110 120 pF1KE1 LMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYMEPGP--RRQSSL--FQW :.::.::::. . . : :. :.::.. :.. ::.:::. : : : ..: : CCDS31 LYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGRNLTTLGIFGA 200 210 220 230 240 250 130 140 150 160 170 180 pF1KE1 ENSRALCSAPACDIIPQDEIIPRAHCRLL--CSQQPFEVVEKACRSYSHVVLKEVRFFNL .....::.: : . :.. . :. : : . :. ::.: .:.: :: :.. CCDS31 ATNKVVCSSPLCPAY-RKEVVGLVDDRVCKKCPPQRLARFEEECRKYRTLVIKGVRVFDV 260 270 280 290 300 310 190 200 210 220 230 pF1KE1 QSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDS-RIVMGQ------------ : :::.::.:.:...::::::::: :: :.. :. .: ..: .. CCDS31 AVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPRAHRMPFLEA 320 330 340 350 360 370 240 250 260 270 280 pF1KE1 --HEQKLKKED--QP--YYV---MQVICQSQLEIYKTIQSLPKALQERYLLVRYEDLARA :. ::: : :.. :.:::.:. . .: . : :: .::.::::::. CCDS31 AGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLVVRYEDLVGD 380 390 400 410 420 430 290 300 310 320 330 340 pF1KE1 PVAQTSRMYEFVGLEFLPHLQTWVHNITRGKGMGDHAFHTNARDALNVSQAWRWSLPYEK :: :.:.:::: :... .. :.: :.: ... : ..::.: ....::: .: ... CCDS31 PVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANAWRTALTFQQ 440 450 460 470 480 490 350 360 370 380 pF1KE1 VSRLQKACGDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH ...... : . : .:::..: : .: ..: :: CCDS31 IKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL 500 510 520 530 >>CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX (486 aa) initn: 772 init1: 310 opt: 317 Z-score: 383.6 bits: 80.1 E(32554): 4.8e-15 Smith-Waterman score: 796; 36.9% identity (64.4% similar) in 360 aa overlap (41-359:100-459) 20 30 40 50 60 70 pF1KE1 LFLVSQMAILALFFHMYSHNISSLSMKAQPERMHVLVLSSWRSGSSFVGQLFGQHPDVFY :..:. : ..::.::::.:.::.::::::: CCDS14 EARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPDVFY 70 80 90 100 110 120 80 90 100 110 120 pF1KE1 LMEPAWHVWMTFKQSTAWMLHMAVRDLIRAVFLCDMSVFDAYMEPG-PRRQS-------- :.:: ::.:... . : :. :.::..:..: ::.::. : :: : .. CCDS14 LYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTANLTT 130 140 150 160 170 180 130 140 150 160 170 pF1KE1 -SLFQWENSRALCSAPACDIIPQDE----IIPRAHCRLLCSQQPFEVVEKACRSYSHVVL .::.:......:: : : :. . .. . :. : ....: ::.: ::. CCDS14 AALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPVVVI 190 200 210 220 230 240 180 190 200 210 220 pF1KE1 KEVRFFNLQSLYPLLKDPSLNLHIVHLVRDPRAVFRSRERTKGDLMIDS----------- :.::...: : :::.::.:::..:.: :::::: :: ... :. .: CCDS14 KDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQRGD 250 260 270 280 290 300 230 240 250 260 270 pF1KE1 ---RIVM--------GQHEQKLKKEDQPYY----VMQVICQSQLEIYKTIQSLPKALQER :... : . . : . . ...:::.. :. .. : :..: CCDS14 RFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWLRRR 310 320 330 340 350 360 280 290 300 310 320 pF1KE1 YLLVRYEDLARAPVAQTSRMYEFVGLEFLPHLQTWVHNITRGKGMG-DHAFHTNARDALN :: .:::::.: : :: :. .: ::. : :.... :.::: ..: :. :: .:::: . CCDS14 YLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARDARE 370 380 390 400 410 420 330 340 350 360 370 380 pF1KE1 VSQAWRWSLPYEKVSRLQKACGDAMNLLGYRHVRSEQEQRNLLLDLLSTWTVPEQIH . .::: : :.: ... ::. :: ::.: CCDS14 AVHAWRERLSREQVRQVEAACAPAMRLLAYPRSGEEGDAEQPREGETPLEMDADGAT 430 440 450 460 470 480 386 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 21:34:19 2016 done: Sun Nov 6 21:34:19 2016 Total Scan time: 2.780 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]