FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1967, 530 aa 1>>>pF1KE1967 530 - 530 aa - 530 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8658+/-0.000836; mu= 9.1037+/- 0.051 mean_var=190.6086+/-38.313, 0's: 0 Z-trim(114.5): 16 B-trim: 0 in 0/53 Lambda= 0.092897 statistics sampled from 15051 (15061) to 15051 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.463), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 ( 530) 3624 497.9 1.2e-140 CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 ( 395) 577 89.4 8.2e-18 CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 ( 411) 576 89.3 9.2e-18 CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX ( 486) 558 87.0 5.6e-17 CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 ( 479) 416 67.9 2.9e-11 >>CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 (530 aa) initn: 3624 init1: 3624 opt: 3624 Z-score: 2638.6 bits: 497.9 E(32554): 1.2e-140 Smith-Waterman score: 3624; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE1 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA 430 440 450 460 470 480 490 500 510 520 530 pF1KE1 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL 490 500 510 520 530 >>CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 (395 aa) initn: 822 init1: 299 opt: 577 Z-score: 433.3 bits: 89.4 E(32554): 8.2e-18 Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...::::::: :. CCDS10 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ 10 20 30 40 50 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : : CCDS10 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR 60 70 80 90 100 110 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: . CCDS10 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV 120 130 140 150 160 170 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :.. CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN--------- 180 190 200 210 220 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. :. :: .: ... .: : .. ..: :.:: .:.:.: CCDS10 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY 230 240 250 260 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ .::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: . CCDS10 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN 270 280 290 300 310 320 480 490 500 510 520 530 pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ...::: :: : .:..:.:.: . .:::. : : .: ..:. :. :: CCDS10 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS 330 340 350 360 370 380 CCDS10 STASHPRN 390 >>CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 (411 aa) initn: 821 init1: 293 opt: 576 Z-score: 432.3 bits: 89.3 E(32554): 9.2e-18 Smith-Waterman score: 865; 40.1% identity (67.0% similar) in 382 aa overlap (153-529:52-400) 130 140 150 160 170 180 pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE : . .: :. : : :...:::::::.:. CCDS10 MWLPRFSSKTVTVLLLAQTTCLLLFIISRPGPSSPAG-GEDRVHVLVLSSWRSGSSFLGQ 30 40 50 60 70 80 190 200 210 220 230 240 pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR ::.:.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : . : CCDS10 LFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLMRSIFLCDMDVFDAYMPQS---R 90 100 110 120 130 250 260 270 280 290 300 pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL ::... :. ::....:: : : :. . ... : ::: : : .. .: ::.: . CCDS10 NLSAF--FNWATSRALCSPPACSAFPRGTISKQD--VCKTLCTRQPFSLAREACRSYSHV 140 150 160 170 180 190 310 320 330 340 350 360 pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP :.: :: :.. :: ::: ::::.:...::::::::: .::: :. . .:: CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAV----LRSR-----EAAGPILARD- 200 210 220 230 240 370 380 390 400 410 420 pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY : ::.. . : :: : : .. .: : .. ..: :.:: .:.:.: CCDS10 ----------NGIVLGTNGKWV--EADPH-LRLIREVCRSHVRIAEAATLKPPPFLRGRY 250 260 270 280 290 430 440 450 460 470 pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKP---FVVSARNAT .::.:::. .:. .: .: :.:: ..:..: . :.: ::: . :: : .:.::: CCDS10 RLVRFEDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIG-KPIEAFHTSSRNAR 300 310 320 330 340 480 490 500 510 520 530 pF1KE1 QAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL ....::: :: : .: .:.: : . .:::. : : .. .::. :. :: CCDS10 NVSQAWRHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVL-PRGPDHFSWA 350 360 370 380 390 400 CCDS10 SPD 410 >>CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX (486 aa) initn: 1093 init1: 408 opt: 558 Z-score: 418.3 bits: 87.0 E(32554): 5.6e-17 Smith-Waterman score: 1211; 45.4% identity (68.2% similar) in 491 aa overlap (48-516:1-465) 20 30 40 50 60 70 pF1KE1 LQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCAGYALLLVLTMLNLLDYK :: ::. : .:::::: : :: CCDS14 MKGRRRRRREYCK-FALLLVLYTLVLL--- 10 20 80 90 100 110 120 130 pF1KE1 WHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARLDLRTPYRPPAAAVG--- : :: : : . .. : : :. . .:. :::.: CCDS14 -----LVPSVLDG------GRDGDKGAEHCP---GLQRSLGVWSLE------AAAAGERE 30 40 50 60 140 150 160 170 180 pF1KE1 -AAPAAAAGMAGVAAPPGNGTRGTGGVGD----KRQLVYVFTTWRSGSSFFGELFNQNPE .: : :: .:. : . .:.::. ..: .:: .:::.::::.::::::.:. CCDS14 QGAEARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPD 70 80 90 100 110 120 190 200 210 220 230 240 pF1KE1 VFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGS-GGR-----N ::.::::.::.:: :::::: ::::: :::: .:.:::.::..::.: :. ..: : CCDS14 VFYLYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTAN 130 140 150 160 170 180 250 260 270 280 290 300 pF1KE1 LTTLGIFGAATNKVVCSSPLCP-AYRKEV-VGLVDDRVCKK-CPPQRLARFEEECRKYRT ::: ..: ::::.:: :::: : : .. ::::.: .:.. ::: . .: ::::: . CCDS14 LTTAALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPV 190 200 210 220 230 240 310 320 330 340 350 360 pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD .::: ::..:..::.::::::.:.:::..: :::::: .::..::.::.:::.::.:.:. CCDS14 VVIKDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQ 250 260 270 280 290 300 370 380 390 400 410 pF1KE1 --PRAHRMPFLEAAGHKLGAKKEGV-GGP-ADYHALGAMEVICNSMAKTLQTALQPPDWL : ::. . ...: . :...... ..: ::. ::.::::.. . : : : :: CCDS14 RGDRFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWL 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE1 QGHYLVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSG-SSSKPFVVSARN . .:: .:::::: .: :::. : :: . .. :::::: :.. ....:: .:::. CCDS14 RRRYLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARD 370 380 390 400 410 420 480 490 500 510 520 530 pF1KE1 ATQAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL : .:..::: :. .:..::: : : .:.: : : :: CCDS14 AREAVHAWRERLSREQVRQVEAACAPAMRLLAYPR--SGEEGDAEQPREGETPLEMDADG 430 440 450 460 470 480 CCDS14 AT >>CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 (479 aa) initn: 483 init1: 178 opt: 416 Z-score: 315.6 bits: 67.9 E(32554): 2.9e-11 Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472) 140 150 160 170 180 190 pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV : .:... . :: :.:::: ::.:::. .. CCDS73 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI 100 110 120 130 140 150 200 210 220 230 240 pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL :.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .: CCDS73 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV : . .: .... .: .:.: . :.: . :: .: : .. : ::. . .. CCDS73 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA 220 230 240 250 260 270 310 320 330 340 350 360 pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR .:.::. .. : :: .:: :::.::.:::::::: .::. . : . . CCDS73 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK-------- 280 290 300 310 320 370 380 390 400 410 420 pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV .:. :. : ..: : .. :.:. . . .:. : ::.:.:.. CCDS73 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML 330 340 350 360 430 440 450 460 470 480 pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA :::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... . CCDS73 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK 370 380 390 400 410 420 490 500 510 520 530 pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL :: .. :. . :. : : ..::. . . . . : .::.. CCDS73 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT 430 440 450 460 470 530 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 17:41:15 2016 done: Sun Nov 6 17:41:16 2016 Total Scan time: 3.360 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]