FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4403, 419 aa 1>>>pF1KE4403 419 - 419 aa - 419 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3232+/-0.000798; mu= 16.4137+/- 0.048 mean_var=59.8713+/-12.236, 0's: 0 Z-trim(106.8): 13 B-trim: 540 in 1/50 Lambda= 0.165754 statistics sampled from 9205 (9210) to 9205 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.283), width: 16 Scan time: 2.740 The best scores are: opt bits E(32554) CCDS4053.1 CKMT2 gene_id:1160|Hs108|chr5 ( 419) 2838 687.1 8.2e-198 CCDS10097.1 CKMT1B gene_id:1159|Hs108|chr15 ( 417) 2285 554.9 5.2e-158 CCDS32217.1 CKMT1A gene_id:548596|Hs108|chr15 ( 417) 2285 554.9 5.2e-158 CCDS9981.1 CKB gene_id:1152|Hs108|chr14 ( 381) 1696 414.0 1.2e-115 CCDS12659.1 CKM gene_id:1158|Hs108|chr19 ( 381) 1662 405.9 3.4e-113 >>CCDS4053.1 CKMT2 gene_id:1160|Hs108|chr5 (419 aa) initn: 2838 init1: 2838 opt: 2838 Z-score: 3664.9 bits: 687.1 E(32554): 8.2e-198 Smith-Waterman score: 2838; 100.0% identity (100.0% similar) in 419 aa overlap (1-419:1-419) 10 20 30 40 50 60 pF1KE4 MASIFSKLLTGRNASLLFATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MASIFSKLLTGRNASLLFATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NNCMAECLTPAIYAKLRNKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 NNCMAECLTPAIYAKLRNKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DLFDPVIKLRHNGYDPRVMKHTTDLDASKITQGQFDEHYVLSSRVRTGRSIRGLSLPPAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 DLFDPVIKLRHNGYDPRVMKHTTDLDASKITQGQFDEHYVLSSRVRTGRSIRGLSLPPAC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 TRAERREVENVAITALEGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 TRAERREVENVAITALEGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 MARDWPDARGIWHNYDKTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 MARDWPDARGIWHNYDKTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 RGWEFMWNERLGYILTCPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 RGWEFMWNERLGYILTCPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVD 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 TAAVADVYDISNIDRIGRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS40 TAAVADVYDISNIDRIGRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK 370 380 390 400 410 >>CCDS10097.1 CKMT1B gene_id:1159|Hs108|chr15 (417 aa) initn: 2280 init1: 2213 opt: 2285 Z-score: 2950.2 bits: 554.9 E(32554): 5.2e-158 Smith-Waterman score: 2285; 80.1% identity (92.5% similar) in 413 aa overlap (1-413:1-412) 10 20 30 40 50 60 pF1KE4 MASIFSKLLTGRNASLLFATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKH ::. ::.::..: . :.: :.. :..:.:: . : : . :. ::.::::.::::::: CCDS10 MAGPFSRLLSARPGLRLLALAGAGSLAAGFLLRPEPVRA-ASERRRLYPPSAEYPDLRKH 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 NNCMAECLTPAIYAKLRNKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFA ::::: ::::.::.: .:.::.:.:::::::::::::::::::::::::::::.::::: CCDS10 NNCMASHLTPAVYARLCDKTTPTGWTLDQCIQTGVDNPGHPFIKTVGMVAGDEETYEVFA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 DLFDPVIKLRHNGYDPRVMKHTTDLDASKITQGQFDEHYVLSSRVRTGRSIRGLSLPPAC :::::::. ::::::::.:::::::::::: .: :::.:::::::::::::::::::::: CCDS10 DLFDPVIQERHNGYDPRTMKHTTDLDASKIRSGYFDERYVLSSRVRTGRSIRGLSLPPAC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 TRAERREVENVAITALEGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAG ::::::::: :.. :: :::::::::::.:::::: .::.::::::::::::::::: :: CCDS10 TRAERREVERVVVDALSGLKGDLAGRYYRLSEMTEAEQQQLIDDHFLFDKPVSPLLTAAG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 MARDWPDARGIWHNYDKTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE :::::::::::::: .:.::::.::::::::::::::::::::::::::::::::::::: CCDS10 MARDWPDARGIWHNNEKSFLIWVNEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 RGWEFMWNERLGYILTCPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVD ::::::::::::::::::::::::::::::...: :::: :: ::::::::::::::::: CCDS10 RGWEFMWNERLGYILTCPSNLGTGLRAGVHIKLPLLSKDSRFPKILENLRLQKRGTGGVD 300 310 320 330 340 350 370 380 390 400 410 pF1KE4 TAAVADVYDISNIDRIGRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK :::.. :.::::.::.:.:::::::.::::::::.:::..:::::::..: :. CCDS10 TAATGGVFDISNLDRLGKSEVELVQLVIDGVNYLIDCERRLERGQDIRIPTPVIHTKH 360 370 380 390 400 410 >>CCDS32217.1 CKMT1A gene_id:548596|Hs108|chr15 (417 aa) initn: 2280 init1: 2213 opt: 2285 Z-score: 2950.2 bits: 554.9 E(32554): 5.2e-158 Smith-Waterman score: 2285; 80.1% identity (92.5% similar) in 413 aa overlap (1-413:1-412) 10 20 30 40 50 60 pF1KE4 MASIFSKLLTGRNASLLFATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKH ::. ::.::..: . :.: :.. :..:.:: . : : . :. ::.::::.::::::: CCDS32 MAGPFSRLLSARPGLRLLALAGAGSLAAGFLLRPEPVRA-ASERRRLYPPSAEYPDLRKH 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 NNCMAECLTPAIYAKLRNKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFA ::::: ::::.::.: .:.::.:.:::::::::::::::::::::::::::::.::::: CCDS32 NNCMASHLTPAVYARLCDKTTPTGWTLDQCIQTGVDNPGHPFIKTVGMVAGDEETYEVFA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 DLFDPVIKLRHNGYDPRVMKHTTDLDASKITQGQFDEHYVLSSRVRTGRSIRGLSLPPAC :::::::. ::::::::.:::::::::::: .: :::.:::::::::::::::::::::: CCDS32 DLFDPVIQERHNGYDPRTMKHTTDLDASKIRSGYFDERYVLSSRVRTGRSIRGLSLPPAC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 TRAERREVENVAITALEGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAG ::::::::: :.. :: :::::::::::.:::::: .::.::::::::::::::::: :: CCDS32 TRAERREVERVVVDALSGLKGDLAGRYYRLSEMTEAEQQQLIDDHFLFDKPVSPLLTAAG 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 MARDWPDARGIWHNYDKTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE :::::::::::::: .:.::::.::::::::::::::::::::::::::::::::::::: CCDS32 MARDWPDARGIWHNNEKSFLIWVNEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQE 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 RGWEFMWNERLGYILTCPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVD ::::::::::::::::::::::::::::::...: :::: :: ::::::::::::::::: CCDS32 RGWEFMWNERLGYILTCPSNLGTGLRAGVHIKLPLLSKDSRFPKILENLRLQKRGTGGVD 300 310 320 330 340 350 370 380 390 400 410 pF1KE4 TAAVADVYDISNIDRIGRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK :::.. :.::::.::.:.:::::::.::::::::.:::..:::::::..: :. CCDS32 TAATGGVFDISNLDRLGKSEVELVQLVIDGVNYLIDCERRLERGQDIRIPTPVIHTKH 360 370 380 390 400 410 >>CCDS9981.1 CKB gene_id:1152|Hs108|chr14 (381 aa) initn: 1665 init1: 1665 opt: 1696 Z-score: 2189.6 bits: 414.0 E(32554): 1.2e-115 Smith-Waterman score: 1696; 67.0% identity (85.0% similar) in 361 aa overlap (48-407:14-373) 20 30 40 50 60 70 pF1KE4 FATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKHNNCMAECLTPAIYAKLR :: ..::: ::: ::. ::: .::.:: CCDS99 MPFSNSHNALKLRFPAEDEFPDLSAHNNHMAKVLTPELYAELR 10 20 30 40 80 90 100 110 120 130 pF1KE4 NKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFADLFDPVIKLRHNGYDPR : ::.:.:::. :::::::::::.: ::: ::::::::::: :::::.:. ::.:: : CCDS99 AKSTPSGFTLDDVIQTGVDNPGHPYIMTVGCVAGDEESYEVFKDLFDPIIEDRHGGYKPS 50 60 70 80 90 100 140 150 160 170 180 190 pF1KE4 VMKHTTDLDASKITQGQ-FDEHYVLSSRVRTGRSIRGLSLPPACTRAERREVENVAITAL .: :::. ... :. .: .:::::::::::::::. ::: :.:.::: .:..:. :: CCDS99 D-EHKTDLNPDNLQGGDDLDPNYVLSSRVRTGRSIRGFCLPPHCSRGERRAIEKLAVEAL 110 120 130 140 150 160 200 210 220 230 240 250 pF1KE4 EGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAGMARDWPDARGIWHNYD .: :::::::: :. ::: .::.:::::::::::::::: .::::::::::::::: . CCDS99 SSLDGDLAGRYYALKSMTEAEQQQLIDDHFLFDKPVSPLLLASGMARDWPDARGIWHNDN 170 180 190 200 210 220 260 270 280 290 300 310 pF1KE4 KTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQERGWEFMWNERLGYILT ::::.:.::::: :::::.::::::.:: ::: :: ..: :.. . .::::: .:::::: CCDS99 KTFLVWVNEEDHLRVISMQKGGNMKEVFTRFCTGLTQIETLFKSKDYEFMWNPHLGYILT 230 240 250 260 270 280 320 330 340 350 360 370 pF1KE4 CPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVDTAAVADVYDISNIDRI ::::::::::::::...:.:.: .::..:. ::::::::::::::::. :.:.:: ::. CCDS99 CPSNLGTGLRAGVHIKLPNLGKHEKFSEVLKRLRLQKRGTGGVDTAAVGGVFDVSNADRL 290 300 310 320 330 340 380 390 400 410 pF1KE4 GRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK : :::::::.:.:::. :.. :..::.:: : CCDS99 GFSEVELVQMVVDGVKLLIEMEQRLEQGQAIDDLMPAQK 350 360 370 380 >>CCDS12659.1 CKM gene_id:1158|Hs108|chr19 (381 aa) initn: 1662 init1: 1615 opt: 1662 Z-score: 2145.7 bits: 405.9 E(32554): 3.4e-113 Smith-Waterman score: 1662; 65.7% identity (85.9% similar) in 361 aa overlap (48-407:14-373) 20 30 40 50 60 70 pF1KE4 FATMGTSVLTTGYLLNRQKVCAEVREQPRLFPPSADYPDLRKHNNCMAECLTPAIYAKLR . : .:::: :::: ::. :: .: ::: CCDS12 MPFGNTHNKFKLNYKPEEEYPDLSKHNNHMAKVLTLELYKKLR 10 20 30 40 80 90 100 110 120 130 pF1KE4 NKVTPNGYTLDQCIQTGVDNPGHPFIKTVGMVAGDEESYEVFADLFDPVIKLRHNGYDPR .: ::.:.:.:. ::::::::::::: ::: ::::::::::: .::::.:. ::.:: : CCDS12 DKETPSGFTVDDVIQTGVDNPGHPFIMTVGCVAGDEESYEVFKELFDPIISDRHGGYKP- 50 60 70 80 90 100 140 150 160 170 180 190 pF1KE4 VMKHTTDLDASKITQGQ-FDEHYVLSSRVRTGRSIRGLSLPPACTRAERREVENVAITAL . :: :::. .. :. .: .:::::::::::::.: .::: :.:.::: ::.... :: CCDS12 TDKHKTDLNHENLKGGDDLDPNYVLSSRVRTGRSIKGYTLPPHCSRGERRAVEKLSVEAL 110 120 130 140 150 160 200 210 220 230 240 250 pF1KE4 EGLKGDLAGRYYKLSEMTEQDQQRLIDDHFLFDKPVSPLLTCAGMARDWPDARGIWHNYD ..: :.. :.:: :. :::..::.:::::::::::::::: .::::::::::::::: . CCDS12 NSLTGEFKGKYYPLKSMTEKEQQQLIDDHFLFDKPVSPLLLASGMARDWPDARGIWHNDN 170 180 190 200 210 220 260 270 280 290 300 310 pF1KE4 KTFLIWINEEDHTRVISMEKGGNMKRVFERFCRGLKEVERLIQERGWEFMWNERLGYILT :.::.:.::::: ::::::::::::.::.::: ::...:..... : ::::..:::.:: CCDS12 KSFLVWVNEEDHLRVISMEKGGNMKEVFRRFCVGLQKIEEIFKKAGHPFMWNQHLGYVLT 230 240 250 260 270 280 320 330 340 350 360 370 pF1KE4 CPSNLGTGLRAGVHVRIPKLSKDPRFSKILENLRLQKRGTGGVDTAAVADVYDISNIDRI ::::::::::.::::.. .::: :.: .:: ::::::::::::::::..:.:.:: ::. CCDS12 CPSNLGTGLRGGVHVKLAHLSKHPKFEEILTRLRLQKRGTGGVDTAAVGSVFDVSNADRL 290 300 310 320 330 340 380 390 400 410 pF1KE4 GRSEVELVQIVIDGVNYLVDCEKKLERGQDIKVPPPLPQFGKK : :::: ::.:.:::. .:. :::::.::.: CCDS12 GSSEVEQVQLVVDGVKLMVEMEKKLEKGQSIDDMIPAQK 350 360 370 380 419 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:21:08 2016 done: Sun Nov 6 01:21:09 2016 Total Scan time: 2.740 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]