FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1903, 433 aa 1>>>pF1KE1903 433 - 433 aa - 433 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0284+/-0.000984; mu= 13.7681+/- 0.059 mean_var=79.5308+/-16.644, 0's: 0 Z-trim(106.6): 58 B-trim: 670 in 2/47 Lambda= 0.143816 statistics sampled from 9009 (9060) to 9009 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.278), width: 16 Scan time: 2.760 The best scores are: opt bits E(32554) CCDS31022.1 SMYD2 gene_id:56950|Hs108|chr1 ( 433) 2954 622.6 2.2e-178 CCDS82480.1 SMYD1 gene_id:150572|Hs108|chr2 ( 477) 847 185.5 9.7e-47 CCDS53486.1 SMYD3 gene_id:64754|Hs108|chr1 ( 428) 673 149.4 6.5e-36 CCDS31083.1 SMYD3 gene_id:64754|Hs108|chr1 ( 369) 536 120.9 2.1e-27 CCDS33240.1 SMYD1 gene_id:150572|Hs108|chr2 ( 490) 468 106.9 4.7e-23 >>CCDS31022.1 SMYD2 gene_id:56950|Hs108|chr1 (433 aa) initn: 2954 init1: 2954 opt: 2954 Z-score: 3315.9 bits: 622.6 E(32554): 2.2e-178 Smith-Waterman score: 2954; 99.8% identity (99.8% similar) in 433 aa overlap (1-433:1-433) 10 20 30 40 50 60 pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN :::::::::::::::::::::::::::::::::::::::::::: ::::::::::::::: CCDS31 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLGFPDNDSLVVLFAQVN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 CNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTSY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 IDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVRYARN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVRYARN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 VIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEGAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEGAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 QYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAHGKDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 QYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAHGKDH 370 380 390 400 410 420 430 pF1KE1 PYISEIKQEIESH ::::::::::::: CCDS31 PYISEIKQEIESH 430 >>CCDS82480.1 SMYD1 gene_id:150572|Hs108|chr2 (477 aa) initn: 701 init1: 272 opt: 847 Z-score: 952.6 bits: 185.5 E(32554): 9.7e-47 Smith-Waterman score: 847; 31.8% identity (66.0% similar) in 424 aa overlap (9-427:9-425) 10 20 30 40 50 60 pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE .: : . ::::::.: . : ..:..:. ::. :. . . :. :: :.: CCDS82 MTIGRMENVEVFTAEGKGRGLKATKEFWAADIIFAERAYSAVVFDSLVNFVCHTCFKRQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP : .::.:: : ::. :::. : :: ::: . .:. :.:..::.:::. . . . CCDS82 KLHRCGQCKFAHYCDRTCQKDAWLNHKNECSAIKRYGKV--PNENIRLAARIMWRVEREG 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN :..: ....:.... .:.. .. :. .. ... . . . . . .:. .: CCDS82 TGLTEGCLVSVDDLQNHVEHFGEEEQKDLRVDVDTFLQYWPPQSQQFSMQYISHIFGVIN 120 130 140 150 160 170 190 200 210 220 230 pF1KE1 CNGFTIEDEE-LSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTS :::::. :.. :. .: .:::...:.::.: :: : ... :.::. .:. :::. .: CCDS82 CNGFTLSDQRGLQAVGVGIFPNLGLVNHDCWPNCTVIFNNGKIELRALGKISEGEELTVS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 YIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDP-PKAEAIRDMVRYA :::.: .:.:. .:. .:.: : :..: : :: . .. ..: :. :....:.... CCDS82 YIDFLNVSEERKRQLKKQYYFDCTCEHCQKKLKDDLFLGVK--DNPKPSQEVVKEMIQFS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 RNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEG ....:.. .:. :....:. ::. :: :.:.:::.:. . : :.: .: CCDS82 KDTLEKIDKARSEGLYHEVVKLCRECLEKQEPVFADTNIYMLRMLSIVSEVLSYLQAFEE 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 ALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKA---AGEKALKKAIAIMEVA : :..... : : :: : :.. . . : . : . .:. . :: ::. :. CCDS82 ASFYARRMVDGYMK---LYHPNNAQLGMAVMRAGLTNWHAGNIEVGHGMICKAYAILLVT 360 370 380 390 400 410 420 430 pF1KE1 HGKDHPYISEIKQEIESH :: .:: .... CCDS82 HGPSHPITKDLEAMRVQTEMELRMFRQNEFMYYKMREAALNNQPMQVMAEPSNEPSPALF 420 430 440 450 460 470 >>CCDS53486.1 SMYD3 gene_id:64754|Hs108|chr1 (428 aa) initn: 777 init1: 329 opt: 673 Z-score: 758.2 bits: 149.4 E(32554): 6.5e-36 Smith-Waterman score: 824; 32.5% identity (63.0% similar) in 422 aa overlap (9-426:6-414) 10 20 30 40 50 60 pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE .:.: . .: ::::. :.. :.::: ::.. . :: :. :. :: CCDS53 MEPLKVEKFATAKRGNGLRAVTPLRPGELLFRSDPLAYTVCKGSRGVVCDRCLLGKE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP : .:..:. : ::...:::. :: :: ::. . . : ..::: .:.. : . CCDS53 KLMRCSQCRVAKYCSAKCQKKAWPDHKRECKCLKSCKPRY-PPDSVRLLGRVVFKL-MDG 60 70 80 90 100 110 130 140 150 160 170 pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLE----FPDNDSLVVLF . :::: . ..::...:: ..::. ... . ...::. .... .: .: : CCDS53 APSESEKLYSFYDLESNINKLTEDKKEGLRQLVMTFQHFMREEIQDASQLPPAFDLFEAF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 AQVNCNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEV :.: ::.::: . :....: ...:...:.:::: :: ....: .:::..:. :::. CCDS53 AKVICNSFTICNAEMQEVGVGLYPSISLLNHSCDPNCSIVFNGPHLLLRAVRDIEVGEEL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 FTSYIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVR :.:.:. .:.: .:::.: : :.: .: :.::: . .: : . :. CCDS53 TICYLDMLMTSEERRKQLRDQYCFECDCFRCQTQDKDADMLT----GD----EQVWKEVQ 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 YARNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDW . . :::.. :.: ..: .:. . : . : :.:.:... :: .:. . CCDS53 ESLKKIEELK--AHWKWE-QVLAMCQAIISSNSERLPDINIYQLKVLDCAMDACINLGLL 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 EGALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAH : :: :: . ..:: .: . . .:.:.: . . : :. :. ::.:.: CCDS53 EEALFYGTRTMEPYRIFFPGSHPVRGVQVMKVGKLQLHQGMFPQAMKNLRLAFDIMRVTH 350 360 370 380 390 400 420 430 pF1KE1 GKDHPYISEIKQEIESH :..: : .. CCDS53 GREHSLIEDLILLLEECDANIRAS 410 420 >>CCDS31083.1 SMYD3 gene_id:64754|Hs108|chr1 (369 aa) initn: 674 init1: 329 opt: 536 Z-score: 605.6 bits: 120.9 E(32554): 2.1e-27 Smith-Waterman score: 687; 31.6% identity (63.2% similar) in 367 aa overlap (64-426:2-355) 40 50 60 70 80 90 pF1KE1 FSCPAYAYVLTVNERGNHCEYCFTRKEGLSKCGRCKQAFYCNVECQKEDWPMHKLECSPM .:..:. : ::...:::. :: :: ::. . CCDS31 MRCSQCRVAKYCSAKCQKKAWPDHKRECKCL 10 20 30 100 110 120 130 140 150 pF1KE1 VVFGENWNPSETVRLTARILAKQKIHPERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDI . : ..::: .:.. : . . :::: . ..::...:: ..::. ... . CCDS31 KSCKPRY-PPDSVRLLGRVVFKL-MDGAPSESEKLYSFYDLESNINKLTEDKKEGLRQLV 40 50 60 70 80 160 170 180 190 200 pF1KE1 AALHHFYSKHLE----FPDNDSLVVLFAQVNCNGFTIEDEELSHLGSAIFPDVALMNHSC ...::. .... .: .: ::.: ::.::: . :....: ...:...:.:::: CCDS31 MTFQHFMREEIQDASQLPPAFDLFEAFAKVICNSFTICNAEMQEVGVGLYPSISLLNHSC 90 100 110 120 130 140 210 220 230 240 250 260 pF1KE1 CPNVIVTYKGTLAEVRAVQEIKPGEEVFTSYIDLLYPTEDRNDRLRDSYFFTCECQECTT :: ....: .:::..:. :::. :.:.:. .:.: .:::.: : :.: .: : CCDS31 DPNCSIVFNGPHLLLRAVRDIEVGEELTICYLDMLMTSEERRKQLRDQYCFECDCFRCQT 150 160 170 180 190 200 270 280 290 300 310 320 pF1KE1 KDKDKAKVEIRKLSDPPKAEAIRDMVRYARNVIEEFRRAKHYKSPSELLEICELSQEKMS .::: . .: : . :. . . :::.. :.: ..: .:. . : CCDS31 QDKDADMLT----GD----EQVWKEVQESLKKIEELK--AHWKWE-QVLAMCQAIISSNS 210 220 230 240 250 330 340 350 360 370 380 pF1KE1 SVFEDSNVYMLHMMYQAMGVCLYMQDWEGALQYGQKIIKPYSKHYPLYSLNVASMWLKLG . : :.:.:... :: .:. . : :: :: . ..:: .: . . .:.: CCDS31 ERLPDINIYQLKVLDCAMDACINLGLLEEALFYGTRTMEPYRIFFPGSHPVRGVQVMKVG 260 270 280 290 300 310 390 400 410 420 430 pF1KE1 RLYMGLEHKAAGEKALKKAIAIMEVAHGKDHPYISEIKQEIESH .: . . : :. :. ::.:.::..: : .. CCDS31 KLQLHQGMFPQAMKNLRLAFDIMRVTHGREHSLIEDLILLLEECDANIRAS 320 330 340 350 360 >>CCDS33240.1 SMYD1 gene_id:150572|Hs108|chr2 (490 aa) initn: 665 init1: 254 opt: 468 Z-score: 527.4 bits: 106.9 E(32554): 4.7e-23 Smith-Waterman score: 812; 31.1% identity (64.3% similar) in 437 aa overlap (9-427:9-438) 10 20 30 40 50 60 pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE .: : . ::::::.: . : ..:..:. ::. :. . . :. :: :.: CCDS33 MTIGRMENVEVFTAEGKGRGLKATKEFWAADIIFAERAYSAVVFDSLVNFVCHTCFKRQE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP : .::.:: : ::. :::. : :: ::: . .:. :.:..::.:::. . . . CCDS33 KLHRCGQCKFAHYCDRTCQKDAWLNHKNECSAIKRYGKV--PNENIRLAARIMWRVEREG 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN :..: ....:.... .:.. .. :. .. ... . . . . . .:. .: CCDS33 TGLTEGCLVSVDDLQNHVEHFGEEEQKDLRVDVDTFLQYWPPQSQQFSMQYISHIFGVIN 120 130 140 150 160 170 190 200 210 220 pF1KE1 CNGFTIEDEE-LSHLGSAIFPDVALMNHSCCPNVIVTY--------KGTL-----AEVRA :::::. :.. :. .: .:::...:.::.: :: : . :. . :.:: CCDS33 CNGFTLSDQRGLQAVGVGIFPNLGLVNHDCWPNCTVIFNNGNHEAVKSMFHTQMRIELRA 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 VQEIKPGEEVFTSYIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDP- . .:. :::. .::::.: .:.:. .:. .:.: : :..: : :: . .. ..: CCDS33 LGKISEGEELTVSYIDFLNVSEERKRQLKKQYYFDCTCEHCQKKLKDDLFLGVK--DNPK 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 PKAEAIRDMVRYARNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQ :. :....:........:.. .:. :....:. ::. :: :.:.:::.:. CCDS33 PSQEVVKEMIQFSKDTLEKIDKARSEGLYHEVVKLCRECLEKQEPVFADTNIYMLRMLSI 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 AMGVCLYMQDWEGALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKA---AGE . : :.: .: : :..... : : :: : :.. . . : . : . .:. CCDS33 VSEVLSYLQAFEEASFYARRMVDGYMK---LYHPNNAQLGMAVMRAGLTNWHAGNIEVGH 360 370 380 390 400 410 410 420 430 pF1KE1 KALKKAIAIMEVAHGKDHPYISEIKQEIESH . :: ::. :.:: .:: .... CCDS33 GMICKAYAILLVTHGPSHPITKDLEAMRVQTEMELRMFRQNEFMYYKMREAALNNQPMQV 420 430 440 450 460 470 433 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 12:39:59 2016 done: Sun Nov 6 12:40:00 2016 Total Scan time: 2.760 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]