FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1903, 433 aa
1>>>pF1KE1903 433 - 433 aa - 433 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0284+/-0.000984; mu= 13.7681+/- 0.059
mean_var=79.5308+/-16.644, 0's: 0 Z-trim(106.6): 58 B-trim: 670 in 2/47
Lambda= 0.143816
statistics sampled from 9009 (9060) to 9009 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.278), width: 16
Scan time: 2.760
The best scores are: opt bits E(32554)
CCDS31022.1 SMYD2 gene_id:56950|Hs108|chr1 ( 433) 2954 622.6 2.2e-178
CCDS82480.1 SMYD1 gene_id:150572|Hs108|chr2 ( 477) 847 185.5 9.7e-47
CCDS53486.1 SMYD3 gene_id:64754|Hs108|chr1 ( 428) 673 149.4 6.5e-36
CCDS31083.1 SMYD3 gene_id:64754|Hs108|chr1 ( 369) 536 120.9 2.1e-27
CCDS33240.1 SMYD1 gene_id:150572|Hs108|chr2 ( 490) 468 106.9 4.7e-23
>>CCDS31022.1 SMYD2 gene_id:56950|Hs108|chr1 (433 aa)
initn: 2954 init1: 2954 opt: 2954 Z-score: 3315.9 bits: 622.6 E(32554): 2.2e-178
Smith-Waterman score: 2954; 99.8% identity (99.8% similar) in 433 aa overlap (1-433:1-433)
10 20 30 40 50 60
pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN
:::::::::::::::::::::::::::::::::::::::::::: :::::::::::::::
CCDS31 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLGFPDNDSLVVLFAQVN
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 CNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 CNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTSY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 IDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVRYARN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVRYARN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 VIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEGAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEGAL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 QYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAHGKDH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 QYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAHGKDH
370 380 390 400 410 420
430
pF1KE1 PYISEIKQEIESH
:::::::::::::
CCDS31 PYISEIKQEIESH
430
>>CCDS82480.1 SMYD1 gene_id:150572|Hs108|chr2 (477 aa)
initn: 701 init1: 272 opt: 847 Z-score: 952.6 bits: 185.5 E(32554): 9.7e-47
Smith-Waterman score: 847; 31.8% identity (66.0% similar) in 424 aa overlap (9-427:9-425)
10 20 30 40 50 60
pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE
.: : . ::::::.: . : ..:..:. ::. :. . . :. :: :.:
CCDS82 MTIGRMENVEVFTAEGKGRGLKATKEFWAADIIFAERAYSAVVFDSLVNFVCHTCFKRQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP
: .::.:: : ::. :::. : :: ::: . .:. :.:..::.:::. . . .
CCDS82 KLHRCGQCKFAHYCDRTCQKDAWLNHKNECSAIKRYGKV--PNENIRLAARIMWRVEREG
70 80 90 100 110
130 140 150 160 170 180
pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN
:..: ....:.... .:.. .. :. .. ... . . . . . .:. .:
CCDS82 TGLTEGCLVSVDDLQNHVEHFGEEEQKDLRVDVDTFLQYWPPQSQQFSMQYISHIFGVIN
120 130 140 150 160 170
190 200 210 220 230
pF1KE1 CNGFTIEDEE-LSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTS
:::::. :.. :. .: .:::...:.::.: :: : ... :.::. .:. :::. .:
CCDS82 CNGFTLSDQRGLQAVGVGIFPNLGLVNHDCWPNCTVIFNNGKIELRALGKISEGEELTVS
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE1 YIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDP-PKAEAIRDMVRYA
:::.: .:.:. .:. .:.: : :..: : :: . .. ..: :. :....:....
CCDS82 YIDFLNVSEERKRQLKKQYYFDCTCEHCQKKLKDDLFLGVK--DNPKPSQEVVKEMIQFS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE1 RNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEG
....:.. .:. :....:. ::. :: :.:.:::.:. . : :.: .:
CCDS82 KDTLEKIDKARSEGLYHEVVKLCRECLEKQEPVFADTNIYMLRMLSIVSEVLSYLQAFEE
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE1 ALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKA---AGEKALKKAIAIMEVA
: :..... : : :: : :.. . . : . : . .:. . :: ::. :.
CCDS82 ASFYARRMVDGYMK---LYHPNNAQLGMAVMRAGLTNWHAGNIEVGHGMICKAYAILLVT
360 370 380 390 400 410
420 430
pF1KE1 HGKDHPYISEIKQEIESH
:: .:: ....
CCDS82 HGPSHPITKDLEAMRVQTEMELRMFRQNEFMYYKMREAALNNQPMQVMAEPSNEPSPALF
420 430 440 450 460 470
>>CCDS53486.1 SMYD3 gene_id:64754|Hs108|chr1 (428 aa)
initn: 777 init1: 329 opt: 673 Z-score: 758.2 bits: 149.4 E(32554): 6.5e-36
Smith-Waterman score: 824; 32.5% identity (63.0% similar) in 422 aa overlap (9-426:6-414)
10 20 30 40 50 60
pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE
.:.: . .: ::::. :.. :.::: ::.. . :: :. :. ::
CCDS53 MEPLKVEKFATAKRGNGLRAVTPLRPGELLFRSDPLAYTVCKGSRGVVCDRCLLGKE
10 20 30 40 50
70 80 90 100 110 120
pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP
: .:..:. : ::...:::. :: :: ::. . . : ..::: .:.. : .
CCDS53 KLMRCSQCRVAKYCSAKCQKKAWPDHKRECKCLKSCKPRY-PPDSVRLLGRVVFKL-MDG
60 70 80 90 100 110
130 140 150 160 170
pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLE----FPDNDSLVVLF
. :::: . ..::...:: ..::. ... . ...::. .... .: .: :
CCDS53 APSESEKLYSFYDLESNINKLTEDKKEGLRQLVMTFQHFMREEIQDASQLPPAFDLFEAF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 AQVNCNGFTIEDEELSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEV
:.: ::.::: . :....: ...:...:.:::: :: ....: .:::..:. :::.
CCDS53 AKVICNSFTICNAEMQEVGVGLYPSISLLNHSCDPNCSIVFNGPHLLLRAVRDIEVGEEL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE1 FTSYIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDPPKAEAIRDMVR
:.:.:. .:.: .:::.: : :.: .: :.::: . .: : . :.
CCDS53 TICYLDMLMTSEERRKQLRDQYCFECDCFRCQTQDKDADMLT----GD----EQVWKEVQ
240 250 260 270 280
300 310 320 330 340 350
pF1KE1 YARNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDW
. . :::.. :.: ..: .:. . : . : :.:.:... :: .:. .
CCDS53 ESLKKIEELK--AHWKWE-QVLAMCQAIISSNSERLPDINIYQLKVLDCAMDACINLGLL
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE1 EGALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAH
: :: :: . ..:: .: . . .:.:.: . . : :. :. ::.:.:
CCDS53 EEALFYGTRTMEPYRIFFPGSHPVRGVQVMKVGKLQLHQGMFPQAMKNLRLAFDIMRVTH
350 360 370 380 390 400
420 430
pF1KE1 GKDHPYISEIKQEIESH
:..: : ..
CCDS53 GREHSLIEDLILLLEECDANIRAS
410 420
>>CCDS31083.1 SMYD3 gene_id:64754|Hs108|chr1 (369 aa)
initn: 674 init1: 329 opt: 536 Z-score: 605.6 bits: 120.9 E(32554): 2.1e-27
Smith-Waterman score: 687; 31.6% identity (63.2% similar) in 367 aa overlap (64-426:2-355)
40 50 60 70 80 90
pF1KE1 FSCPAYAYVLTVNERGNHCEYCFTRKEGLSKCGRCKQAFYCNVECQKEDWPMHKLECSPM
.:..:. : ::...:::. :: :: ::. .
CCDS31 MRCSQCRVAKYCSAKCQKKAWPDHKRECKCL
10 20 30
100 110 120 130 140 150
pF1KE1 VVFGENWNPSETVRLTARILAKQKIHPERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDI
. : ..::: .:.. : . . :::: . ..::...:: ..::. ... .
CCDS31 KSCKPRY-PPDSVRLLGRVVFKL-MDGAPSESEKLYSFYDLESNINKLTEDKKEGLRQLV
40 50 60 70 80
160 170 180 190 200
pF1KE1 AALHHFYSKHLE----FPDNDSLVVLFAQVNCNGFTIEDEELSHLGSAIFPDVALMNHSC
...::. .... .: .: ::.: ::.::: . :....: ...:...:.::::
CCDS31 MTFQHFMREEIQDASQLPPAFDLFEAFAKVICNSFTICNAEMQEVGVGLYPSISLLNHSC
90 100 110 120 130 140
210 220 230 240 250 260
pF1KE1 CPNVIVTYKGTLAEVRAVQEIKPGEEVFTSYIDLLYPTEDRNDRLRDSYFFTCECQECTT
:: ....: .:::..:. :::. :.:.:. .:.: .:::.: : :.: .: :
CCDS31 DPNCSIVFNGPHLLLRAVRDIEVGEELTICYLDMLMTSEERRKQLRDQYCFECDCFRCQT
150 160 170 180 190 200
270 280 290 300 310 320
pF1KE1 KDKDKAKVEIRKLSDPPKAEAIRDMVRYARNVIEEFRRAKHYKSPSELLEICELSQEKMS
.::: . .: : . :. . . :::.. :.: ..: .:. . :
CCDS31 QDKDADMLT----GD----EQVWKEVQESLKKIEELK--AHWKWE-QVLAMCQAIISSNS
210 220 230 240 250
330 340 350 360 370 380
pF1KE1 SVFEDSNVYMLHMMYQAMGVCLYMQDWEGALQYGQKIIKPYSKHYPLYSLNVASMWLKLG
. : :.:.:... :: .:. . : :: :: . ..:: .: . . .:.:
CCDS31 ERLPDINIYQLKVLDCAMDACINLGLLEEALFYGTRTMEPYRIFFPGSHPVRGVQVMKVG
260 270 280 290 300 310
390 400 410 420 430
pF1KE1 RLYMGLEHKAAGEKALKKAIAIMEVAHGKDHPYISEIKQEIESH
.: . . : :. :. ::.:.::..: : ..
CCDS31 KLQLHQGMFPQAMKNLRLAFDIMRVTHGREHSLIEDLILLLEECDANIRAS
320 330 340 350 360
>>CCDS33240.1 SMYD1 gene_id:150572|Hs108|chr2 (490 aa)
initn: 665 init1: 254 opt: 468 Z-score: 527.4 bits: 106.9 E(32554): 4.7e-23
Smith-Waterman score: 812; 31.1% identity (64.3% similar) in 437 aa overlap (9-427:9-438)
10 20 30 40 50 60
pF1KE1 MRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE
.: : . ::::::.: . : ..:..:. ::. :. . . :. :: :.:
CCDS33 MTIGRMENVEVFTAEGKGRGLKATKEFWAADIIFAERAYSAVVFDSLVNFVCHTCFKRQE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP
: .::.:: : ::. :::. : :: ::: . .:. :.:..::.:::. . . .
CCDS33 KLHRCGQCKFAHYCDRTCQKDAWLNHKNECSAIKRYGKV--PNENIRLAARIMWRVEREG
70 80 90 100 110
130 140 150 160 170 180
pF1KE1 ERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN
:..: ....:.... .:.. .. :. .. ... . . . . . .:. .:
CCDS33 TGLTEGCLVSVDDLQNHVEHFGEEEQKDLRVDVDTFLQYWPPQSQQFSMQYISHIFGVIN
120 130 140 150 160 170
190 200 210 220
pF1KE1 CNGFTIEDEE-LSHLGSAIFPDVALMNHSCCPNVIVTY--------KGTL-----AEVRA
:::::. :.. :. .: .:::...:.::.: :: : . :. . :.::
CCDS33 CNGFTLSDQRGLQAVGVGIFPNLGLVNHDCWPNCTVIFNNGNHEAVKSMFHTQMRIELRA
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 VQEIKPGEEVFTSYIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDP-
. .:. :::. .::::.: .:.:. .:. .:.: : :..: : :: . .. ..:
CCDS33 LGKISEGEELTVSYIDFLNVSEERKRQLKKQYYFDCTCEHCQKKLKDDLFLGVK--DNPK
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE1 PKAEAIRDMVRYARNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQ
:. :....:........:.. .:. :....:. ::. :: :.:.:::.:.
CCDS33 PSQEVVKEMIQFSKDTLEKIDKARSEGLYHEVVKLCRECLEKQEPVFADTNIYMLRMLSI
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE1 AMGVCLYMQDWEGALQYGQKIIKPYSKHYPLYSLNVASMWLKLGRLYMGLEHKA---AGE
. : :.: .: : :..... : : :: : :.. . . : . : . .:.
CCDS33 VSEVLSYLQAFEEASFYARRMVDGYMK---LYHPNNAQLGMAVMRAGLTNWHAGNIEVGH
360 370 380 390 400 410
410 420 430
pF1KE1 KALKKAIAIMEVAHGKDHPYISEIKQEIESH
. :: ::. :.:: .:: ....
CCDS33 GMICKAYAILLVTHGPSHPITKDLEAMRVQTEMELRMFRQNEFMYYKMREAALNNQPMQV
420 430 440 450 460 470
433 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 12:39:59 2016 done: Sun Nov 6 12:40:00 2016
Total Scan time: 2.760 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]