FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7789, 458 aa
1>>>pF1KB7789 458 - 458 aa - 458 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.1653+/-0.000833; mu= 10.7342+/- 0.051
mean_var=132.5694+/-25.896, 0's: 0 Z-trim(111.5): 18 B-trim: 0 in 0/53
Lambda= 0.111392
statistics sampled from 12427 (12445) to 12427 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.727), E-opt: 0.2 (0.382), width: 16
Scan time: 2.280
The best scores are: opt bits E(32554)
CCDS10706.1 KAT8 gene_id:84148|Hs108|chr16 ( 458) 3114 511.6 7e-145
CCDS45468.1 KAT8 gene_id:84148|Hs108|chr16 ( 467) 2966 487.8 1e-137
CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 ( 442) 1164 198.2 1.5e-50
CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 ( 472) 1164 198.2 1.5e-50
CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 ( 501) 1164 198.2 1.6e-50
CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 ( 581) 1164 198.2 1.8e-50
CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 ( 611) 1164 198.3 1.9e-50
CCDS8109.1 KAT5 gene_id:10524|Hs108|chr11 ( 461) 1077 184.2 2.4e-46
CCDS55771.1 KAT5 gene_id:10524|Hs108|chr11 ( 494) 1077 184.2 2.6e-46
CCDS31610.1 KAT5 gene_id:10524|Hs108|chr11 ( 513) 1077 184.2 2.7e-46
CCDS8110.1 KAT5 gene_id:10524|Hs108|chr11 ( 546) 1077 184.2 2.8e-46
CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 ( 815) 1049 179.9 8.7e-45
CCDS6124.1 KAT6A gene_id:7994|Hs108|chr8 (2004) 1049 180.1 1.8e-44
CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781) 970 167.4 1.1e-40
CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890) 970 167.4 1.1e-40
CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073) 970 167.4 1.2e-40
>>CCDS10706.1 KAT8 gene_id:84148|Hs108|chr16 (458 aa)
initn: 3114 init1: 3114 opt: 3114 Z-score: 2714.6 bits: 511.6 E(32554): 7e-145
Smith-Waterman score: 3114; 100.0% identity (100.0% similar) in 458 aa overlap (1-458:1-458)
10 20 30 40 50 60
pF1KB7 MAAQGAAAAVAAGTSGVAGEGEPGPGENAAAEGTAPSPGRVSPPTPARGEPEVTVEIGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MAAQGAAAAVAAGTSGVAGEGEPGPGENAAAEGTAPSPGRVSPPTPARGEPEVTVEIGET
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 KNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 KIHIGNYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KIHIGNYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 YRKSNISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YRKSNISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 YFSKEKESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YFSKEKESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 YRSYWSWVLLEILRDFRGTLSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 YRSYWSWVLLEILRDFRGTLSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPK
370 380 390 400 410 420
430 440 450
pF1KB7 LVEEHLKSAQYKKPPITVDSVCLKWAPPKHKQVKLSKK
::::::::::::::::::::::::::::::::::::::
CCDS10 LVEEHLKSAQYKKPPITVDSVCLKWAPPKHKQVKLSKK
430 440 450
>>CCDS45468.1 KAT8 gene_id:84148|Hs108|chr16 (467 aa)
initn: 2965 init1: 2965 opt: 2966 Z-score: 2585.9 bits: 487.8 E(32554): 1e-137
Smith-Waterman score: 2966; 98.0% identity (98.4% similar) in 449 aa overlap (1-445:1-449)
10 20 30 40 50 60
pF1KB7 MAAQGAAAAVAAGTSGVAGEGEPGPGENAAAEGTAPSPGRVSPPTPARGEPEVTVEIGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MAAQGAAAAVAAGTSGVAGEGEPGPGENAAAEGTAPSPGRVSPPTPARGEPEVTVEIGET
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 YLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQ
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 KNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 KIHIGNYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KIHIGNYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 YRKSNISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YRKSNISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 YFSKEKESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YFSKEKESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 YRSYWSWVLLEILRDFRGTLSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YRSYWSWVLLEILRDFRGTLSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPK
370 380 390 400 410 420
430 440 450
pF1KB7 LVEEHLKSAQYKKPPITVD---SVCL-KWAPPKHKQVKLSKK
::::::::::::::::: .:: .:
CCDS45 LVEEHLKSAQYKKPPITGGWGAAVCRGRWGSVSIWTGRSQGLLIAVT
430 440 450 460
>>CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 (442 aa)
initn: 1143 init1: 924 opt: 1164 Z-score: 1021.2 bits: 198.2 E(32554): 1.5e-50
Smith-Waterman score: 1165; 45.5% identity (70.0% similar) in 404 aa overlap (64-449:38-440)
40 50 60 70 80 90
pF1KB7 TAPSPGRVSPPTPARGEPEVTVEIGETYLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHY
: : ::.. :: . :..: .
CCDS56 AGSSSDGTEDSDFSTDLEHTDSSESDGTSRRSARVTRSSARLSQSSQGHLTGKHERHFSI
10 20 30 40 50 60
100 110 120 130 140
pF1KB7 VGFNRRLDEWVDKNRLALTKTV--KDAVQKNSEKYLSELA-EQPERKITRNQ---KRKHD
: . .:. . . . :. : . .: : :. :: :. . . : . ..
CCDS56 SGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRNSGLSKEQKEKYMEHRQTYGNTREP
70 80 90 100 110 120
150 160 170 180 190
pF1KB7 EINHVQKTYAEMDPTTAALEKEHEAITKVK----------YVDKIHIGNYEIDAWYFSPF
.... . : ..: : . : . :.. .. : .: ::.:.:: ::.
CCDS56 LLENLTSEY-DLDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPY
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB7 PEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVYEVDGKDHK
::.:.. .:..::.:::::: . : :...: :..::: :::::..:::.::::: .:
CCDS56 PEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNK
190 200 210 220 230 240
260 270 280 290 300 310
pF1KB7 IYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESPDGNNVACI
::::::::::::::::::::.:::::.::..::.: : :..:::::::.: . ::.::
CCDS56 IYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCI
250 260 270 280 290 300
320 330 340 350 360 370
pF1KB7 LTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVLLEILRDFR
::.: :.:.::::.:: ::: :::.: :::::.:::::: .::::::. :::. :..:.
CCDS56 LTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQ
310 320 330 340 350 360
380 390 400 410 420 430
pF1KB7 GT-LSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEEHL-KSAQYKKPP
: .:::..:: :... ::.::::.:.:.:::::.:.. :..: . : :. ..
CCDS56 GKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSN
370 380 390 400 410 420
440 450
pF1KB7 ITVDSVCLKWAPPKHKQVKLSKK
:.: ::::.:::
CCDS56 KTMDPSCLKWTPPKGT
430 440
>>CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 (472 aa)
initn: 1121 init1: 924 opt: 1164 Z-score: 1020.8 bits: 198.2 E(32554): 1.5e-50
Smith-Waterman score: 1165; 46.7% identity (70.1% similar) in 398 aa overlap (77-449:86-470)
50 60 70 80 90 100
pF1KB7 ARGEPEVTVEIGETYLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDK
::: :.. .:.. : : : :.
CCDS56 HLTGKHERHFSISGCPLYHNLSADECKVRAQSR--DKQIEERMLSH------RQD---DN
60 70 80 90 100
110 120 130 140 150 160
pF1KB7 NRLALTKTVKDAVQKNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAAL
:: : . . : .. ..:: .. . ....::.:. : : : .: :
CCDS56 NRHATRHQAPTERQLRYKEKVAELRKKRNSGLSKEQKEKYME--HRQTYGNTREPLLENL
110 120 130 140 150 160
170 180 190 200
pF1KB7 EKEH-------------EAITKVK----------YVDKIHIGNYEIDAWYFSPFPEDYGK
.:. : . :.. .. : .: ::.:.:: ::.::.:..
CCDS56 TSEYDLDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYAR
170 180 190 200 210 220
210 220 230 240 250 260
pF1KB7 QPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVYEVDGKDHKIYCQNL
.:..::.:::::: . : :...: :..::: :::::..:::.::::: .:::::::
CCDS56 LGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNL
230 240 250 260 270 280
270 280 290 300 310 320
pF1KB7 CLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESPDGNNVACILTLPPY
::::::::::::::.:::::.::..::.: : :..:::::::.: . ::.::::.: :
CCDS56 CLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQY
290 300 310 320 330 340
330 340 350 360 370 380
pF1KB7 QRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVLLEILRDFRGT-LSI
.:.::::.:: ::: :::.: :::::.:::::: .::::::. :::. :..:.: .::
CCDS56 MRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISI
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB7 KDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEEHL-KSAQYKKPPITVDSV
:..:: :... ::.::::.:.:.:::::.:.. :..: . : :. .. :.:
CCDS56 KEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPS
410 420 430 440 450 460
450
pF1KB7 CLKWAPPKHKQVKLSKK
::::.:::
CCDS56 CLKWTPPKGT
470
>>CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 (501 aa)
initn: 1121 init1: 924 opt: 1164 Z-score: 1020.4 bits: 198.2 E(32554): 1.6e-50
Smith-Waterman score: 1164; 48.0% identity (75.3% similar) in 356 aa overlap (96-449:150-499)
70 80 90 100 110 120
pF1KB7 PDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQKNSEK
..... : : .:.: :. ... .
CCDS56 HERHFSISGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRNSGLSKEQKEKYMEHRQT
120 130 140 150 160 170
130 140 150 160 170 180
pF1KB7 YLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVDKIHIG
: . ...: . .: ..: .. ... :. . :. . . ... : .:
CCDS56 YGN--TREP---LLENLTSEYD-LDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFG
180 190 200 210 220 230
190 200 210 220 230 240
pF1KB7 NYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSN
::.:.:: ::.::.:.. .:..::.:::::: . : :...: :..::: :::::..
CCDS56 RYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGS
240 250 260 270 280 290
250 260 270 280 290 300
pF1KB7 ISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKE
:::.::::: .:::::::::::::::::::::.:::::.::..::.: : :..::::::
CCDS56 ISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKE
300 310 320 330 340 350
310 320 330 340 350 360
pF1KB7 KESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYW
:.: . ::.::::.: :.:.::::.:: ::: :::.: :::::.:::::: .::::::
CCDS56 KNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYW
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB7 SWVLLEILRDFRGT-LSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEE
. :::. :..:.: .:::..:: :... ::.::::.:.:.:::::.:.. :..:
CCDS56 KEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDE
420 430 440 450 460 470
430 440 450
pF1KB7 HL-KSAQYKKPPITVDSVCLKWAPPKHKQVKLSKK
. : :. .. :.: ::::.:::
CCDS56 WIAKEAKRSNSNKTMDPSCLKWTPPKGT
480 490 500
>>CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 (581 aa)
initn: 1121 init1: 924 opt: 1164 Z-score: 1019.5 bits: 198.2 E(32554): 1.8e-50
Smith-Waterman score: 1164; 48.0% identity (75.3% similar) in 356 aa overlap (96-449:230-579)
70 80 90 100 110 120
pF1KB7 PDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTVKDAVQKNSEK
..... : : .:.: :. ... .
CCDS56 HERHFSISGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRNSGLSKEQKEKYMEHRQT
200 210 220 230 240 250
130 140 150 160 170 180
pF1KB7 YLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAALEKEHEAITKVKYVDKIHIG
: . ...: . .: ..: .. ... :. . :. . . ... : .:
CCDS56 YGN--TREP---LLENLTSEYD-LDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFG
260 270 280 290 300 310
190 200 210 220 230 240
pF1KB7 NYEIDAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSN
::.:.:: ::.::.:.. .:..::.:::::: . : :...: :..::: :::::..
CCDS56 RYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGS
320 330 340 350 360 370
250 260 270 280 290 300
pF1KB7 ISVYEVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKE
:::.::::: .:::::::::::::::::::::.:::::.::..::.: : :..::::::
CCDS56 ISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKE
380 390 400 410 420 430
310 320 330 340 350 360
pF1KB7 KESPDGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYW
:.: . ::.::::.: :.:.::::.:: ::: :::.: :::::.:::::: .::::::
CCDS56 KNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYW
440 450 460 470 480 490
370 380 390 400 410 420
pF1KB7 SWVLLEILRDFRGT-LSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEE
. :::. :..:.: .:::..:: :... ::.::::.:.:.:::::.:.. :..:
CCDS56 KEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDE
500 510 520 530 540 550
430 440 450
pF1KB7 HL-KSAQYKKPPITVDSVCLKWAPPKHKQVKLSKK
. : :. .. :.: ::::.:::
CCDS56 WIAKEAKRSNSNKTMDPSCLKWTPPKGT
560 570 580
>>CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 (611 aa)
initn: 1121 init1: 924 opt: 1164 Z-score: 1019.2 bits: 198.3 E(32554): 1.9e-50
Smith-Waterman score: 1165; 46.7% identity (70.1% similar) in 398 aa overlap (77-449:225-609)
50 60 70 80 90 100
pF1KB7 ARGEPEVTVEIGETYLCRRPDSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDK
::: :.. .:.. : : : :.
CCDS11 HLTGKHERHFSISGCPLYHNLSADECKVRAQSR--DKQIEERMLSH------RQD---DN
200 210 220 230 240
110 120 130 140 150 160
pF1KB7 NRLALTKTVKDAVQKNSEKYLSELAEQPERKITRNQKRKHDEINHVQKTYAEMDPTTAAL
:: : . . : .. ..:: .. . ....::.:. : : : .: :
CCDS11 NRHATRHQAPTERQLRYKEKVAELRKKRNSGLSKEQKEKYME--HRQTYGNTREPLLENL
250 260 270 280 290 300
170 180 190 200
pF1KB7 EKEH-------------EAITKVK----------YVDKIHIGNYEIDAWYFSPFPEDYGK
.:. : . :.. .. : .: ::.:.:: ::.::.:..
CCDS11 TSEYDLDLFRRAQARASEDLEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYAR
310 320 330 340 350 360
210 220 230 240 250 260
pF1KB7 QPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVYEVDGKDHKIYCQNL
.:..::.:::::: . : :...: :..::: :::::..:::.::::: .:::::::
CCDS11 LGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNL
370 380 390 400 410 420
270 280 290 300 310 320
pF1KB7 CLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESPDGNNVACILTLPPY
::::::::::::::.:::::.::..::.: : :..:::::::.: . ::.::::.: :
CCDS11 CLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQY
430 440 450 460 470 480
330 340 350 360 370 380
pF1KB7 QRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVLLEILRDFRGT-LSI
.:.::::.:: ::: :::.: :::::.:::::: .::::::. :::. :..:.: .::
CCDS11 MRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISI
490 500 510 520 530 540
390 400 410 420 430 440
pF1KB7 KDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEEHL-KSAQYKKPPITVDSV
:..:: :... ::.::::.:.:.:::::.:.. :..: . : :. .. :.:
CCDS11 KEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPS
550 560 570 580 590 600
450
pF1KB7 CLKWAPPKHKQVKLSKK
::::.:::
CCDS11 CLKWTPPKGT
610
>>CCDS8109.1 KAT5 gene_id:10524|Hs108|chr11 (461 aa)
initn: 1136 init1: 873 opt: 1077 Z-score: 945.4 bits: 184.2 E(32554): 2.4e-46
Smith-Waterman score: 1161; 43.6% identity (66.5% similar) in 454 aa overlap (56-447:3-452)
30 40 50 60 70
pF1KB7 GENAAAEGTAPSPGRVSPPTPARGEPEVTVEIGETYL-CRRP--------DSTWHSAEVI
:.:: :: : .. : ::..
CCDS81 MAEVGEIIEGCRLPVLRRNQDNEDEWPLAEIL
10 20 30
80 90 100 110 120 130
pF1KB7 QSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTV---KDAVQKNSEKYLSELAEQ
. :.: ::. :::::. ::.:::::: ..:: : : :.: ... . .
CCDS81 S--VKDISGRKLFYVHYIDFNKRLDEWVTHERLDLKKIQFPKKEAKTPTKNGLPGSRPGS
40 50 60 70 80 90
140 150
pF1KB7 PERKITRN-----------------------------------QKRKHDEINHVQKTYAE
:::.. :. .::: . .. . .
CCDS81 PEREVKRKVEVVSPATPVPSETAPASVFPQNGAARRAVAAQPGRKRKSNCLGTDEDSQDS
100 110 120 130 140 150
160 170 180 190 200
pF1KB7 MD--PT----TAAL--EKEHEAI-TKVKYVDKIHIGNYEIDAWYFSPFPEDYGKQPKLWL
: :. :..: .. :. : :..: .. :..: ... :::::.:.. : :.:
CCDS81 SDGIPSAPRMTGSLVSDRSHDDIVTRMKNIECIELGRHRLKPWYFSPYPQELTTLPVLYL
160 170 180 190 200 210
210 220 230 240 250 260
pF1KB7 CEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVYEVDGKDHKIYCQNLCLLAKL
::.:::: . : . :: .:. :.:::.:::::..:: .:.::. .: : ::::::::
CCDS81 CEFCLKYGRSLKCLQRHLTKCDLRHPPGNEIYRKGTISFFEIDGRKNKSYSQNLCLLAKC
220 230 240 250 260 270
270 280 290 300 310 320
pF1KB7 FLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESPDGNNVACILTLPPYQRRGYG
::::::::.:..::.::..:: : .: :::::::::::: . :::::::::::::::::
CCDS81 FLDHKTLYYDTDPFLFYVMTEYDCKGFHIVGYFSKEKESTEDYNVACILTLPPYQRRGYG
280 290 300 310 320 330
330 340 350 360 370 380
pF1KB7 KFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVLLEILRDF------RGTLSIK
:.:: :::::::.:. .:.::::::::: :::::::: ..:::: . : ..:.
CCDS81 KLLIEFSYELSKVEGKTGTPEKPLSDLGLLSYRSYWSQTILEILMGLKSESGERPQITIN
340 350 360 370 380 390
390 400 410 420 430 440
pF1KB7 DLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEEHLKSAQYKKPPITVDSVCL
..:..::: ..:.::::: ::...:.:::... .. .:. : . :. :. . .:: ::
CCDS81 EISEITSIKKEDVISTLQYLNLINYYKGQYILTLSEDIVDGH-ERAMLKRL-LRIDSKCL
400 410 420 430 440
450
pF1KB7 KWAPPKHKQVKLSKK
...:
CCDS81 HFTPKDWSKRGKW
450 460
>>CCDS55771.1 KAT5 gene_id:10524|Hs108|chr11 (494 aa)
initn: 1111 init1: 873 opt: 1077 Z-score: 945.0 bits: 184.2 E(32554): 2.6e-46
Smith-Waterman score: 1184; 42.7% identity (65.7% similar) in 490 aa overlap (15-447:6-485)
10 20 30 40 50
pF1KB7 MAAQGAAAAVAAGTSGVAGEGEPGPGENAAAEGT-APSPGRVSPPTPARGEPEVTVEIGE
: : : :. ::: . :.: . .:: . : .:: .: .
CCDS55 MAEVVSPVPGAGRREPGEVGRARGPPVADPGVALSP---QGE---IIEGCR
10 20 30 40
60 70 80 90 100 110
pF1KB7 TYLCRRP---DSTWHSAEVIQSRVNDQEGREEFYVHYVGFNRRLDEWVDKNRLALTKTV-
. :: .. : ::... :.: ::. :::::. ::.:::::: ..:: : :
CCDS55 LPVLRRNQDNEDEWPLAEILS--VKDISGRKLFYVHYIDFNKRLDEWVTHERLDLKKIQF
50 60 70 80 90 100
120 130 140
pF1KB7 --KDAVQKNSEKYLSELAEQPERKITRN--------------------------------
:.: ... . .:::.. :.
CCDS55 PKKEAKTPTKNGLPGSRPGSPEREVKRKVEVVSPATPVPSETAPASVFPQNGAARRAVAA
110 120 130 140 150 160
150 160 170 180
pF1KB7 ---QKRKHDEINHVQKTYAEMD--PT----TAAL--EKEHEAI-TKVKYVDKIHIGNYEI
.::: . .. . . : :. :..: .. :. : :..: .. :..: ...
CCDS55 QPGRKRKSNCLGTDEDSQDSSDGIPSAPRMTGSLVSDRSHDDIVTRMKNIECIELGRHRL
170 180 190 200 210 220
190 200 210 220 230 240
pF1KB7 DAWYFSPFPEDYGKQPKLWLCEYCLKYMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVY
:::::.:.. : :.:::.:::: . : . :: .:. :.:::.:::::..:: .
CCDS55 KPWYFSPYPQELTTLPVLYLCEFCLKYGRSLKCLQRHLTKCDLRHPPGNEIYRKGTISFF
230 240 250 260 270 280
250 260 270 280 290 300
pF1KB7 EVDGKDHKIYCQNLCLLAKLFLDHKTLYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESP
:.::. .: : :::::::: ::::::::.:..::.::..:: : .: ::::::::::::
CCDS55 EIDGRKNKSYSQNLCLLAKCFLDHKTLYYDTDPFLFYVMTEYDCKGFHIVGYFSKEKEST
290 300 310 320 330 340
310 320 330 340 350 360
pF1KB7 DGNNVACILTLPPYQRRGYGKFLIAFSYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVL
. ::::::::::::::::::.:: :::::::.:. .:.::::::::: :::::::: ..
CCDS55 EDYNVACILTLPPYQRRGYGKLLIEFSYELSKVEGKTGTPEKPLSDLGLLSYRSYWSQTI
350 360 370 380 390 400
370 380 390 400 410 420
pF1KB7 LEILRDF------RGTLSIKDLSQMTSITQNDIISTLQSLNMVKYWKGQHVICVTPKLVE
:::: . : ..:...:..::: ..:.::::: ::...:.:::... .. .:.
CCDS55 LEILMGLKSESGERPQITINEISEITSIKKEDVISTLQYLNLINYYKGQYILTLSEDIVD
410 420 430 440 450 460
430 440 450
pF1KB7 EHLKSAQYKKPPITVDSVCLKWAPPKHKQVKLSKK
: . :. :. . .:: ::...:
CCDS55 GH-ERAMLKRL-LRIDSKCLHFTPKDWSKRGKW
470 480 490
>>CCDS31610.1 KAT5 gene_id:10524|Hs108|chr11 (513 aa)
initn: 1136 init1: 873 opt: 1077 Z-score: 944.7 bits: 184.2 E(32554): 2.7e-46
Smith-Waterman score: 1077; 49.1% identity (76.2% similar) in 328 aa overlap (130-447:180-504)
100 110 120 130 140 150
pF1KB7 LDEWVDKNRLALTKTVKDAVQKNSEKYLSELAEQPERKITRN----QKRKHDEINHVQKT
.: :: :: : .. ..: . . ..
CCDS31 KVEVVSPATPVPSETAPASVFPQNGAARRAVAAQPGRKRKSNCLGTDEDSQDSSDGIPSA
150 160 170 180 190 200
160 170 180 190 200 210
pF1KB7 YAEMDPTTAALEKEHEAITKVKYVDKIHIGNYEIDAWYFSPFPEDYGKQPKLWLCEYCLK
.: . .. ... . .:..: .. :..: ... :::::.:.. : :.:::.:::
CCDS31 -PRMTGSLVSDRSHDDIVTRMKNIECIELGRHRLKPWYFSPYPQELTTLPVLYLCEFCLK
210 220 230 240 250 260
220 230 240 250 260 270
pF1KB7 YMKYEKSYRFHLGQCQWRQPPGKEIYRKSNISVYEVDGKDHKIYCQNLCLLAKLFLDHKT
: . : . :: .:. :.:::.:::::..:: .:.::. .: : :::::::: ::::::
CCDS31 YGRSLKCLQRHLTKCDLRHPPGNEIYRKGTISFFEIDGRKNKSYSQNLCLLAKCFLDHKT
270 280 290 300 310 320
280 290 300 310 320 330
pF1KB7 LYFDVEPFVFYILTEVDRQGAHIVGYFSKEKESPDGNNVACILTLPPYQRRGYGKFLIAF
::.:..::.::..:: : .: :::::::::::: . ::::::::::::::::::.:: :
CCDS31 LYYDTDPFLFYVMTEYDCKGFHIVGYFSKEKESTEDYNVACILTLPPYQRRGYGKLLIEF
330 340 350 360 370 380
340 350 360 370 380
pF1KB7 SYELSKLESTVGSPEKPLSDLGKLSYRSYWSWVLLEILRDF------RGTLSIKDLSQMT
::::::.:. .:.::::::::: :::::::: ..:::: . : ..:...:..:
CCDS31 SYELSKVEGKTGTPEKPLSDLGLLSYRSYWSQTILEILMGLKSESGERPQITINEISEIT
390 400 410 420 430 440
390 400 410 420 430 440
pF1KB7 SITQNDIISTLQSLNMVKYWKGQHVICVTPKLVEEHLKSAQYKKPPITVDSVCLKWAPPK
:: ..:.::::: ::...:.:::... .. .:. : . :. :. . .:: ::...:
CCDS31 SIKKEDVISTLQYLNLINYYKGQYILTLSEDIVDGHER-AMLKRL-LRIDSKCLHFTPKD
450 460 470 480 490 500
450
pF1KB7 HKQVKLSKK
CCDS31 WSKRGKW
510
458 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 09:26:16 2016 done: Fri Nov 4 09:26:16 2016
Total Scan time: 2.280 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]