FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6406, 458 aa
1>>>pF1KE6406 458 - 458 aa - 458 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.1010+/-0.000968; mu= 18.1935+/- 0.058
mean_var=60.2970+/-12.045, 0's: 0 Z-trim(103.0): 26 B-trim: 16 in 1/51
Lambda= 0.165168
statistics sampled from 7204 (7215) to 7204 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.222), width: 16
Scan time: 1.870
The best scores are: opt bits E(32554)
CCDS623.1 ATG4C gene_id:84938|Hs108|chr1 ( 458) 3101 747.8 5.2e-216
CCDS12241.1 ATG4D gene_id:84971|Hs108|chr19 ( 474) 941 233.1 4.7e-61
CCDS14538.1 ATG4A gene_id:115201|Hs108|chrX ( 398) 349 92.0 1.2e-18
CCDS46565.1 ATG4B gene_id:23192|Hs108|chr2 ( 380) 245 67.2 3.2e-11
CCDS46564.1 ATG4B gene_id:23192|Hs108|chr2 ( 393) 245 67.2 3.3e-11
>>CCDS623.1 ATG4C gene_id:84938|Hs108|chr1 (458 aa)
initn: 3101 init1: 3101 opt: 3101 Z-score: 3991.6 bits: 747.8 E(32554): 5.2e-216
Smith-Waterman score: 3101; 100.0% identity (100.0% similar) in 458 aa overlap (1-458:1-458)
10 20 30 40 50 60
pF1KE6 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFSRNSPVLLLGKCYHFKYEDEDKTLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFSRNSPVLLLGKCYHFKYEDEDKTLP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 AESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTDCGWGCTLRTGQMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 AESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTDCGWGCTLRTGQMLL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 AQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLSGEREFKTPTISLKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 AQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLSGEREFKTPTISLKE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 TIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGKKAGDWYGPAVVAHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 TIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGKKAGDWYGPAVVAHI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 LRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQSASMTSDNADDKAVIILVPVRLGGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 LRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQSASMTSDNADDKAVIILVPVRLGGE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 RTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 RTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 PLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS62 PLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN
370 380 390 400 410 420
430 440 450
pF1KE6 GHSRDYDFTSTTTNEEDLFSEDEKKQLKRFSTEEFVLL
::::::::::::::::::::::::::::::::::::::
CCDS62 GHSRDYDFTSTTTNEEDLFSEDEKKQLKRFSTEEFVLL
430 440 450
>>CCDS12241.1 ATG4D gene_id:84971|Hs108|chr19 (474 aa)
initn: 1302 init1: 530 opt: 941 Z-score: 1209.7 bits: 233.1 E(32554): 4.7e-61
Smith-Waterman score: 1371; 46.2% identity (70.5% similar) in 457 aa overlap (7-458:60-474)
10 20 30
pF1KE6 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFS
:::::.:.::..::::.::.::.:..: ::
CCDS12 GPRGPDPNGLGPSGASGPALGSPGAGPSEPDEVDKFKAKFLTAWNNVKYGWVVKSRTSFS
30 40 50 60 70 80
40 50 60 70 80 90
pF1KE6 RNSPVLLLGKCYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFP
. : . : :. :.:. : :....:..::.::.:::::..::
CCDS12 KISSIHLCGRRYRFEGE--------------------GDIQRFQRDFVSRLWLTYRRDFP
90 100 110 120
100 110 120 130 140 150
pF1KE6 QIEGSALTTDCGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKK
. :. ::.:::::: ::.:::.:::::.:::: : ::: ..... .
CCDS12 PLPGGCLTSDCGWGCMLRSGQMMLAQGLLLHFLPRDWTWAEGMGLGPPE-----------
130 140 150 160 170
160 170 180 190 200 210
pF1KE6 FTASFEASLSGEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQ
. .: : : .. :. . .. . :...: ::.:.:::.: : : ::::.
CCDS12 ----LSGSASPSR-YHGPARWMPPRWAQGAP--ELEQERRHRQIVSWFADHPRAPFGLHR
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE6 LIEYGKKSGKKAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQS
:.: :..:::::::::::..:::::::::: :. ...::.::::::..:: .
CCDS12 LVELGQSSGKKAGDWYGPSLVAHILRKAVESCS--DVTRLVVYVSQDCTVYKADVA--RL
240 250 260 270 280
280 290 300 310 320 330
pF1KE6 ASMTSDNADDKAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGF
.. . .:. :.:.:::::::::: : :. :: .: : :.::.::::..: :: :.
CCDS12 VARPDPTAEWKSVVILVPVRLGGETLNPVYVPCVKELLRCELCLGIMGGKPRHSLYFIGY
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE6 QDDSLIYMDPHYCQSFVDVSIKDFPLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKR
::: :.:.:::::: :::: :::::.::: ::.::.: :::::::.::: . ..:.
CCDS12 QDDFLLYLDPHYCQPTVDVSQADFPLESFHCTSPRKMAFAKMDPSCTVGFYAGDRKEFET
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE6 ASEEITKMLKFSSK-EKYPLFTFVNGHSRDYDFTSTTTN--EEDLFSEDEKKQL--KRFS
:.:..:. :: :.::.::...::..:... . .. . : . : :: :
CCDS12 LCSELTRVLSSSSATERYPMFTLAEGHAQDHSLDDLCSQLAQPTLRLPRTGRLLRAKRPS
410 420 430 440 450 460
pF1KE6 TEEFVLL
.:.::.:
CCDS12 SEDFVFL
470
>>CCDS14538.1 ATG4A gene_id:115201|Hs108|chrX (398 aa)
initn: 632 init1: 215 opt: 349 Z-score: 448.4 bits: 92.0 E(32554): 1.2e-18
Smith-Waterman score: 585; 29.1% identity (54.7% similar) in 422 aa overlap (68-454:34-391)
40 50 60 70 80 90
pF1KE6 NSPVLLLGKCYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQ
..:.. . .. .:. .:.:.:::..:
CCDS14 VLSKYEDQITIFTDYLEEYPDTDELVWILGKQHLLKTEKSKLLSDISARLWFTYRRKFSP
10 20 30 40 50 60
100 110 120 130 140 150
pF1KE6 IEGSALTTDCGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKF
: :.. ..: :::: :: :::.:::.:: . ::: :.:
CCDS14 IGGTGPSSDAGWGCMLRCGQMMLAQALICRHLGRDWSW----------------------
70 80 90 100
160 170 180 190 200 210
pF1KE6 TASFEASLSGEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQL
:.. . : :: ...:.. : : ...::.
CCDS14 ----------EKQKEQP----KE----------------YQRILQCFLDRKDCCYSIHQM
110 120 130
220 230 240 250 260 270
pF1KE6 IEYGKKSGKKAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDVI-----
..: ::. :.:.:: .::..:.: : . .....::..: :: :.
CCDS14 AQMGVGEGKSIGEWFGPNTVAQVLKKL---ALFDEWNSLAVYVSMDNTVVIEDIKKMCRV
140 150 160 170 180
280 290 300 310
pF1KE6 ---------DKQSASMTSDNADD---------KAVIILVPVRLGGERTNTDYLEFVKGIL
:. :.:..: . : ....::.::: .. : :.. : .
CCDS14 LPLSADTAGDRPPDSLTASNQSKGTSAYCSAWKPLLLIVPLRLGINQINPVYVDAFKECF
190 200 210 220 230 240
320 330 340 350 360
pF1KE6 SLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDV----SIKDFPLETFHC-PS
.. .: .::::...::: :: : ::..::: :.:::. ...: .:::: :
CCDS14 KMPQSLGALGGKPNNAYYFIGFLGDELIFLDPHTTQTFVDTEENGTVND---QTFHCLQS
250 260 270 280 290 300
370 380 390 400 410 420
pF1KE6 PKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVNGHSRDYD-F
:..:.. ..::: ..::.:.. .:: . : . ::. .: .:. : . :
CCDS14 PQRMNILNLDPSVALGFFCKEEKDFDNWCSLVQKEI---LKENLRMFELVQKHPSHWPPF
310 320 330 340 350 360
430 440 450
pF1KE6 TS------TTTNEEDLFSEDEKKQLKRFSTEEFVLL
. :::. : . : .::..:. ::
CCDS14 VPPAKPEVTTTGAEFI---DSTEQLEEFDLEEDFEILSV
370 380 390
>>CCDS46565.1 ATG4B gene_id:23192|Hs108|chr2 (380 aa)
initn: 597 init1: 234 opt: 245 Z-score: 314.8 bits: 67.2 E(32554): 3.2e-11
Smith-Waterman score: 538; 29.2% identity (54.1% similar) in 370 aa overlap (77-419:40-352)
50 60 70 80 90 100
pF1KE6 CYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTD
.:. .: ::.:.:::..:: : :.. :.:
CCDS46 TLRFAEFEDFPETSEPVWILGRKYSIFTEKDEILSDVASRLWFTYRKNFPAIGGTGPTSD
10 20 30 40 50 60
110 120 130 140 150 160
pF1KE6 CGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLS
:::: :: :::..::.:. . ::: : : : .:
CCDS46 TGWGCMLRCGQMIFAQALVCRHLGRDWRW-----------------TQRK----------
70 80 90 100
170 180 190 200 210 220
pF1KE6 GEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGK
. : . : .... : : . ...::. ..: ::
CCDS46 -----RQP-------------------DSYF-SVLNAFIDRKDSYYSIHQIAQMGVGEGK
110 120 130
230 240 250 260 270 280
pF1KE6 KAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDV--IDKQS---ASMTS
. :.:::: .::..:.: : .......:.: :: .. . . : :. :.
CCDS46 SIGQWYGPNTVAQVLKKL---AVFDTWSSLAVHIAMDNTVVMEEIRRLCRTSVPCAGATA
140 150 160 170 180 190
290 300 310 320
pF1KE6 DNADD--------------------KAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVG
::. . ...:.:.::: : :.: .: . . .:
CCDS46 FPADSDRHCNGFPAGAEVTNRPSPWRPLVLLIPLRLGLTDINEAYVETLKHCFMMPQSLG
200 210 220 230 240 250
330 340 350 360 370
pF1KE6 IIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF-PLETFHCPSPK-KMSFRKMD
.:::::....:: :. . :::.::: : :. . : : :.::: : .::. ..:
CCDS46 VIGGKPNSAHYFIGYVGEELIYLDPHTTQPAVEPTDGCFIPDESFHCQHPPCRMSIAELD
260 270 280 290 300 310
380 390 400 410 420 430
pF1KE6 PSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVNGHSRDYDFTSTTTNEEDLF
:: ..::.:.. .::. ... :. ... :.: .:
CCDS46 PSIAVGFFCKTEDDFNDWCQQVKKLSLLGGA--LPMFELVELQPSHLACPDVLNLSLGES
320 330 340 350 360 370
440 450
pF1KE6 SEDEKKQLKRFSTEEFVLL
CCDS46 CQVQILLM
380
>>CCDS46564.1 ATG4B gene_id:23192|Hs108|chr2 (393 aa)
initn: 597 init1: 234 opt: 245 Z-score: 314.6 bits: 67.2 E(32554): 3.3e-11
Smith-Waterman score: 539; 28.2% identity (53.0% similar) in 415 aa overlap (77-458:40-391)
50 60 70 80 90 100
pF1KE6 CYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTD
.:. .: ::.:.:::..:: : :.. :.:
CCDS46 TLRFAEFEDFPETSEPVWILGRKYSIFTEKDEILSDVASRLWFTYRKNFPAIGGTGPTSD
10 20 30 40 50 60
110 120 130 140 150 160
pF1KE6 CGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLS
:::: :: :::..::.:. . ::: : : : .:
CCDS46 TGWGCMLRCGQMIFAQALVCRHLGRDWRW-----------------TQRK----------
70 80 90 100
170 180 190 200 210 220
pF1KE6 GEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGK
. : . : .... : : . ...::. ..: ::
CCDS46 -----RQP-------------------DSYF-SVLNAFIDRKDSYYSIHQIAQMGVGEGK
110 120 130
230 240 250 260 270 280
pF1KE6 KAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDV--IDKQS---ASMTS
. :.:::: .::..:.: : .......:.: :: .. . . : :. :.
CCDS46 SIGQWYGPNTVAQVLKKL---AVFDTWSSLAVHIAMDNTVVMEEIRRLCRTSVPCAGATA
140 150 160 170 180 190
290 300 310 320
pF1KE6 DNADD--------------------KAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVG
::. . ...:.:.::: : :.: .: . . .:
CCDS46 FPADSDRHCNGFPAGAEVTNRPSPWRPLVLLIPLRLGLTDINEAYVETLKHCFMMPQSLG
200 210 220 230 240 250
330 340 350 360 370
pF1KE6 IIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF-PLETFHCPSPK-KMSFRKMD
.:::::....:: :. . :::.::: : :. . : : :.::: : .::. ..:
CCDS46 VIGGKPNSAHYFIGYVGEELIYLDPHTTQPAVEPTDGCFIPDESFHCQHPPCRMSIAELD
260 270 280 290 300 310
380 390 400 410 420 430
pF1KE6 PSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN---GHSRDYDFTSTTTNEE
:: ..::.:.. .::. ... :. ... :.: .:. .: : . . .
CCDS46 PSIAVGFFCKTEDDFNDWCQQVKKLSLLGGA--LPMFELVELQPSHLACPDVLNLSLDSS
320 330 340 350 360 370
440 450
pF1KE6 DLFSEDEKKQLKRF---STEEFVLL
:. ..:.:: :.: .:
CCDS46 DV------ERLERFFDSEDEDFEILSL
380 390
458 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 12:57:56 2016 done: Tue Nov 8 12:57:56 2016
Total Scan time: 1.870 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]