FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6406, 458 aa 1>>>pF1KE6406 458 - 458 aa - 458 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1010+/-0.000968; mu= 18.1935+/- 0.058 mean_var=60.2970+/-12.045, 0's: 0 Z-trim(103.0): 26 B-trim: 16 in 1/51 Lambda= 0.165168 statistics sampled from 7204 (7215) to 7204 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.602), E-opt: 0.2 (0.222), width: 16 Scan time: 1.870 The best scores are: opt bits E(32554) CCDS623.1 ATG4C gene_id:84938|Hs108|chr1 ( 458) 3101 747.8 5.2e-216 CCDS12241.1 ATG4D gene_id:84971|Hs108|chr19 ( 474) 941 233.1 4.7e-61 CCDS14538.1 ATG4A gene_id:115201|Hs108|chrX ( 398) 349 92.0 1.2e-18 CCDS46565.1 ATG4B gene_id:23192|Hs108|chr2 ( 380) 245 67.2 3.2e-11 CCDS46564.1 ATG4B gene_id:23192|Hs108|chr2 ( 393) 245 67.2 3.3e-11 >>CCDS623.1 ATG4C gene_id:84938|Hs108|chr1 (458 aa) initn: 3101 init1: 3101 opt: 3101 Z-score: 3991.6 bits: 747.8 E(32554): 5.2e-216 Smith-Waterman score: 3101; 100.0% identity (100.0% similar) in 458 aa overlap (1-458:1-458) 10 20 30 40 50 60 pF1KE6 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFSRNSPVLLLGKCYHFKYEDEDKTLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFSRNSPVLLLGKCYHFKYEDEDKTLP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 AESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTDCGWGCTLRTGQMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 AESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTDCGWGCTLRTGQMLL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 AQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLSGEREFKTPTISLKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 AQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLSGEREFKTPTISLKE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 TIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGKKAGDWYGPAVVAHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 TIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGKKAGDWYGPAVVAHI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 LRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQSASMTSDNADDKAVIILVPVRLGGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 LRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQSASMTSDNADDKAVIILVPVRLGGE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 RTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 RTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 PLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 PLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN 370 380 390 400 410 420 430 440 450 pF1KE6 GHSRDYDFTSTTTNEEDLFSEDEKKQLKRFSTEEFVLL :::::::::::::::::::::::::::::::::::::: CCDS62 GHSRDYDFTSTTTNEEDLFSEDEKKQLKRFSTEEFVLL 430 440 450 >>CCDS12241.1 ATG4D gene_id:84971|Hs108|chr19 (474 aa) initn: 1302 init1: 530 opt: 941 Z-score: 1209.7 bits: 233.1 E(32554): 4.7e-61 Smith-Waterman score: 1371; 46.2% identity (70.5% similar) in 457 aa overlap (7-458:60-474) 10 20 30 pF1KE6 MEATGTDEVDKLKTKFISAWNNMKYSWVLKTKTYFS :::::.:.::..::::.::.::.:..: :: CCDS12 GPRGPDPNGLGPSGASGPALGSPGAGPSEPDEVDKFKAKFLTAWNNVKYGWVVKSRTSFS 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE6 RNSPVLLLGKCYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFP . : . : :. :.:. : :....:..::.::.:::::..:: CCDS12 KISSIHLCGRRYRFEGE--------------------GDIQRFQRDFVSRLWLTYRRDFP 90 100 110 120 100 110 120 130 140 150 pF1KE6 QIEGSALTTDCGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKK . :. ::.:::::: ::.:::.:::::.:::: : ::: ..... . CCDS12 PLPGGCLTSDCGWGCMLRSGQMMLAQGLLLHFLPRDWTWAEGMGLGPPE----------- 130 140 150 160 170 160 170 180 190 200 210 pF1KE6 FTASFEASLSGEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQ . .: : : .. :. . .. . :...: ::.:.:::.: : : ::::. CCDS12 ----LSGSASPSR-YHGPARWMPPRWAQGAP--ELEQERRHRQIVSWFADHPRAPFGLHR 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE6 LIEYGKKSGKKAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDVIDKQS :.: :..:::::::::::..:::::::::: :. ...::.::::::..:: . CCDS12 LVELGQSSGKKAGDWYGPSLVAHILRKAVESCS--DVTRLVVYVSQDCTVYKADVA--RL 240 250 260 270 280 280 290 300 310 320 330 pF1KE6 ASMTSDNADDKAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVGIIGGKPKQSYYFAGF .. . .:. :.:.:::::::::: : :. :: .: : :.::.::::..: :: :. CCDS12 VARPDPTAEWKSVVILVPVRLGGETLNPVYVPCVKELLRCELCLGIMGGKPRHSLYFIGY 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE6 QDDSLIYMDPHYCQSFVDVSIKDFPLETFHCPSPKKMSFRKMDPSCTIGFYCRNVQDFKR ::: :.:.:::::: :::: :::::.::: ::.::.: :::::::.::: . ..:. CCDS12 QDDFLLYLDPHYCQPTVDVSQADFPLESFHCTSPRKMAFAKMDPSCTVGFYAGDRKEFET 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE6 ASEEITKMLKFSSK-EKYPLFTFVNGHSRDYDFTSTTTN--EEDLFSEDEKKQL--KRFS :.:..:. :: :.::.::...::..:... . .. . : . : :: : CCDS12 LCSELTRVLSSSSATERYPMFTLAEGHAQDHSLDDLCSQLAQPTLRLPRTGRLLRAKRPS 410 420 430 440 450 460 pF1KE6 TEEFVLL .:.::.: CCDS12 SEDFVFL 470 >>CCDS14538.1 ATG4A gene_id:115201|Hs108|chrX (398 aa) initn: 632 init1: 215 opt: 349 Z-score: 448.4 bits: 92.0 E(32554): 1.2e-18 Smith-Waterman score: 585; 29.1% identity (54.7% similar) in 422 aa overlap (68-454:34-391) 40 50 60 70 80 90 pF1KE6 NSPVLLLGKCYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQ ..:.. . .. .:. .:.:.:::..: CCDS14 VLSKYEDQITIFTDYLEEYPDTDELVWILGKQHLLKTEKSKLLSDISARLWFTYRRKFSP 10 20 30 40 50 60 100 110 120 130 140 150 pF1KE6 IEGSALTTDCGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKF : :.. ..: :::: :: :::.:::.:: . ::: :.: CCDS14 IGGTGPSSDAGWGCMLRCGQMMLAQALICRHLGRDWSW---------------------- 70 80 90 100 160 170 180 190 200 210 pF1KE6 TASFEASLSGEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQL :.. . : :: ...:.. : : ...::. CCDS14 ----------EKQKEQP----KE----------------YQRILQCFLDRKDCCYSIHQM 110 120 130 220 230 240 250 260 270 pF1KE6 IEYGKKSGKKAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDVI----- ..: ::. :.:.:: .::..:.: : . .....::..: :: :. CCDS14 AQMGVGEGKSIGEWFGPNTVAQVLKKL---ALFDEWNSLAVYVSMDNTVVIEDIKKMCRV 140 150 160 170 180 280 290 300 310 pF1KE6 ---------DKQSASMTSDNADD---------KAVIILVPVRLGGERTNTDYLEFVKGIL :. :.:..: . : ....::.::: .. : :.. : . CCDS14 LPLSADTAGDRPPDSLTASNQSKGTSAYCSAWKPLLLIVPLRLGINQINPVYVDAFKECF 190 200 210 220 230 240 320 330 340 350 360 pF1KE6 SLEYCVGIIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDV----SIKDFPLETFHC-PS .. .: .::::...::: :: : ::..::: :.:::. ...: .:::: : CCDS14 KMPQSLGALGGKPNNAYYFIGFLGDELIFLDPHTTQTFVDTEENGTVND---QTFHCLQS 250 260 270 280 290 300 370 380 390 400 410 420 pF1KE6 PKKMSFRKMDPSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVNGHSRDYD-F :..:.. ..::: ..::.:.. .:: . : . ::. .: .:. : . : CCDS14 PQRMNILNLDPSVALGFFCKEEKDFDNWCSLVQKEI---LKENLRMFELVQKHPSHWPPF 310 320 330 340 350 360 430 440 450 pF1KE6 TS------TTTNEEDLFSEDEKKQLKRFSTEEFVLL . :::. : . : .::..:. :: CCDS14 VPPAKPEVTTTGAEFI---DSTEQLEEFDLEEDFEILSV 370 380 390 >>CCDS46565.1 ATG4B gene_id:23192|Hs108|chr2 (380 aa) initn: 597 init1: 234 opt: 245 Z-score: 314.8 bits: 67.2 E(32554): 3.2e-11 Smith-Waterman score: 538; 29.2% identity (54.1% similar) in 370 aa overlap (77-419:40-352) 50 60 70 80 90 100 pF1KE6 CYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTD .:. .: ::.:.:::..:: : :.. :.: CCDS46 TLRFAEFEDFPETSEPVWILGRKYSIFTEKDEILSDVASRLWFTYRKNFPAIGGTGPTSD 10 20 30 40 50 60 110 120 130 140 150 160 pF1KE6 CGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLS :::: :: :::..::.:. . ::: : : : .: CCDS46 TGWGCMLRCGQMIFAQALVCRHLGRDWRW-----------------TQRK---------- 70 80 90 100 170 180 190 200 210 220 pF1KE6 GEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGK . : . : .... : : . ...::. ..: :: CCDS46 -----RQP-------------------DSYF-SVLNAFIDRKDSYYSIHQIAQMGVGEGK 110 120 130 230 240 250 260 270 280 pF1KE6 KAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDV--IDKQS---ASMTS . :.:::: .::..:.: : .......:.: :: .. . . : :. :. CCDS46 SIGQWYGPNTVAQVLKKL---AVFDTWSSLAVHIAMDNTVVMEEIRRLCRTSVPCAGATA 140 150 160 170 180 190 290 300 310 320 pF1KE6 DNADD--------------------KAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVG ::. . ...:.:.::: : :.: .: . . .: CCDS46 FPADSDRHCNGFPAGAEVTNRPSPWRPLVLLIPLRLGLTDINEAYVETLKHCFMMPQSLG 200 210 220 230 240 250 330 340 350 360 370 pF1KE6 IIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF-PLETFHCPSPK-KMSFRKMD .:::::....:: :. . :::.::: : :. . : : :.::: : .::. ..: CCDS46 VIGGKPNSAHYFIGYVGEELIYLDPHTTQPAVEPTDGCFIPDESFHCQHPPCRMSIAELD 260 270 280 290 300 310 380 390 400 410 420 430 pF1KE6 PSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVNGHSRDYDFTSTTTNEEDLF :: ..::.:.. .::. ... :. ... :.: .: CCDS46 PSIAVGFFCKTEDDFNDWCQQVKKLSLLGGA--LPMFELVELQPSHLACPDVLNLSLGES 320 330 340 350 360 370 440 450 pF1KE6 SEDEKKQLKRFSTEEFVLL CCDS46 CQVQILLM 380 >>CCDS46564.1 ATG4B gene_id:23192|Hs108|chr2 (393 aa) initn: 597 init1: 234 opt: 245 Z-score: 314.6 bits: 67.2 E(32554): 3.3e-11 Smith-Waterman score: 539; 28.2% identity (53.0% similar) in 415 aa overlap (77-458:40-391) 50 60 70 80 90 100 pF1KE6 CYHFKYEDEDKTLPAESGCTIEDHVIAGNVEEFRKDFISRIWLTYREEFPQIEGSALTTD .:. .: ::.:.:::..:: : :.. :.: CCDS46 TLRFAEFEDFPETSEPVWILGRKYSIFTEKDEILSDVASRLWFTYRKNFPAIGGTGPTSD 10 20 30 40 50 60 110 120 130 140 150 160 pF1KE6 CGWGCTLRTGQMLLAQGLILHFLGRAWTWPDALNIENSDSESWTSHTVKKFTASFEASLS :::: :: :::..::.:. . ::: : : : .: CCDS46 TGWGCMLRCGQMIFAQALVCRHLGRDWRW-----------------TQRK---------- 70 80 90 100 170 180 190 200 210 220 pF1KE6 GEREFKTPTISLKETIGKYSDDHEMRNEVYHRKIISWFGDSPLALFGLHQLIEYGKKSGK . : . : .... : : . ...::. ..: :: CCDS46 -----RQP-------------------DSYF-SVLNAFIDRKDSYYSIHQIAQMGVGEGK 110 120 130 230 240 250 260 270 280 pF1KE6 KAGDWYGPAVVAHILRKAVEEARHPDLQGITIYVAQDCTVYNSDV--IDKQS---ASMTS . :.:::: .::..:.: : .......:.: :: .. . . : :. :. CCDS46 SIGQWYGPNTVAQVLKKL---AVFDTWSSLAVHIAMDNTVVMEEIRRLCRTSVPCAGATA 140 150 160 170 180 190 290 300 310 320 pF1KE6 DNADD--------------------KAVIILVPVRLGGERTNTDYLEFVKGILSLEYCVG ::. . ...:.:.::: : :.: .: . . .: CCDS46 FPADSDRHCNGFPAGAEVTNRPSPWRPLVLLIPLRLGLTDINEAYVETLKHCFMMPQSLG 200 210 220 230 240 250 330 340 350 360 370 pF1KE6 IIGGKPKQSYYFAGFQDDSLIYMDPHYCQSFVDVSIKDF-PLETFHCPSPK-KMSFRKMD .:::::....:: :. . :::.::: : :. . : : :.::: : .::. ..: CCDS46 VIGGKPNSAHYFIGYVGEELIYLDPHTTQPAVEPTDGCFIPDESFHCQHPPCRMSIAELD 260 270 280 290 300 310 380 390 400 410 420 430 pF1KE6 PSCTIGFYCRNVQDFKRASEEITKMLKFSSKEKYPLFTFVN---GHSRDYDFTSTTTNEE :: ..::.:.. .::. ... :. ... :.: .:. .: : . . . CCDS46 PSIAVGFFCKTEDDFNDWCQQVKKLSLLGGA--LPMFELVELQPSHLACPDVLNLSLDSS 320 330 340 350 360 370 440 450 pF1KE6 DLFSEDEKKQLKRF---STEEFVLL :. ..:.:: :.: .: CCDS46 DV------ERLERFFDSEDEDFEILSL 380 390 458 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:57:56 2016 done: Tue Nov 8 12:57:56 2016 Total Scan time: 1.870 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]