FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2522, 924 aa 1>>>pF1KE2522 924 - 924 aa - 924 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.8802+/-0.00107; mu= -8.1387+/- 0.064 mean_var=381.4343+/-77.154, 0's: 0 Z-trim(115.7): 8 B-trim: 0 in 0/52 Lambda= 0.065670 statistics sampled from 16241 (16248) to 16241 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.784), E-opt: 0.2 (0.499), width: 16 Scan time: 5.090 The best scores are: opt bits E(32554) CCDS83242.1 ATG9B gene_id:285973|Hs108|chr7 ( 924) 6384 619.5 9.3e-177 CCDS42820.1 ATG9A gene_id:79065|Hs108|chr2 ( 839) 2111 214.6 6.4e-55 >>CCDS83242.1 ATG9B gene_id:285973|Hs108|chr7 (924 aa) initn: 6384 init1: 6384 opt: 6384 Z-score: 3286.8 bits: 619.5 E(32554): 9.3e-177 Smith-Waterman score: 6384; 100.0% identity (100.0% similar) in 924 aa overlap (1-924:1-924) 10 20 30 40 50 60 pF1KE2 MVSRMGWGGRRRRLGRWGDLGPGSVPLLPMPLPPPPPPSCRGPGGGRISIFSLSPAPHTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MVSRMGWGGRRRRLGRWGDLGPGSVPLLPMPLPPPPPPSCRGPGGGRISIFSLSPAPHTR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 SSPSSFSPPTAGPPCSVLQGTGASQSCHSALPIPATPPTQAQPAMTPASASPSWGSHSTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 SSPSSFSPPTAGPPCSVLQGTGASQSCHSALPIPATPPTQAQPAMTPASASPSWGSHSTP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PLAPATPTPSQQCPQDSPGLRVGPLIPEQDYERLEDCDPEGSQDSPIHGEEQQPLLHVPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PLAPATPTPSQQCPQDSPGLRVGPLIPEQDYERLEDCDPEGSQDSPIHGEEQQPLLHVPE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GLRGSWHHIQNLDSFFTKIYSYHQRNGFACILLEDVFQLGQFIFIVTFTTFLLRCVDYNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 GLRGSWHHIQNLDSFFTKIYSYHQRNGFACILLEDVFQLGQFIFIVTFTTFLLRCVDYNV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 LFANQPSNHTRPGPFHSKVTLSDAILPSAQCAERIRSSPLLVLLLVLAAGFWLVQLLRSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LFANQPSNHTRPGPFHSKVTLSDAILPSAQCAERIRSSPLLVLLLVLAAGFWLVQLLRSV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 CNLFSYWDIQVFYREALHIPPEELSSVPWAEVQSRLLALQRSGGLCVQPRPLTELDIHHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 CNLFSYWDIQVFYREALHIPPEELSSVPWAEVQSRLLALQRSGGLCVQPRPLTELDIHHR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 ILRYTNYQVALANKGLLPARCPLPWGGSAAFLSRGLALNVDLLLFRGPFSLFRGGWELPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 ILRYTNYQVALANKGLLPARCPLPWGGSAAFLSRGLALNVDLLLFRGPFSLFRGGWELPH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 AYKRSDQRGALAARWGRTVLLLAALNLALSPLVLAWQVLHVFYSHVELLRREPGALGARG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 AYKRSDQRGALAARWGRTVLLLAALNLALSPLVLAWQVLHVFYSHVELLRREPGALGARG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 WSRLARLQLRHFNELPHELRARLARAYRPAAAFLRTAAPPAPLRTLLARQLVFFAGALFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 WSRLARLQLRHFNELPHELRARLARAYRPAAAFLRTAAPPAPLRTLLARQLVFFAGALFA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 ALLVLTVYDEDVLAVEHVLTAMTALGVTATVARSFIPEEQCQGRAPQLLLQTALAHMHYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 ALLVLTVYDEDVLAVEHVLTAMTALGVTATVARSFIPEEQCQGRAPQLLLQTALAHMHYL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 PEEPGPGGRDRAYRQMAQLLQYRAVSLLEELLSPLLTPLFLLFWFRPRALEIIDFFHHFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PEEPGPGGRDRAYRQMAQLLQYRAVSLLEELLSPLLTPLFLLFWFRPRALEIIDFFHHFT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 VDVAGVGDICSFALMDVKRHGHPQWLSAGQTEASLSQRAEDGKTELSLMRFSLAHPLWRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 VDVAGVGDICSFALMDVKRHGHPQWLSAGQTEASLSQRAEDGKTELSLMRFSLAHPLWRP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 PGHSSKFLGHLWGRVQQDAAAWGATSARGPSTPGVLSNCTSPLPEAFLANLFVHPLLPPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 PGHSSKFLGHLWGRVQQDAAAWGATSARGPSTPGVLSNCTSPLPEAFLANLFVHPLLPPR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 DLSPTAPCPAAATASLLASISRIAQDPSSVSPGGTGGQKLAQLPELASAEMSLHVIYLHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 DLSPTAPCPAAATASLLASISRIAQDPSSVSPGGTGGQKLAQLPELASAEMSLHVIYLHQ 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 LHQQQQQQEPWGEAAASILSRPCSSPSQPPSPDEEKPSWSSDGSSPASSPRQQWGTQKAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LHQQQQQQEPWGEAAASILSRPCSSPSQPPSPDEEKPSWSSDGSSPASSPRQQWGTQKAR 850 860 870 880 890 900 910 920 pF1KE2 NLFPGGFQVTTDTQKEPDRASCTD :::::::::::::::::::::::: CCDS83 NLFPGGFQVTTDTQKEPDRASCTD 910 920 >>CCDS42820.1 ATG9A gene_id:79065|Hs108|chr2 (839 aa) initn: 1372 init1: 1197 opt: 2111 Z-score: 1099.5 bits: 214.6 E(32554): 6.4e-55 Smith-Waterman score: 2243; 47.5% identity (70.1% similar) in 798 aa overlap (148-908:5-782) 120 130 140 150 160 170 pF1KE2 STPPLAPATPTPSQQCPQDSPGLRVGPLIPEQDYERLEDCDPEGSQDSPIHGEEQQPLLH . .:.::: . .::: :::. :.: CCDS42 MAQFDTEYQRLE----ASYSDSP-PGEEDL-LVH 10 20 180 190 200 210 220 230 pF1KE2 VPEGLRGSWHHIQNLDSFFTKIYSYHQRNGFACILLEDVFQLGQFIFIVTFTTFLLRCVD : :: .. ::::.::: ::...:. ::.:::.:.:. ..:.: ::.:.:.:::::. ::: CCDS42 VAEGSKSPWHHIENLDLFFSRVYNLHQKNGFTCMLIGEIFELMQFLFVVAFTTFLVSCVD 30 40 50 60 70 80 240 250 260 270 280 290 pF1KE2 YNVLFANQPSNHTRPGPFHSKVTLSDAILPSAQCAERIRSSPLLVLLLVLAAGFWLVQLL :..::::. ::. :::: ::.::. :. ::. . :. .::.:. ::. .:. CCDS42 YDILFANKMVNHSLHPTEPVKVTLPDAFLPAQVCSARIQENGSLITILVIAGVFWIHRLI 90 100 110 120 130 140 300 310 320 330 340 350 pF1KE2 RSVCNLFSYWDIQVFYREALHIPPEELSSVPWAEVQSRLLALQRSGGLCVQPRPLTELDI . . :. ::.:. :: .::.:: : : :::.:.. :. .:.. : :::::: CCDS42 KFIYNICCYWEIHSFYLHALRIPMSALPYCTWQEVQARIVQTQKEHQICIHKRELTELDI 150 160 170 180 190 200 360 370 380 390 400 410 pF1KE2 HHRILRYTNYQVALANKGLLPARCPLPWGGSAAFLSRGLALNVDLLLFRGPFSLFRGGWE .:::::. ::.:::.::.::: : :: : :.:..::: : .:.:: :: ::: . : CCDS42 YHRILRFQNYMVALVNKSLLPLRFRLPGLGEAVFFTRGLKYNFELILFWGPGSLFLNEWS 210 220 230 240 250 260 420 430 440 450 460 470 pF1KE2 LPHAYKRSDQRGALAARWGRTVLLLAALNLALSPLVLAWQVLHVFYSHVELLRREPGALG : :::. :: :: : . .: .. :. : ::.: ::.:..:.:..:.:.::::::: CCDS42 LKAEYKRGGQRLELAQRLSNRILWIGIANFLLCPLILIWQILYAFFSYAEVLKREPGALG 270 280 290 300 310 320 480 490 500 510 520 530 pF1KE2 ARGWSRLARLQLRHFNELPHELRARLARAYRPAAAFLRTAAPPAPLRTLLARQLVFFAGA :: :: .: ::::::: :::..:: :.:.::. .. .:: ::::.. .::::. CCDS42 ARCWSLYGRCYLRHFNELEHELQSRLNRGYKPASKYMNCFL--SPLLTLLAKNGAFFAGS 330 340 350 360 370 380 540 550 560 570 580 590 pF1KE2 LFAALLVLTVYDEDVLAVEHVLTAMTALGVTATVARSFIPEEQCQGRAPQLLLQTALAHM ..:.:..::.:::::::::::::..: ::::.:: :::::. : . :. ::.. :::. CCDS42 ILAVLIALTIYDEDVLAVEHVLTTVTLLGVTVTVCRSFIPD-QHMVFCPEQLLRVILAHI 390 400 410 420 430 440 600 610 620 630 640 650 pF1KE2 HYLPEE-PGPGGRDRAYRQMAQLLQYRAVSLLEELLSPLLTPLFLLFWFRPRALEIIDFF ::.:.. : . :... ..:::.::.:: .:::::::..:::.:.: .::::::::::: CCDS42 HYMPDHWQGNAHRSQTRDEFAQLFQYKAVFILEELLSPIVTPLILIFCLRPRALEIIDFF 450 460 470 480 490 500 660 670 680 690 700 710 pF1KE2 HHFTVDVAGVGDICSFALMDVKRHGHPQWLSAGQTEASLSQRAEDGKTELSLMRFSLAHP ..:::.:.:::: :::: :::..:::::::::::::::. :.:::::::::::.:....: CCDS42 RNFTVEVVGVGDTCSFAQMDVRQHGHPQWLSAGQTEASVYQQAEDGKTELSLMHFAITNP 510 520 530 540 550 560 720 730 740 750 760 770 pF1KE2 LWRPPGHSSKFLGHLWGRVQQDAAAWGATSARGPSTP------GVLSNCTSPLPEAFLAN :.:: .:. ::: : .::.:.:: :. :.: : .. : . : ...:: CCDS42 GWQPPRESTAFLGFLKEQVQRDGAA--ASLAQGGLLPENALFTSIQSLQSESEPLSLIAN 570 580 590 600 610 620 780 790 800 pF1KE2 LFVH------PLLPPRDL----------------SPTAP--CPAAATASLLASISRIAQD . . :: :::: :: : :.. . : ... . :. CCDS42 VVAGSSCRGPPL--PRDLQGSRHRAEVASALRSFSPLQPGQAPTGRAHSTMTGSGVDART 630 640 650 660 670 680 810 820 830 840 850 860 pF1KE2 PSSVSPGGTGGQKLAQLPELASAEMSLHVIYLHQLHQQQQQQEPWGEAAASILSRPCSSP :: : : . : : ::.:::::..:.::::.:: : :: . : :. CCDS42 ASSGSSVWEGQLQSLVLSEYASTEMSLHALYMHQLHKQQAQAEP----ERHVWHRRESDE 690 700 710 720 730 870 880 890 900 910 920 pF1KE2 SQPPSPDE-----EKP-SWSSDGSSPASSPRQQWGTQKARNLFPGGFQVTTDTQKEPDRA : .::: . : : ..: : ..:: :. .. : :::: CCDS42 SGESAPDEGGEGARAPQSIPRSASYPCAAPRP--GAPETTALH-GGFQRRYGGITDPGTV 740 750 760 770 780 790 pF1KE2 SCTD CCDS42 PRVPSHFSRLPLGGWAEDGQSASRHPEPVPEEGSEDELPPQVHKV 800 810 820 830 924 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:20:51 2016 done: Tue Nov 8 03:20:51 2016 Total Scan time: 5.090 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]