FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9628, 882 aa 1>>>pF1KE9628 882 - 882 aa - 882 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8519+/-0.00105; mu= 16.1490+/- 0.063 mean_var=140.4763+/-27.654, 0's: 0 Z-trim(108.6): 16 B-trim: 0 in 0/52 Lambda= 0.108211 statistics sampled from 10288 (10301) to 10288 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.316), width: 16 Scan time: 4.350 The best scores are: opt bits E(32554) CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 5913 935.4 0 CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 2902 465.3 2.1e-130 CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 1791 291.9 3.7e-78 CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 1454 239.3 2.3e-62 CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1454 239.3 2.5e-62 CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 432 79.7 2.5e-14 CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 412 76.5 1.7e-13 CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 412 76.6 2.2e-13 CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 397 74.2 1e-12 CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 397 74.3 1.1e-12 >>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa) initn: 5913 init1: 5913 opt: 5913 Z-score: 4995.1 bits: 935.4 E(32554): 0 Smith-Waterman score: 5913; 100.0% identity (100.0% similar) in 882 aa overlap (1-882:1-882) 10 20 30 40 50 60 pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQDMKHVKDSKTGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQDMKHVKDSKTGS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 EGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 LLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQ 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 VGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 TSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 YRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 YRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 LAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 RRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITM 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 KPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 KCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIV 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 NRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVI 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 VYRDGVGDGQLQALLDHEAKKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VYRDGVGDGQLQALLDHEAKKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNP 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 PPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMY 790 800 810 820 830 840 850 860 870 880 pF1KE9 YNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL :::::::::::::::::::::::::::::::::::::::::: CCDS33 YNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL 850 860 870 880 >>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa) initn: 2904 init1: 783 opt: 2902 Z-score: 2454.8 bits: 465.3 E(32554): 2.1e-130 Smith-Waterman score: 2945; 50.5% identity (76.2% similar) in 889 aa overlap (1-882:1-861) 10 20 30 40 50 60 pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP : ::::.::::::: .:. : ::...:.: .: :.: :. : CCDS92 MTGRARARARGRARGQETAQLV--------GSTASQQPGYIQPRPQP----PPAEGELFG 10 20 30 40 70 80 90 100 110 pF1KE9 RA-ARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV---FQDLVVNTRQDMKHVKDS :. :: ::: :.:::.. ::.. : :: :: :.:: :::::.. :::.: CCDS92 RGRQRGTAGGTAKSQGLQ---ISAGFQELSLAER--GGRRRDFHDLGVNTRQNLDHVKES 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE9 KTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIF :::: : .:.: .::::. :::::. :.:..::.: .: ::. :: ::. .:. : : CCDS92 KTGSSGIIVRLSTNHFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAF 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE9 DGNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLL ::. :.: . :... .: .: :.. . :.::. ...:: :::: ::..:::.::: .:.. CCDS92 DGTILFLPKRLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIM 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE9 DFEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYD ...:.:::::. . :.. : : :: :..::.::::::: ::.:::::.:: ::. : CCDS92 NLQQIGRNYYNPNDPIDIPSH--RLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLD 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE9 FIKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKIT :. :.. ...:.:...::: .::::::::::::::::: :::..::.:.:::... CCDS92 FMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVS 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE9 YIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYS ...:::.:... .: :::.:::: . ..: :: : .:::.::..:::::.. .:.. CCDS92 FLEYYRKQYNQEITDLKQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFN 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE9 IVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNAN ..:.:: ::::.:..:.. . ..:. .. : .:.. :. : :.::.:.:: ::.:.. . CCDS92 VMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEK 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE9 IVQGRRMVKANSQ-GDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAP : :: . : : .:::.: : ::... :: .::..:.: ... : :: .: .:: CCDS92 IHQGGKTFDYNPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPA 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE9 MGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIK ::. :. : ::::: ...:. .:.. . :. :.:.: .. : .::.:: CCDS92 MGMQMRKAIMIEVDDRTEAYLRVLQQKVTADTQI---------VVCLLSSNRKDKYDAIK 530 540 550 560 570 600 610 620 630 640 650 pF1KE9 RYLCTKCPIPSQCVVKKTLEKVQA-RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGID .:::: :: :::::: .:: : :. .:.:::: :::::::: ::.:. .. .:.:::: CCDS92 KYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGID 580 590 600 610 620 630 660 670 680 690 700 710 pF1KE9 CFHDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESS :.::.. ..:::::::: : .:.:.:.:..: :.::: :..::.::: .: . . CCDS92 CYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEY 640 650 660 670 680 690 720 730 740 750 760 770 pF1KE9 MPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKH :: .::::::::::::..:...:. .. ::.:. . : :. ::::::.::::: . CCDS92 MPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQS 700 710 720 730 740 750 780 790 800 810 820 830 pF1KE9 GSNFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLT :. .::: ::::::::.:: ::::::::::.:..:.:.:::::::::. ::.:: .:::: CCDS92 GGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLT 760 770 780 790 800 810 840 850 860 870 880 pF1KE9 YCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL : :::.::: ::.:::::::.::::::.:::::::.::: :::.::.:: CCDS92 YKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL 820 830 840 850 860 >>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa) initn: 1322 init1: 809 opt: 1791 Z-score: 1516.7 bits: 291.9 E(32554): 3.7e-78 Smith-Waterman score: 1799; 34.7% identity (66.3% similar) in 833 aa overlap (65-882:157-973) 40 50 60 70 80 pF1KE9 TQEPPQLQSTPRPLQEEVPVVRPLQPRAARGGAGGGAQSQGVKEP----GPEAG---LHT : :.:: . . : : : : : . CCDS60 AAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSS 130 140 150 160 170 180 90 100 110 120 130 140 pF1KE9 AP-LQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYN : : . . . . ::..... :.. : ::.:: .: : .. . . : :.:. CCDS60 PPALPQSPLHSPDRPLVLTVEHKEKELI-VKQGSKGTPQSLGLNLVKIQCHNEAV-YQYH 190 200 210 220 230 240 150 160 170 180 190 200 pF1KE9 VDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNSLLLSRPLKERRVEWLSTTK--DKNIV : ..:..: ..: .: .:. :. :::. : : :.: ..: :.. . :. . CCDS60 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYL--PVKLQQVLELKSQRKTDSAEI 250 260 270 280 290 300 210 220 230 240 250 260 pF1KE9 KITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRHGTSLEIW .: ....: : : : :. .::..:::..::::.. ::::.: .:. : .: :.:: CCDS60 SIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQH--RLQIW 310 320 330 340 350 360 270 280 290 300 310 320 pF1KE9 LGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKRTSAQAQTGNIREEVTNKLIGSIVL ::..:. . .... : ::::::..: . . : .. : . ....: :. :.:.::. CCDS60 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKE-HFQDECTKLLVGNIVI 370 380 390 400 410 330 340 350 360 370 380 pF1KE9 TKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDYYRQQHKEIVTVKKQPLLVSQGRWK :.:::.:::.::.::...:.:.:. :::..::...:: ... : . ::::. . . CCDS60 TRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSER 420 430 440 450 460 470 390 400 410 420 430 440 pF1KE9 KGLTGTQ-REPILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTL . : . :::.:.: :::. ... ::. .:.::.. :::...: .:. ... . CCDS60 QDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRI 480 490 500 510 520 530 450 460 470 480 490 500 pF1KE9 QDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQGRRMVKANSQGDWSREIRELPLLN :. . . :. : :... . .. :::: : .... .: .:. . : . CCDS60 AKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSIL 540 550 560 570 580 590 510 520 530 540 550 560 pF1KE9 AMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITMKPAEMIEVDGD-ANSYIDTLRKY ..:.: : ..: . . .: : . :.....:.:. :.: .:. : ..:. :... CCDS60 TIPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQST 600 610 620 630 640 650 570 580 590 600 610 pF1KE9 TRPTLQMGMSCLLVFKVICIL--PNDDKRRYDSIKRYLCTKCPIPSQCVVKKTL-EKVQA .. : :.::. : :: : .::. :.. :.::: : .:. . .. CCDS60 LGAEGKIQM-------VVCIIMGPRDDL--YGAIKKLCCVQSPVPSQVVNVRTIGQPTRL 660 670 680 690 700 710 620 630 640 650 660 670 pF1KE9 RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIVNRQKSIAGFVASTNAELTK :... :: :.:::.:: :: :. ... : .:.: .:: ..:..::::: : ::: CCDS60 RSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTK 720 730 740 750 760 770 680 690 700 710 720 730 pF1KE9 WYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEA :::. :.: .:.: :..:: ..: . . . .:....::::::.::::... ..: CCDS60 WYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEI 780 790 800 810 820 830 740 750 760 770 780 790 pF1KE9 KKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNPPPGTVIDVELTRNEWYDFF ... .... . .. .::.:.:.: ..: .:: .: ::::.: .: :: ::. CCDS60 PQLQKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFY 840 850 860 870 880 890 800 810 820 830 840 850 pF1KE9 IVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKL .... :..: :::: . .: .:::: .::::. :::::.: :: :::::::.::::: CCDS60 LLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKL 900 910 920 930 940 950 860 870 880 pF1KE9 AYLVGQSIHQEPNRSLSTRLFYL :.: :. .:.:: .: ::.: CCDS60 AFLSGHILHHEPAIQLCENLFFL 960 970 >>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa) initn: 1432 init1: 561 opt: 1454 Z-score: 1233.1 bits: 239.3 E(32554): 2.3e-62 Smith-Waterman score: 2193; 39.5% identity (69.7% similar) in 887 aa overlap (1-882:1-852) 10 20 30 40 50 60 pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP : ::::..::: : :.: ::: : ..:..: : . .. . CCDS31 MSGRARVKARGIA--------------RSP-SAT--EVGRIQASPLPRSVDLSN----NE 10 20 30 70 80 90 100 110 pF1KE9 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV--FQDLVVNTRQDMKHVKDSKT .. .: : .. . . : .: . ..:: . . :.:: . ::. . ::.. :: CCDS31 ASSSNGFLGTSRISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKT 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE9 GSEGTVVQLLANHFRVISRPQ-WVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFD :: : :.:..: : .. :: : :.:.: : ::. . :: :: .: . .. . :: CCDS31 GSSGIPVKLVTNLFN-LDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFD 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE9 GNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLD : :.::. :.:. .: : :. . .:.:. ...:: .:: :.. .::.::. .: :. CCDS31 GAILFLSQKLEEKVTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE9 FEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDF . :.:::.:. .. ... .: :: : :.. :: .: .. . ::::.:.:: ::. .: CCDS31 MYQIGRNFYNPSEPMEIPQHKLSL--WPGFAISVSYFERKLLFSADVSYKVLRNETVLEF 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE9 IKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITY . .. . . . ..::: ::::.:::.:: .:::::. .: ::.: ::..::: CCDS31 MTALCQRTGLSCFTQTCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITY 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE9 IDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSI .:::.::. :. .::.::: . :.. ... . :::.:: .:::::. .:... CCDS31 VDYYKQQYDITVSDLNQPMLVSLLKKKRN-DNSEAQLAHLIPELCFLTGLTDQATSDFQL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE9 VKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANI .: .:..::::: :.. : ......: : ..: :. : :.: .. .:. ::.. . .: CCDS31 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQ-ISLTGRIVPSEKI 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE9 VQGRRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMG .. .. . : .:::..:: .:::. :..:::: : .. : :. . :. :.. :: CCDS31 LMQDHICQPVSAADWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMG 460 470 480 490 500 510 540 550 560 570 580 590 pF1KE9 ITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRY ... ..:.:. . ... ....:. : .:. :.::::...: :::::.: CCDS31 FNVDYPKIIKVQENPAAFVRAIQQYVDPDVQL---------VMCILPSNQKTYYDSIKKY 520 530 540 550 560 600 610 620 630 640 650 pF1KE9 LCTKCPIPSQCVVKKTLEKV-QARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCF : . ::.:::::. .::.: . .:.::::.::.::.:: :: :: .. : :::: CCDS31 LSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVC 570 580 590 600 610 620 660 670 680 690 700 710 pF1KE9 HDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMP .: .... ..: :::.: ..:.:.:.:..:.: ... :.. . .::. : : . ..: CCDS31 KDALSKDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLP 630 640 650 660 670 680 720 730 740 750 760 770 pF1KE9 HSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGS .:::: :::::::..:...:. .. :. .. : .. :. :::.:. ::: . . CCDS31 ARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNR 690 700 710 720 730 740 780 790 800 810 820 830 pF1KE9 NFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYC . :::: :::.: : ::::::::...:: . :::.::.:::::: ::.:: .::::. CCDS31 TVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFK 750 760 770 780 790 800 840 850 860 870 880 pF1KE9 LCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL :::.::: :::. :::::.:::::..::.::::.::. :...:::: CCDS31 LCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLFYL 810 820 830 840 850 >>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa) initn: 1216 init1: 484 opt: 1454 Z-score: 1232.6 bits: 239.3 E(32554): 2.5e-62 Smith-Waterman score: 1607; 32.9% identity (63.1% similar) in 833 aa overlap (65-882:157-937) 40 50 60 70 80 pF1KE9 TQEPPQLQSTPRPLQEEVPVVRPLQPRAARGGAGGGAQSQGVKEP----GPEAG---LHT : :.:: . . : : : : : . CCDS83 AAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSS 130 140 150 160 170 180 90 100 110 120 130 140 pF1KE9 AP-LQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYN : : . . . . ::..... :.. : ::.:: .: : .. . . : :.:. CCDS83 PPALPQSPLHSPDRPLVLTVEHKEKELI-VKQGSKGTPQSLGLNLVKIQCHNEAV-YQYH 190 200 210 220 230 240 150 160 170 180 190 200 pF1KE9 VDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNSLLLSRPLKERRVEWLSTTK--DKNIV : ..:..: ..: .: .:. :. :::. : : :.: ..: :.. . :. . CCDS83 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYL--PVKLQQVLELKSQRKTDSAEI 250 260 270 280 290 300 210 220 230 240 250 260 pF1KE9 KITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRHGTSLEIW .: ....: : : : :. .::..:::..::::.. ::::.: .:. : .: :.:: CCDS83 SIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQH--RLQIW 310 320 330 340 350 360 270 280 290 300 310 320 pF1KE9 LGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKRTSAQAQTGNIREEVTNKLIGSIVL ::..:. . .... : ::::::..: . . : .. : . ....: :. :.:.::. CCDS83 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKE-HFQDECTKLLVGNIVI 370 380 390 400 410 330 340 350 360 370 380 pF1KE9 TKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDYYRQQHKEIVTVKKQPLLVSQGRWK :.:::.:::.::.::...:.:.:. :::..::...:: ... : . ::::. . . CCDS83 TRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSER 420 430 440 450 460 470 390 400 410 420 430 440 pF1KE9 KGLTGTQ-REPILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTL . : . :::.:.: :::. ... ::. .:.::.. :::...: .:. ... . CCDS83 QDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRI 480 490 500 510 520 530 450 460 470 480 490 500 pF1KE9 QDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQGRRMVKANSQGDWSREIRELPLLN :. . . :. : :... . .. :::: : .... .: .:. . : . CCDS83 AKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSIL 540 550 560 570 580 590 510 520 530 540 550 560 pF1KE9 AMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITMKPAEMIEVDGD-ANSYIDTLRKY ..:.: : ..: . . .: : . :.....:.:. :.: .:. : ..:. :... CCDS83 TIPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQST 600 610 620 630 640 650 570 580 590 600 610 pF1KE9 TRPTLQMGMSCLLVFKVICIL--PNDDKRRYDSIKRYLCTKCPIPSQCVVKKTL-EKVQA .. : :.::. : :: : .::. :.. :.::: : .:. . .. CCDS83 LGAEGKIQM-------VVCIIMGPRDDL--YGAIKKLCCVQSPVPSQVVNVRTIGQPTRL 660 670 680 690 700 710 620 630 640 650 660 670 pF1KE9 RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIVNRQKSIAGFVASTNAELTK :... :: :.:::.:: :: :. ... : .:.: .:: ..:..::::: : ::: CCDS83 RSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTK 720 730 740 750 760 770 680 690 700 710 720 730 pF1KE9 WYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEA :::. :.: .:.: :..:: ..: . . . .:....::::::.::::... ..: CCDS83 WYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEI 780 790 800 810 820 830 740 750 760 770 780 790 pF1KE9 KKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNPPPGTVIDVELTRNEWYDFF ... .... . .. .::.:.:.: ..: .:: .: ::::.: .: :: CCDS83 PQLQKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEW---- 840 850 860 870 880 800 810 820 830 840 850 pF1KE9 IVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKL ::. :::::.: :: :::::::.::::: CCDS83 --------------------------------LTFKLCHMYWNWPGTIRVPAPCKYAHKL 890 900 910 860 870 880 pF1KE9 AYLVGQSIHQEPNRSLSTRLFYL :.: :. .:.:: .: ::.: CCDS83 AFLSGHILHHEPAIQLCENLFFL 920 930 >>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa) initn: 345 init1: 221 opt: 432 Z-score: 370.8 bits: 79.7 E(32554): 2.5e-14 Smith-Waterman score: 665; 25.1% identity (54.8% similar) in 809 aa overlap (119-861:32-811) 90 100 110 120 130 140 pF1KE9 PLQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVD :. : ...: :: :. .. :. :.:..: CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFE-MDIPKIDIYHYELD 10 20 30 40 50 60 150 160 170 180 190 pF1KE9 YKPDIEDGNL-RTIL--LDQHRRK--FGERH-IFDGNSLLLSR---PLKERRVEWLSTT- ::. . : :. . :: . ::.:. .::: . : . :. . .:: : CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP 70 80 90 100 110 120 200 210 220 230 240 pF1KE9 ---KDKNIVKITVEFSKELT------------PTSP-DCLRYYNILFRRTFKLLDFEQVG ::. : :..... . .. :. : . .. ....:. . . . :: CCDS63 GEGKDR-IFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRH-LPSMRYTPVG 130 140 150 160 170 250 260 270 280 290 pF1KE9 RNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHK-LLRIETAYDFI--- :...: ... . : . :.:.:. :: .. : ::: . . . . .:. CCDS63 RSFFTASEGCS-NPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV 180 190 200 210 220 230 300 310 320 330 340 pF1KE9 ---KRTSAQAQ--TGNIREEVTNKLIG-SIVLTKYNN--KTYRVDDIDWKQNPEDTF--N : : . : . : . :... : .. .:. .. . ::: .. . ..:: . CCDS63 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ 240 250 260 270 280 290 350 360 370 380 390 400 pF1KE9 KSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTG . .:. . : .:....:: .. . : : . :. .: . .. : : . CCDS63 QESGQTVECTVAQYFKDRHKLVLRYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKK 300 310 320 330 340 350 410 420 430 440 450 460 pF1KE9 LTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFIN-TLQDNKKVRELLQLWDLKFDTNFL :::. . .... : : .: :... : . . ... . :::. . .. CCDS63 LTDN--QTSTMIRATA---RSAPDRQEEISKLMRSASFNTDPYVREF----GIMVKDEMT 360 370 380 390 400 470 480 490 500 510 520 pF1KE9 SVPGRVLKNANIVQGRR--MVKANSQGDWSREIRELPLLNAMPLHSWLIL-YSRSSHREA .: ::::. .:. : : . . :: : ..:. . ... .. : : .. . . CCDS63 DVTGRVLQPPSILYGGRNKAIATPVQGVW--DMRNKQFHTGIEIKVWAIACFAPQRQCTE 410 420 430 440 450 460 530 540 550 560 570 pF1KE9 MSLKG---HLQSVT--APMGITMKPAEMIEVDGDANSYIDTLR--KYTRPTLQMGMSCLL . ::. .:.... : : : .: ..: :.: .: : : ::. CCDS63 VHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYAGLQL------ 470 480 490 500 510 580 590 600 610 620 630 pF1KE9 VFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMG :. :::. : .:: : . .::: :..... .:. ... ..: :.: CCDS63 ---VVVILPGKTPV-YAEVKRVGDTVLGMATQCVQMKNVQRTTPQTL-SNLCLKINVKLG 520 530 540 550 560 570 640 650 660 670 680 pF1KE9 GA----LWKVETDV--QRTMFVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQ :. : . . : : ..:.: : : .. .. :::. :.: .:. ... . .: CCDS63 GVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQ 580 590 600 610 620 630 690 700 710 720 730 740 pF1KE9 KTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKMSTY-L . .:....: .. : . :. : .: :::::..::.: .: :: . . CCDS63 QHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACI 640 650 660 670 680 690 750 760 770 780 790 800 pF1KE9 KTISPNNFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVS : . . ..::::.:: .::.: .. : : ::..:...:. .::.. : CCDS63 KLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCS 700 710 720 730 740 750 810 820 830 840 850 860 pF1KE9 QSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYL .. .:: :.::.:..: .: : .: ::: ::: : . .::: .::: .:. CCDS63 HAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFR 760 770 780 790 800 810 870 880 pF1KE9 VGQSIHQEPNRSLSTRLFYL CCDS63 ARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA 820 830 840 850 >>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa) initn: 304 init1: 219 opt: 412 Z-score: 355.7 bits: 76.5 E(32554): 1.7e-13 Smith-Waterman score: 518; 24.7% identity (56.8% similar) in 558 aa overlap (330-861:44-578) 300 310 320 330 340 350 pF1KE9 RTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTF--NKSDGSKI-- . ::: .. . ..:: . .:. . CCDS40 PRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPASHQTFPLQLENGQTVER 20 30 40 50 60 70 360 370 380 390 400 410 pF1KE9 TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDY : .:.:... . . : : . :. .: . .. : : . :::. . CCDS40 TVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKKLTDN--QTS 80 90 100 110 120 420 430 440 450 460 470 pF1KE9 SIVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNA ...: : : .: :... ..... . : .. ..: ...: .. : :::: : CCDS40 TMIKATA---RSAPDRQEE-ISRLVRSA--NYETDPFVQEFQFKVRDEMAHVTGRVLP-A 130 140 150 160 170 180 480 490 500 510 520 pF1KE9 NIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLHSWLI--LYSRSSHREAMSLKG--- ..: :: : : . :.: : ..: . ... .. : : . .. . :: . ::: CCDS40 PMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQRQCREEI-LKGFTD 190 200 210 220 230 530 540 550 560 570 580 pF1KE9 HLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDD .:.... :. .. . ... . .. . .. . : . :.. ..: :::. CCDS40 QLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYS-GLQLIIV-----ILPGKT 240 250 260 270 280 290 590 600 610 620 630 640 pF1KE9 KRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQR : .:: : . .::: :.. :.. .:. ... ..: :.:: . .. . :: CCDS40 PV-YAEVKRVGDTLLGMATQCVQVKNVIKTSPQTL-SNLCLKINVKLGG-INNILVPHQR 300 310 320 330 340 350 650 660 670 680 690 pF1KE9 -------TMFVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELE ..:.: : : .. .. :::. :.: .:. ... . .:. .:....: CCDS40 PSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPRQEIIQDLA 360 370 380 390 400 410 700 710 720 730 740 750 pF1KE9 ICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLA .. : . :. : .: :::::..::.. .: .: . .. . . .. CCDS40 SMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLEKDYQPGIT 420 430 440 450 460 470 760 770 780 790 800 810 pF1KE9 FIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPT .:::.:: .::.: .. : : ::..:...:. .::.. :.. .:: :. CCDS40 YIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAGIQGTSRPS 480 490 500 510 520 530 820 830 840 850 860 870 pF1KE9 HYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNR ::.:..: .. : .: ::: ::: : . .::: .::: .:. CCDS40 HYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHD 540 550 560 570 580 590 880 pF1KE9 SLSTRLFYL CCDS40 SAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 600 610 620 >>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa) initn: 373 init1: 219 opt: 412 Z-score: 353.9 bits: 76.6 E(32554): 2.2e-13 Smith-Waterman score: 622; 24.3% identity (54.5% similar) in 818 aa overlap (119-861:24-812) 90 100 110 120 130 140 pF1KE9 PLQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVD :. : ..:::: :.: :. .: :.:: CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQV-EIPKIDVYLYEVD 10 20 30 40 50 150 160 170 180 190 pF1KE9 YKPDIEDGNLRTILLD---QHRRK--FGERH-IFDGN-SLLLSRPLKERRVEW-LSTT-- ::: . ..: :: . ::.:. ..::. :: . :: . :..: CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP 60 70 80 90 100 110 200 210 220 230 pF1KE9 ----KDKNIVKITVEFSKELT---------------------PTSPDCLRYYNILFRRTF ::. . :....: .... : : . .. ....:. . CCDS39 GEGGKDRPF-KVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRH-L 120 130 140 150 160 170 240 250 260 270 280 290 pF1KE9 KLLDFEQVGRNYYTKKKAIQLYRH--GTSLEIWLGYVTSVLQYENSITLCADVSHK-LLR . . :::.... : . : : : . :.:.:. :: .. : ::: . . CCDS39 PSMKYTPVGRSFFS---APEGYDHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYK 180 190 200 210 220 300 310 320 330 pF1KE9 IETAYDF------IKRTSAQAQ--TGNIREEVTNKLIGSIVLTKYNN---KTYRVDDIDW . . .: :. . : . : . : . :... : : . . . . ::: .. CCDS39 AQPVIQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTR 230 240 250 260 270 280 340 350 360 370 380 390 pF1KE9 KQNPEDTF--NKSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPI . ..:: . .:. . : .:.:... . . : : . :. .: . CCDS39 RPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCN 290 300 310 320 330 340 400 410 420 430 440 450 pF1KE9 LLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQL .. : : . :::. . ...: : : .: :... ..... . : .. ..: CCDS39 IVAGQRC-IKKLTDN--QTSTMIKATA---RSAPDRQEE-ISRLVRS--ANYETDPFVQE 350 360 370 380 390 460 470 480 490 500 510 pF1KE9 WDLKFDTNFLSVPGRVLKNANIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLHSWLI ...: .. : :::: : ..: :: : : . :.: : ..: . ... .. : : CCDS39 FQFKVRDEMAHVTGRVLP-APMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAI 400 410 420 430 440 450 520 530 540 550 560 pF1KE9 --LYSRSSHREAMSLKG---HLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTRPTL . .. . :: . ::: .:.... :. .. . ... . .. . .. . : CCDS39 ACFATQRQCREEI-LKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTY 460 470 480 490 500 510 570 580 590 600 610 620 pF1KE9 QMGMSCLLVFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIA . :.. ..: :::. : .:: : . .::: :.. :.. .:. ... CCDS39 S-GLQLIIV-----ILPGKTPV-YAEVKRVGDTLLGMATQCVQVKNVIKTSPQTL-SNLC 520 530 540 550 560 630 640 650 660 670 pF1KE9 QQMNCKMGGALWKVETDVQR-------TMFVGIDCFHDIVN--RQKSIAGFVASTNAELT ..: :.:: . .. . :: ..:.: : : .. .. :::. :.: .:. . CCDS39 LKINVKLGG-INNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPS 570 580 590 600 610 620 680 690 700 710 720 730 pF1KE9 KWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHE .. . .:. .:....: .. : . :. : .: :::::..::.. .: .: CCDS39 RYCATVRVQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYE 630 640 650 660 670 680 740 750 760 770 780 790 pF1KE9 AKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRN . .. . . ...:::.:: .::.: .. : : ::..:...:. CCDS39 LLAIREACISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHP 690 700 710 720 730 740 800 810 820 830 840 850 pF1KE9 EWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPC .::.. :.. .:: :.::.:..: .. : .: ::: ::: : . .::: CCDS39 YEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPA 750 760 770 780 790 800 860 870 880 pF1KE9 HYAHKLAYLVGQSIHQEPNRSLSTRLFYL .::: .:. CCDS39 YYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 810 820 830 840 850 860 >>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa) initn: 290 init1: 202 opt: 397 Z-score: 341.8 bits: 74.2 E(32554): 1e-12 Smith-Waterman score: 573; 23.5% identity (54.1% similar) in 761 aa overlap (165-861:3-734) 140 150 160 170 180 pF1KE9 ISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRK--FGERH-IFDGNS---LLLSRPLK :: . ::.:. ..::.. . . :. CCDS81 MVQHFKPQIFGDRKPVYDGKKNIYTVTALPIG 10 20 30 190 200 210 220 230 pF1KE9 ERRVEWLSTT----KDKNIVKITVEFSKELT-------------PTSPDCLRYYNILFRR ..::.. : ::. : :..... .. :. . .. .. .:. CCDS81 NERVDFEVTIPGEGKDR-IFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH 40 50 60 70 80 90 240 250 260 270 280 pF1KE9 TFKLLDFEQVGRNYYTKKKAIQLYRH--GTSLEIWLGYVTSVLQYENSITLCADVSHK-L . . . :::.... .. : : : . :.:.:. :: .. : ::: . CCDS81 -LASMRYTPVGRSFFSPPEG---YYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAF 100 110 120 130 140 290 300 310 320 330 pF1KE9 LRIETAYDF------IKRTSAQAQ--TGNIREEVTNKLIGSIVLTKYNN---KTYRVDDI . . . .: :. . : . : . : . :... : : . . . . ::: .. CCDS81 YKAQPVIEFMCEVLDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNV 150 160 170 180 190 200 340 350 360 370 380 390 pF1KE9 DWKQNPEDTF--NKSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQRE . ..:: . .:. . : .:..:... . . : : . :. .: . CCDS81 TRRPASHQTFPLQLESGQTVECTVAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEV 210 220 230 240 250 260 400 410 420 430 440 450 pF1KE9 PILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTLQDNKK--VRE .. : : . :::. . ...: : : .: : .: :. :. : . . CCDS81 CNIVAGQRC-IKKLTDN--QTSTMIKATA---RSAPDR-----QEEISRLMKNASYNLDP 270 280 290 300 310 460 470 480 490 500 pF1KE9 LLQLWDLKFDTNFLSVPGRVLKNANIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLH .: . .: .. : :::: : :.: :: : . . .:: : ..: . :.. .. CCDS81 YIQEFGIKVKDDMTEVTGRVLP-APILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIK 320 330 340 350 360 370 510 520 530 540 550 560 pF1KE9 SWLI--LYSRSSHREAM--SLKGHLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTR : : . ... :: . .. .:.... :. .. . ... . .. . .. . CCDS81 VWAIACFAPQKQCREEVLKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLK 380 390 400 410 420 430 570 580 590 600 610 620 pF1KE9 PTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVT : . :.. ..: :::. : .:: : . .::: :.. :.. .:. . CCDS81 NTYS-GLQLIIV-----ILPGKTPV-YAEVKRVGDTLLGMATQCVQVKNVVKTSPQTL-S 440 450 460 470 480 630 640 650 660 670 pF1KE9 KIAQQMNCKMGGALWKVETDVQRT-------MFVGIDCFHDIVN--RQKSIAGFVASTNA .. ..: :.:: . .. . ::. .:.: : : .. .. ::.. :.: .: CCDS81 NLCLKINVKLGG-INNILVPHQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDA 490 500 510 520 530 540 680 690 700 710 720 730 pF1KE9 ELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALL . ... . .:. .:....: .. : . :. : .: ::::: .::: .: CCDS81 HPSRYCATVRVQRPRQEIIEDLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQIL 550 560 570 580 590 600 740 750 760 770 780 790 pF1KE9 DHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVEL .: . .. .: . . ...:::.:: .::.: .. : : ::..:... CCDS81 HYELLAIRDACIKLEKDYQPGITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNI 610 620 630 640 650 660 800 810 820 830 840 850 pF1KE9 TRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVP :. .::.. :.. .:: :.:: :..: .. : .: ::: ::: : . .: CCDS81 THPFEFDFYLCSHAGIQGTSRPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIP 670 680 690 700 710 720 860 870 880 pF1KE9 APCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL :: .::. .:. CCDS81 APAYYARLVAFRARYHLVDKEHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA 730 740 750 760 770 780 >>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa) initn: 362 init1: 202 opt: 397 Z-score: 341.3 bits: 74.3 E(32554): 1.1e-12 Smith-Waterman score: 645; 24.3% identity (53.8% similar) in 849 aa overlap (80-861:7-809) 50 60 70 80 90 100 pF1KE9 EEVPVVRPLQPRAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQD : :: . :::. ::: . : CCDS39 MEAGPSGAAAGAYLPPLQQ-----VFQ---APRRPG 10 20 110 120 130 140 150 160 pF1KE9 MKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNL-RTIL--LDQH . :. : ..::::.:.: . :. .:.:.:: ::: . : .. . :: CCDS39 I--------GTVGKPIKLLANYFEV-DIPKIDVYHYEVDIKPDKCPRRVNREVVEYMVQH 30 40 50 60 70 170 180 190 200 210 pF1KE9 RRK--FGERH-IFDGNS---LLLSRPLKERRVEWLSTT----KDKNIVKITVEFSKELT- . ::.:. ..::.. . . :. ..::.. : ::. : :..... .. CCDS39 FKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVTIPGEGKDR-IFKVSIKWLAIVSW 80 90 100 110 120 130 220 230 240 250 260 pF1KE9 ------------PTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRH--GTSL :. . .. .. .:. . . . :::.... .. : : : . CCDS39 RMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPVGRSFFSPPEG---YYHPLGGGR 140 150 160 170 180 190 270 280 290 300 310 pF1KE9 EIWLGYVTSVLQYENSITLCADVSHK-LLRIETAYDF------IKRTSAQAQ--TGNIRE :.:.:. :: .. : ::: . . . . .: :. . : . : . : CCDS39 EVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRNIDEQPKPLTDSQRV 200 210 220 230 240 250 320 330 340 350 360 pF1KE9 EVTNKLIGSIVLTKYNN---KTYRVDDIDWKQNPEDTF--NKSDGSKI--TYIDYYRQQH . :... : : . . . . ::: .. . ..:: . .:. . : .:..:.. CCDS39 RFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECTVAQYFKQKY 260 270 280 290 300 310 370 380 390 400 410 420 pF1KE9 KEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKELAKHT . . . : : . :. .: . .. : : . :::. . ...: : CCDS39 NLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKKLTDN--QTSTMIKATA--- 320 330 340 350 360 430 440 450 460 470 480 pF1KE9 RLSPRRRHHTLKEFINTLQDNKK--VRELLQLWDLKFDTNFLSVPGRVLKNANIVQ--GR : .: : .: :. :. : . . .: . .: .. : :::: : :.: :: CCDS39 RSAPDR-----QEEISRLMKNASYNLDPYIQEFGIKVKDDMTEVTGRVLP-APILQYGGR 370 380 390 400 410 420 490 500 510 520 530 pF1KE9 -RMVKANSQGDWSREIRELPLLNAMPLHSWLI--LYSRSSHREAM--SLKGHLQSVTAPM : . . .:: : ..: . :.. .. : : . ... :: . .. .:.... CCDS39 NRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLRKISKDA 430 440 450 460 470 540 550 560 570 580 590 pF1KE9 GITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKR :. .. . ... . .. . .. . : . :.. ..: :::. : .:: CCDS39 GMPIQGQPCFCKYAQGADSVEPMFRHLKNTYS-GLQLIIV-----ILPGKTPV-YAEVKR 480 490 500 510 520 530 600 610 620 630 640 pF1KE9 YLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRT-------M : . .::: :.. :.. .:. ... ..: :.:: . .. . ::. . CCDS39 VGDTLLGMATQCVQVKNVVKTSPQTL-SNLCLKINVKLGG-INNILVPHQRSAVFQQPVI 540 550 560 570 580 590 650 660 670 680 690 700 pF1KE9 FVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDV :.: : : .. .. ::.. :.: .:. ... . .:. .:....: .. : CCDS39 FLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELLIQ 600 610 620 630 640 650 710 720 730 740 750 760 pF1KE9 WCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRIN . :. : .: ::::: .::: .: .: . .. .: . . ...:::.:: . CCDS39 FYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKRHH 660 670 680 690 700 710 770 780 790 800 810 820 pF1KE9 TRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTI ::.: .. : : ::..:...:. .::.. :.. .:: :.:: :..: CCDS39 TRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWDDN 720 730 740 750 760 770 830 840 850 860 870 880 pF1KE9 GLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL .. : .: ::: ::: : . .::: .::. .:. CCDS39 RFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHISG 780 790 800 810 820 830 CCDS39 QSNGRDPQALAKAVQVHQDTLRTMYFA 840 850 882 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 17:48:01 2016 done: Mon Nov 7 17:48:02 2016 Total Scan time: 4.350 Total Display time: 0.290 Function used was FASTA [36.3.4 Apr, 2011]