FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9627, 861 aa 1>>>pF1KE9627 861 - 861 aa - 861 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3671+/-0.000898; mu= 16.0545+/- 0.054 mean_var=85.5436+/-17.062, 0's: 0 Z-trim(107.5): 24 B-trim: 0 in 0/51 Lambda= 0.138669 statistics sampled from 9620 (9639) to 9620 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.296), width: 16 Scan time: 4.220 The best scores are: opt bits E(32554) CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 5816 1173.8 0 CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 2902 590.8 3.4e-168 CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 2818 574.0 3.8e-163 CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 2324 475.2 2.4e-133 CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1949 400.2 8.9e-111 CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 450 100.2 1.2e-20 CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 450 100.3 1.6e-20 CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 444 99.1 3.6e-20 CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 433 96.9 1.5e-19 CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 433 96.9 1.6e-19 CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 365 83.3 2e-15 >>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa) initn: 5816 init1: 5816 opt: 5816 Z-score: 6283.9 bits: 1173.8 E(32554): 0 Smith-Waterman score: 5816; 100.0% identity (100.0% similar) in 861 aa overlap (1-861:1-861) 10 20 30 40 50 60 pF1KE9 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 KSQGLQISAGFQELSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 KSQGLQISAGFQELSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 LTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 LTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 VFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 VFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPID 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 IPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 IPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 KELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 KELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 VLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 VLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQRE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 VGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 VGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 ETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDDRTEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 ETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDDRTEA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 ATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 ATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFS 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 RCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 RCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQF 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 LDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 LDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIV 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 SQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS92 SQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAF 790 800 810 820 830 840 850 860 pF1KE9 LVGQSIHREPNLSLSNRLYYL ::::::::::::::::::::: CCDS92 LVGQSIHREPNLSLSNRLYYL 850 860 >>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa) initn: 2907 init1: 783 opt: 2902 Z-score: 3133.1 bits: 590.8 E(32554): 3.4e-168 Smith-Waterman score: 2945; 50.5% identity (76.2% similar) in 889 aa overlap (1-861:1-882) 10 20 30 40 pF1KE9 MTGRARARARGRARGQETAQLV--------GSTASQQPGYIQPRPQP----PPAEGELFG : ::::.::::::: .:. : ::...:.: .: :.: :. : CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE9 RGRQRGTAGGTAKSQGLQ---ISAGFQELSLAER--GGRRRDFHDLGVNTRQNLDHVKES :. :: ::: :.:::.. ::.. : :: :: :.:: :::::.. :::.: CCDS33 RA-ARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV---FQDLVVNTRQDMKHVKDS 70 80 90 100 110 110 120 130 140 150 160 pF1KE9 KTGSSGIIVRLSTNHFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAF :::: : .:.: .::::. :::::. :.:..::.: .: ::. :: ::. .:. : : CCDS33 KTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIF 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE9 DGTILFLPKRLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIM ::. :.: . :... .: .: :.. . :.::. ...:: :::: ::..:::.::: .:.. CCDS33 DGNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE9 NLQQIGRNYYNPNDPIDIPSH--RLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLD ...:.:::::. . :.. : : :: :..::.::::::: ::.:::::.:: ::. : CCDS33 DFEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYD 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE9 FMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVS :. :.. ...:.:...::: .::::::::::::::::: :::..::.:.:::... CCDS33 FIKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKIT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE9 FLEYYRKQYNQEITDLKQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFN ...:::.:... .: :::.:::: . ..: :: : .:::.::..:::::.. .:.. CCDS33 YIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYS 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE9 VMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEK ..:.:: ::::.:..:.. . ..:. .. : .:.. :. : :.::.:.:: ::.:.. . CCDS33 IVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNAN 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE9 IHQGGKTFDYNPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPA : :: . : : .:::.: : ::... :: .::..:.: ... : :: .: .:: CCDS33 IVQGRRMVKANSQ-GDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAP 480 490 500 510 520 530 530 540 550 560 570 pF1KE9 MGMQMRKAIMIEVDDRTEAYLRVLQQKVTADTQI---------VVCLLSSNRKDKYDAIK ::. :. : ::::: ...:. .:.. . :. :.:.: .. : .::.:: CCDS33 MGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIK 540 550 560 570 580 590 580 590 600 610 620 630 pF1KE9 KYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGID .:::: :: :::::: .:: : :. .:.:::: :::::::: ::.:. .. .:.:::: CCDS33 RYLCTKCPIPSQCVVKKTLEKVQA-RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGID 600 610 620 630 640 650 640 650 660 670 680 690 pF1KE9 CYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEY :.::.. ..:::::::: : .:.:.:.:..: :.::: :..::.::: .: . . CCDS33 CFHDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESS 660 670 680 690 700 710 700 710 720 730 740 750 pF1KE9 MPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQS :: .::::::::::::..:...:. .. ::.:. . : :. ::::::.::::: . CCDS33 MPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKH 720 730 740 750 760 770 760 770 780 790 800 810 pF1KE9 GGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLT :. .::: ::::::::.:: ::::::::::.:..:.:.:::::::::. ::.:: .:::: CCDS33 GSNFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLT 780 790 800 810 820 830 820 830 840 850 860 pF1KE9 YKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL : :::.::: ::.:::::::.::::::.:::::::.::: :::.::.:: CCDS33 YCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL 840 850 860 870 880 >>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa) initn: 2808 init1: 1472 opt: 2818 Z-score: 3042.5 bits: 574.0 E(32554): 3.8e-163 Smith-Waterman score: 2840; 49.1% identity (76.3% similar) in 865 aa overlap (1-861:1-852) 10 20 30 40 50 60 pF1KE9 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA :.::::..::: :: : .. . : :: : : .. . . : : . CCDS31 MSGRARVKARGIAR---------SPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSR 10 20 30 40 50 70 80 90 100 110 pF1KE9 KSQGLQ--ISAGFQELSLAERGGR-RRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTN : . . ::.: .. ::: . ..:: ::.. ::..: ::.. ::::::: :.: :: CCDS31 ISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 HFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQK : : .: :::::. : : . .:::: :::..: .: .: .::::.:::: ..:..: CCDS31 LFNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 VTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPND :::. :.:. :: ...:::: ::: .::.:.: .:::::..:: ... :::::.:::.. CCDS31 VTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE9 PIDIPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQE :..::.:.: .::::. :. .: .... .:::.::::.::::.:: . ..: : . CCDS31 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE9 QVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDL :.::::.:::.:::.:: .:::::. .: ::.: ::.:.....::..::. ..:: CCDS31 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE9 KQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQR .::.::: :..:. . . : ::::::.::::::. .::..:: .: .:::.: : CCDS31 NQPMLVSLLKKKRNDN-SEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE9 QREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNP-QFA :....::.: :..: :.. ::. ::: : :.. :..:::. .::: . . . : . : CCDS31 QQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQ--PVSAA 420 430 440 450 460 480 490 500 510 520 530 pF1KE9 DWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDD ::::. : ..... :..::.. . :. .:.:... : .:. .::... .:.:.. CCDS31 DWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQE 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE9 RTEAYLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQT :..:..:: : :.:.:.:.: ::.: ::.::::: .:::.:::::.::::.:: CCDS31 NPAAFVRAIQQYVDPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGM 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE9 VMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMT .:.::::::.::.::.::::: :.:::: .:.:::: .: . ..: :::.: .: CCDS31 MMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRIT 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE9 RWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYE :::::::.: ...: ::: . .:: : . :. .:.:::::: ::::::::::..:: CCDS31 RWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE9 VPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYD :::.:. . . . . ::.::::.:. :::.. . .::: :::.: :.:: :::: CCDS31 VPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYD 710 720 730 740 750 760 780 790 800 810 820 830 pF1KE9 FFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAH :...::.. :.::::.::::::..::::::.::::.::::.::::::.. ::::::::: CCDS31 FYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAH 770 780 790 800 810 820 840 850 860 pF1KE9 KLAFLVGQSIHREPNLSLSNRLYYL ::.:::.::::.::.: :.:.:.:: CCDS31 KLTFLVAQSIHKEPSLELANHLFYL 830 840 850 >>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa) initn: 1806 init1: 690 opt: 2324 Z-score: 2507.5 bits: 475.2 E(32554): 2.4e-133 Smith-Waterman score: 2324; 43.0% identity (74.4% similar) in 763 aa overlap (104-861:216-973) 80 90 100 110 120 130 pF1KE9 LSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYH : ::.: :. : .. . . :.:::: CCDS60 SPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNE-AVYQYH 190 200 210 220 230 240 140 150 160 170 180 190 pF1KE9 IDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTEVFSKTR-NGEDVR . ..: .: . .: ..: .:. . :. ::::.::.:: .::: : :. :. . .. .. CCDS60 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-VLELKSQRKTDSAEIS 250 260 270 280 290 300 200 210 220 230 240 250 pF1KE9 ITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPIDIPSHRLVIWPGF : : .:. : : : :. :::..:::..:..... .:::.:.:.. . . .::: ::::. CCDS60 IKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIWPGY 310 320 330 340 350 360 260 270 280 290 300 310 pF1KE9 TTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKY ..:: . .....: .::::::.:.. ::: : .:.:..:: ::.. .: :.: .:.:.: CCDS60 AASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQDECTKLLVGNIVITRY 370 380 390 400 410 420 320 330 340 350 360 370 pF1KE9 NNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQPVLVSQPKRRRGP ::.:::.::.::...::..: .::.:..::::: :.:. . . ::.:. .:..:. CCDS60 NNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQDN 430 440 450 460 470 480 380 390 400 410 420 430 pF1KE9 GGTL-PGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKN : : : .:.::: ..::. .::..:: .::::: . :.:.:.. . :.. : :: CCDS60 HGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIAKN 490 500 510 520 530 540 440 450 460 470 480 490 pF1KE9 DNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSKETRGAPLISVK . . :: ::: ..... .. ::.: :.:. . .: . : .: ::. : : . CCDS60 EAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSF-ITSQELNWVKEVTRDPSILTI 550 560 570 580 590 600 500 510 520 530 540 550 pF1KE9 PLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEV-DDRTEAYLRVLQQKVT :. : :.: .: .. : :.. : :.. .::.: .:. ::: :.:.:..:. . CCDS60 PMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTLG 610 620 630 640 650 660 560 570 580 590 600 pF1KE9 AD--TQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQM :. :.:::.. . : : : :::: :.. :.::: : .::.:. . ..: :: ::. CCDS60 AEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQI 670 680 690 700 710 720 610 620 630 640 650 660 pF1KE9 NCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRG :::.::::: :::::: .:..:.: ::: . : ::..::::::: .:.:.:: .:: CCDS60 NCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMPH 730 740 750 760 770 780 670 680 690 700 710 720 pF1KE9 QELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIG ::.::.::.:: ..:. . :. .: .:.::::::.::::::..:::.::. :.... CCDS60 QEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF- 790 800 810 820 830 840 730 740 750 760 770 780 pF1KE9 RGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS ..:.:...:.::.:...: .. . . .: ::::.: .: :: ::..... ::.: CCDS60 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC 850 860 870 880 890 900 790 800 810 820 830 840 pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR :::: . ....:.:::.::::.::::.:.::::.:::::::.:::::::: :. .:. CCDS60 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH 910 920 930 940 950 960 850 860 pF1KE9 EPNLSLSNRLYYL :: ..: . :..: CCDS60 EPAIQLCENLFFL 970 >>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa) initn: 1681 init1: 690 opt: 1949 Z-score: 2102.3 bits: 400.2 E(32554): 8.9e-111 Smith-Waterman score: 2124; 41.0% identity (70.8% similar) in 763 aa overlap (104-861:216-937) 80 90 100 110 120 130 pF1KE9 LSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYH : ::.: :. : .. . . :.:::: CCDS83 SPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNE-AVYQYH 190 200 210 220 230 240 140 150 160 170 180 190 pF1KE9 IDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTEVFSKTR-NGEDVR . ..: .: . .: ..: .:. . :. ::::.::.:: .::: : :. :. . .. .. CCDS83 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-VLELKSQRKTDSAEIS 250 260 270 280 290 300 200 210 220 230 240 250 pF1KE9 ITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPIDIPSHRLVIWPGF : : .:. : : : :. :::..:::..:..... .:::.:.:.. . . .::: ::::. CCDS83 IKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIWPGY 310 320 330 340 350 360 260 270 280 290 300 310 pF1KE9 TTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKY ..:: . .....: .::::::.:.. ::: : .:.:..:: ::.. .: :.: .:.:.: CCDS83 AASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQDECTKLLVGNIVITRY 370 380 390 400 410 420 320 330 340 350 360 370 pF1KE9 NNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQPVLVSQPKRRRGP ::.:::.::.::...::..: .::.:..::::: :.:. . . ::.:. .:..:. CCDS83 NNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQDN 430 440 450 460 470 480 380 390 400 410 420 430 pF1KE9 GGTL-PGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKN : : : .:.::: ..::. .::..:: .::::: . :.:.:.. . :.. : :: CCDS83 HGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIAKN 490 500 510 520 530 540 440 450 460 470 480 490 pF1KE9 DNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSKETRGAPLISVK . . :: ::: ..... .. ::.: :.:. . .: . : .: ::. : : . CCDS83 EAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSF-ITSQELNWVKEVTRDPSILTI 550 560 570 580 590 600 500 510 520 530 540 550 pF1KE9 PLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEV-DDRTEAYLRVLQQKVT :. : :.: .: .. : :.. : :.. .::.: .:. ::: :.:.:..:. . CCDS83 PMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTLG 610 620 630 640 650 660 560 570 580 590 600 pF1KE9 AD--TQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQM :. :.:::.. . : : : :::: :.. :.::: : .::.:. . ..: :: ::. CCDS83 AEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQI 670 680 690 700 710 720 610 620 630 640 650 660 pF1KE9 NCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRG :::.::::: :::::: .:..:.: ::: . : ::..::::::: .:.:.:: .:: CCDS83 NCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMPH 730 740 750 760 770 780 670 680 690 700 710 720 pF1KE9 QELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIG ::.::.::.:: ..:. . :. .: .:.::::::.::::::..:::.::. :.... CCDS83 QEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF- 790 800 810 820 830 840 730 740 750 760 770 780 pF1KE9 RGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS ..:.:...:.::.:...: .. . . .: ::::.: .: :: CCDS83 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEW-------------- 850 860 870 880 790 800 810 820 830 840 pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR ::.::::.:.::::.:::::::.:::::::: :. .:. CCDS83 ----------------------LTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH 890 900 910 920 850 860 pF1KE9 EPNLSLSNRLYYL :: ..: . :..: CCDS83 EPAIQLCENLFFL 930 >>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa) initn: 441 init1: 252 opt: 450 Z-score: 484.3 bits: 100.2 E(32554): 1.2e-20 Smith-Waterman score: 597; 25.8% identity (57.4% similar) in 582 aa overlap (290-840:18-578) 260 270 280 290 300 310 pF1KE9 ENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNN---KT :. :. . .::. :: : . . . . CCDS40 MCEVLDIHNIDEQPRPLTDSHRV--KFTKEIKGLKVEVTHCGTMRRK 10 20 30 40 320 330 340 350 360 370 pF1KE9 YRVDDIDWDQNPKSTF--KKADGSEV--SFLEYYRKQYNQEITDLKQPVL-VSQPKRRRG ::: .. ..:: . .:. : . .:.:..:. .. . : : :.: ... CCDS40 YRVCNVTRRPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCLQVGQEQKHT- 50 60 70 80 90 100 380 390 400 410 420 pF1KE9 PGGTLPGPA--MLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIH :: . .. . : . ::: :. ..: . . .: .:. ::.:..::. CCDS40 ---YLPLEVCNIVAGQRC-IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLVR--S 110 120 130 140 150 430 440 450 460 470 480 pF1KE9 KNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLI : ... .... .. ... .::.: . .. ::.. .:. . : . :: . CCDS40 ANYETDPFVQEFQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFH 160 170 180 190 200 210 490 500 510 520 530 540 pF1KE9 SVKPLDNWLL--IYTRRN--YEAANSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEA . . : . . :.:. : ... ..: :.. :: .. . . : .: CCDS40 TGVEIKMWAIACFATQRQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEP 220 230 240 250 260 270 550 560 570 580 590 600 pF1KE9 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI ..: :.. .. :... .: . . : .:. : .::: .... : : CCDS40 MFRHLKNTYSG-LQLIIVILPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVIK--TSPQT 280 290 300 310 320 610 620 630 640 650 pF1KE9 ATKIALQMNCKMGG------ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASIN ... :..: :.:: : .. . :...: : : .. :.. :::. :.:.. CCDS40 LSNLCLKINVKLGGINNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMD 330 340 350 360 370 380 660 670 680 690 700 710 pF1KE9 EGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTL .:. . : ::... : .. : . . ... :.::: :::::..::.. . CCDS40 AHPSRYCATVRVQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQV 390 400 410 420 430 440 720 730 740 750 760 pF1KE9 VNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFF----AQSGGRLQNPLPGTVIDVE . ::. . . :. . :.: .: :::.:: .::.: .. :: : ::..:.. CCDS40 LYYELLAIREACISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTD 450 460 470 480 490 500 770 780 790 800 810 820 pF1KE9 VTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRV .:.: .::.. :.: .:. :.::.:..:.. . :..: :::.::: : . . CCDS40 ITHPYEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSI 510 520 530 540 550 560 830 840 850 860 pF1KE9 PAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL ::: ::: .:: CCDS40 PAPAYYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 570 580 590 600 610 620 >>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa) initn: 481 init1: 252 opt: 450 Z-score: 482.2 bits: 100.3 E(32554): 1.6e-20 Smith-Waterman score: 679; 24.8% identity (54.9% similar) in 811 aa overlap (106-840:24-812) 80 90 100 110 120 130 pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID :. : ..: .: :.. :. .: :..: CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQVEI-PKIDVYLYEVD 10 20 30 40 50 140 150 160 170 180 pF1KE9 YNPLMEARRLRSAL---LFQHED--LIG-KCHAFDGT-ILFLPKRLQQKVT----EVFSK .: ::. . . :: ..: . ..:: :. . : .: .: CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP 60 70 80 90 100 110 190 200 210 220 pF1KE9 TRNGED----------VRITITLTNE------LP-------PTSPTCLQFYNIIFRRLLK ..:.: :.. : .: :: : : . .. ....:.: . CCDS39 GEGGKDRPFKVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRHLPS 120 130 140 150 160 170 230 240 250 260 270 pF1KE9 IMNLQQIGRNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSET :. .::.... . : : . : : : :: :. ..:: ::: .. ... CCDS39 -MKYTPVGRSFFSAPEGYDHPLGGGREV-WFGFHQSVRPAMWKMMLNIDVSATAFYKAQP 180 190 200 210 220 230 280 290 300 310 320 pF1KE9 VLDFMFNFY--HQTEEH------KFQEQVSKELIGLVVLTKYNN---KTYRVDDIDWDQN :..:: . :. .:. . . . .::. :: : . . . . ::: .. CCDS39 VIQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPA 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE9 PKSTF--KKADGSEV--SFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA-- ..:: . .:. : . .:.:..:. .. . : : :.: ... :: . CCDS39 SHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCLQVGQEQKHT----YLPLEVCN 300 310 320 330 340 390 400 410 420 430 440 pF1KE9 MLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRD .. . : . ::: :. ..: . . .: .:. ::.:..::. : ... ... CCDS39 IVAGQRC-IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLVR--SANYETDPFVQE 350 360 370 380 390 450 460 470 480 490 pF1KE9 WGLSFDSNLLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLL- . .. ... .::.: . .. ::.. .:. . : . :: . . . : . CCDS39 FQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIA 400 410 420 430 440 450 500 510 520 530 540 550 pF1KE9 -IYTRRN--YEAANSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTA . :.:. : ... ..: :.. :: .. . . : .: ..: :.. .. CCDS39 CFATQRQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG 460 470 480 490 500 510 560 570 580 590 600 610 pF1KE9 DTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCK :... .: . . : .:. : .::: .... : : ... :..: : CCDS39 -LQLIIVILPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVIK--TSPQTLSNLCLKINVK 520 530 540 550 560 570 620 630 640 650 660 pF1KE9 MGG------ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCI .:: : .. . :...: : : .. :.. :::. :.:.. .:. . CCDS39 LGGINNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVR 580 590 600 610 620 630 670 680 690 700 710 720 pF1KE9 FQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDC : ::... : .. : . . ... :.::: :::::..::.. .. ::. . . CCDS39 VQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREA 640 650 660 670 680 690 730 740 750 760 770 pF1KE9 LKSIGRGYNPRLTVIVVKKRVNTRFF----AQSGGRLQNPLPGTVIDVEVTRPEWYDFFI :. . :.: .: :::.:: .::.: .. :: : ::..:...:.: .::.. CCDS39 CISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYL 700 710 720 730 740 750 780 790 800 810 820 830 pF1KE9 VSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLA :.: .:. :.::.:..:.. . :..: :::.::: : . .::: ::: .: CCDS39 CSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVA 760 770 780 790 800 810 840 850 860 pF1KE9 FLVGQSIHREPNLSLSNRLYYL : CCDS39 FRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 820 830 840 850 860 >>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa) initn: 502 init1: 243 opt: 444 Z-score: 475.7 bits: 99.1 E(32554): 3.6e-20 Smith-Waterman score: 705; 25.4% identity (56.5% similar) in 802 aa overlap (106-840:32-811) 80 90 100 110 120 130 pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID :.:: ..:..: :.. . :. .:.:..: CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEM-DIPKIDIYHYELD 10 20 30 40 50 60 140 150 160 170 180 pF1KE9 YNPLMEARRLRSAL---LFQH--EDLIG-KCHAFDG-----TILFLPKRLQQKVTEVFSK .: ::. . . :: ...: . .::: : . :: ..:: . CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIG-RDKVELEVTL 70 80 90 100 110 190 200 210 220 pF1KE9 TRNGED--VRITI-------------TLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIG .:.: ...: .:...:: . .: ....:.: . : .: CCDS63 PGEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPS-MRYTPVG 120 130 140 150 160 170 230 240 250 260 270 280 pF1KE9 RNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFM--- :.... .. . : . : : : :: :. ..:: ::: .. ... :..:. CCDS63 RSFFTASEGCSNPLGGGREV-WFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV 180 190 200 210 220 230 290 300 310 320 330 pF1KE9 FNFYHQTEEHK----FQE-QVSKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF--K ..: :..: :. . .::. :: : . . . ::: .. ..:: . CCDS63 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ 240 250 260 270 280 290 340 350 360 370 380 pF1KE9 KADGS--EVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCY . .:. : . .:.. ... . . : : :.: ... :: . .. . : CCDS63 QESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC- 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE9 LTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSN . ::: :. ..: . . .: .:. ::.:...:. . :.. .:..:. .. CCDS63 IKKLTD---NQTSTM--IRATARSAPD-RQEEISKLMR--SASFNTDPYVREFGIMVKDE 360 370 380 390 400 450 460 470 480 490 500 pF1KE9 LLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPL-ISVKPLDNWLLIYTRRNYE . . .::.:: .: ::.. .: . :. ... : .: . :. : CCDS63 MTDVTGRVLQPPSILYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTE 410 420 430 440 450 460 510 520 530 540 550 560 pF1KE9 AA-NSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCLLS . .:. ..: :.. :: .. . . : .: ..: :.. : :.:: .: CCDS63 VHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTY-AGLQLVVVILP 470 480 490 500 510 520 570 580 590 600 610 pF1KE9 SNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG------E . . : .:. : .::: ... :.:. ... :..: :.:: CCDS63 G-KTPVYAEVKRVGDTVLGMATQCVQMKNV--QRTTPQTLSNLCLKINVKLGGVNNILLP 530 540 550 560 570 580 620 630 640 650 660 670 pF1KE9 LWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQELVD : . . :...: : : .. :.. :::. :.:.. .:. . :.. ::... CCDS63 QGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQ 590 600 610 620 630 640 680 690 700 710 720 730 pF1KE9 GLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRGYN : . .. : . . ... :.::: :::::..::.. ....:. . . :.: . . :. CCDS63 DLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIK-LEKDYQ 650 660 670 680 690 740 750 760 770 780 pF1KE9 PRLTVIVVKKRVNTRFFAQSG----GRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS : .: :::.:: .::.: . :. : ::..:...:.: .::.. :.: .:. CCDS63 PGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGT 700 710 720 730 740 750 790 800 810 820 830 840 pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR :.::.:..:.. .. :..: :::.::: : . .::: ::: .:: CCDS63 SRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVD 760 770 780 790 800 810 850 860 pF1KE9 EPNLSLSNRLYYL CCDS63 KEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA 820 830 840 850 >>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa) initn: 438 init1: 226 opt: 433 Z-score: 464.4 bits: 96.9 E(32554): 1.5e-19 Smith-Waterman score: 658; 25.1% identity (56.9% similar) in 680 aa overlap (203-840:76-734) 180 190 200 210 220 230 pF1KE9 RLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNY :. .: .. .:.: . : .::.. CCDS81 GKDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRHLAS-MRYTPVGRSF 50 60 70 80 90 100 240 250 260 270 280 pF1KE9 YNPNDPIDIP-SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFMF------ ..: . : . .: :: :. ..:: ::: .. ... :..:: CCDS81 FSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIR 110 120 130 140 150 160 290 300 310 320 330 pF1KE9 NFYHQTEEHKFQEQV--SKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF----KKA :. .: . ...: .::. :: : . . . . ::: .. ..:: ... CCDS81 NIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESG 170 180 190 200 210 220 340 350 360 370 380 390 pF1KE9 DGSEVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCYLTGL . : . .:....:: .. . : : :.: ... :: . .. . : . : CCDS81 QTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC-IKKL 230 240 250 260 270 400 410 420 430 440 450 pF1KE9 TDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSF :: :. ..: . . .: .:. ::.:..::. . . :.. ....:.. ... CCDS81 TD---NQTSTM--IKATARSAPD-RQEEISRLMK--NASYNLDPYIQEFGIKVKDDMTEV 280 290 300 310 320 330 460 470 480 490 500 510 pF1KE9 SGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSL .::.: . .. ::.. .:. . : . :: . . . : . . . . . CCDS81 TGRVLPAPILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEV 340 350 360 370 380 520 530 540 550 560 pF1KE9 IQN----LFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCLLSSN ..: : :.. :: .. . . : .: ..: :.. .. :... .: . CCDS81 LKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG-LQLIIVILPG- 390 400 410 420 430 440 570 580 590 600 610 pF1KE9 RKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG------ELW . : .:. : .::: .... : : ... :..: :.:: CCDS81 KTPVYAEVKRVGDTLLGMATQCVQVKNVVK--TSPQTLSNLCLKINVKLGGINNILVPHQ 450 460 470 480 490 500 620 630 640 650 660 670 pF1KE9 RVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQELVDGL : . . :...: : : .. :.. ::.. :.:.. .:. . : ::... : CCDS81 RSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDL 510 520 530 540 550 560 680 690 700 710 720 730 pF1KE9 KVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRGYNPR . .. : . . ... :.::: ::::: .::: ...::. . : :.: . . :.: CCDS81 SYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIK-LEKDYQPG 570 580 590 600 610 620 740 750 760 770 780 790 pF1KE9 LTVIVVKKRVNTRFF-AQSGGRL--QNPLP-GTVIDVEVTRPEWYDFFIVSQAVRSGSVS .: :::.:: .::.: :... :. .. .: ::..:...:.: .::.. :.: .:. CCDS81 ITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSR 630 640 650 660 670 680 800 810 820 830 840 850 pF1KE9 PTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREP :.:: :..:.. . :..: :::.::: : . .::: ::. .:: CCDS81 PSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKE 690 700 710 720 730 740 860 pF1KE9 NLSLSNRLYYL CCDS81 HDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA 750 760 770 780 >>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa) initn: 438 init1: 226 opt: 433 Z-score: 463.8 bits: 96.9 E(32554): 1.6e-19 Smith-Waterman score: 689; 24.6% identity (55.8% similar) in 804 aa overlap (106-840:30-809) 80 90 100 110 120 130 pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID :. : ..: .:.:.. . :. .:.:..: CCDS39 MEAGPSGAAAGAYLPPLQQVFQAPRRPGIGTVGKPIKLLANYFEV-DIPKIDVYHYEVD 10 20 30 40 50 140 150 160 170 180 pF1KE9 YNPLMEARRLRSAL---LFQH--EDLIG-KCHAFDG-----TILFLPKRLQQKVTEVFSK .: ::. . . :: ...: . ..:: :. :: ...: . CCDS39 IKPDKCPRRVNREVVEYMVQHFKPQIFGDRKPVYDGKKNIYTVTALPIG-NERVDFEVTI 60 70 80 90 100 110 190 200 210 220 pF1KE9 TRNGED--VRITI-------------TLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIG .:.: ...: .:.. :. .: .. .:.: . : .: CCDS39 PGEGKDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRHLAS-MRYTPVG 120 130 140 150 160 170 230 240 250 260 270 280 pF1KE9 RNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFMF-- :....: . : . : : : :: :. ..:: ::: .. ... :..:: CCDS39 RSFFSPPEGYYHPLGGGREV-WFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEV 180 190 200 210 220 230 290 300 310 320 330 pF1KE9 ----NFYHQTEEHKFQEQV--SKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF--- :. .: . ...: .::. :: : . . . . ::: .. ..:: CCDS39 LDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQ 240 250 260 270 280 290 340 350 360 370 380 pF1KE9 -KKADGSEVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCY .... : . .:....:: .. . : : :.: ... :: . .. . : CCDS39 LESGQTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC- 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE9 LTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSN . ::: :. ..: . . .: .:. ::.:..::. . . :.. ....:.. .. CCDS39 IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLMK--NASYNLDPYIQEFGIKVKDD 360 370 380 390 400 450 460 470 480 490 500 pF1KE9 LLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEA . .::.: . .. ::.. .:. . : . :: . . . : . . . CCDS39 MTEVTGRVLPAPILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQC 410 420 430 440 450 460 510 520 530 540 550 pF1KE9 ANSLIQN----LFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCL . ...: : :.. :: .. . . : .: ..: :.. .. :... . CCDS39 REEVLKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG-LQLIIVI 470 480 490 500 510 560 570 580 590 600 610 pF1KE9 LSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG----- : . . : .:. : .::: .... : : ... :..: :.:: CCDS39 LPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVVK--TSPQTLSNLCLKINVKLGGINNIL 520 530 540 550 560 570 620 630 640 650 660 670 pF1KE9 -ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQEL : . . :...: : : .. :.. ::.. :.:.. .:. . : ::. CCDS39 VPHQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEI 580 590 600 610 620 630 680 690 700 710 720 730 pF1KE9 VDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRG .. :. .. : . . ... :.::: ::::: .::: ...::. . : :.: . . CCDS39 IEDLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIK-LEKD 640 650 660 670 680 690 740 750 760 770 780 pF1KE9 YNPRLTVIVVKKRVNTRFF-AQSGGRL--QNPLP-GTVIDVEVTRPEWYDFFIVSQAVRS :.: .: :::.:: .::.: :... :. .. .: ::..:...:.: .::.. :.: . CCDS39 YQPGITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQ 700 710 720 730 740 750 790 800 810 820 830 840 pF1KE9 GSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSI :. :.:: :..:.. . :..: :::.::: : . .::: ::. .:: CCDS39 GTSRPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHL 760 770 780 790 800 810 850 860 pF1KE9 HREPNLSLSNRLYYL CCDS39 VDKEHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA 820 830 840 850 861 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 14:44:56 2016 done: Mon Nov 7 14:44:57 2016 Total Scan time: 4.220 Total Display time: 0.310 Function used was FASTA [36.3.4 Apr, 2011]