FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2266, 852 aa 1>>>pF1KE2266 852 - 852 aa - 852 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6778+/-0.00124; mu= 18.4769+/- 0.075 mean_var=63.6145+/-12.662, 0's: 0 Z-trim(100.0): 24 B-trim: 0 in 0/48 Lambda= 0.160804 statistics sampled from 5923 (5937) to 5923 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.526), E-opt: 0.2 (0.182), width: 16 Scan time: 3.730 The best scores are: opt bits E(32554) CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 5645 1319.2 0 CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 2818 663.3 4.9e-190 CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 1952 462.4 1.7e-129 CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1603 381.5 3.8e-105 CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 1454 346.9 9.1e-95 CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 383 98.4 4.2e-20 CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 383 98.4 5.6e-20 CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 379 97.5 1.1e-19 CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 374 96.3 2.2e-19 CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 374 96.3 2.4e-19 CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 337 87.8 9.1e-17 >>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa) initn: 5645 init1: 5645 opt: 5645 Z-score: 7069.7 bits: 1319.2 E(32554): 0 Smith-Waterman score: 5645; 100.0% identity (100.0% similar) in 852 aa overlap (1-852:1-852) 10 20 30 40 50 60 pF1KE2 MSGRARVKARGIARSPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSRISTNDKYGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MSGRARVKARGIARSPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSRISTNDKYGI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 SSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 WQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKVTELSSETQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 WQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKVTELSSETQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 RGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEPMEIPQHKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEPMEIPQHKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 SLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 IVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDLNQPMLVSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDLNQPMLVSLL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 KKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 KKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 IQRNTNARFELETWGLHFGSQISLTGRIVPSEKILMQDHICQPVSAADWSKDIRTCKILN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 IQRNTNARFELETWGLHFGSQISLTGRIVPSEKILMQDHICQPVSAADWSKDIRTCKILN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 AQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQENPAAFVRAIQQYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 AQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQENPAAFVRAIQQYV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 DPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 CKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRITRWFSRCILQRTMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRITRWFSRCILQRTMT 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 DVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 DVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 NTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTV 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE 790 800 810 820 830 840 850 pF1KE2 PSLELANHLFYL :::::::::::: CCDS31 PSLELANHLFYL 850 >>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa) initn: 2843 init1: 1472 opt: 2818 Z-score: 3525.1 bits: 663.3 E(32554): 4.9e-190 Smith-Waterman score: 2840; 49.1% identity (76.3% similar) in 865 aa overlap (1-852:1-861) 10 20 30 40 50 pF1KE2 MSGRARVKARGIAR---------SPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSR :.::::..::: :: : .. . : :: : : .. . . : : . CCDS92 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 ISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTN : . . ::.: .. ::: . ..:: ::.. ::..: ::.. ::::::: :.: :: CCDS92 KSQGLQ--ISAGFQELSLAERGGR-RRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTN 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 LFNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEK : : .: :::::. : : . .:::: :::..: .: .: .::::.:::: ..:..: CCDS92 HFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 VTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE :::. :.:. :: ...:::: ::: .::.:.: .:::::..:: ... :::::.:::.. CCDS92 VTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPND 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ :..::.:.: .::::. :. .: .... .:::.::::.::::.:: . ..: : . CCDS92 PIDIPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL :.::::.:::.:::.:: .:::::. .: ::.: ::.:.....::..::. ..:: CCDS92 QVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 NQPMLVSLLKKKRNDNSEAQL-AHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGR .::.::: :..:. .. : ::::::.::::::. .::..:: .: .:::.: : CCDS92 KQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQR 360 370 380 390 400 410 420 430 440 450 460 pF1KE2 QQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQ--PVSAA :....::.: :..: :.. ::. ::: : :.. :..:::. .::: . . . : . : CCDS92 QREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNP-QFA 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE2 DWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQE ::::. : ..... :..::.. . :. .:.:... : .:. .::... .:.:.. CCDS92 DWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDD 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE2 NPAAFVRAIQQYVDPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGM :..:..:: : :.:.:.:.: ::.: ::.::::: .:::.:::::.::::.:: CCDS92 RTEAYLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQT 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE2 MMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRIT .:.::::::.::.::.::::: :.:::: .:.:::: .: . ..: :::.: .: CCDS92 VMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMT 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE2 RWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYE :::::::.: ...: ::: . .:: : . :. .:.:::::: ::::::::::..:: CCDS92 RWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE2 VPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYD :::.:. . . . . ::.::::.:. :::.. . .::: :::.: :.:: :::: CCDS92 VPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYD 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE2 FYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAH :...::.. :.::::.::::::..::::::.::::.::::.::::::.. ::::::::: CCDS92 FFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAH 780 790 800 810 820 830 830 840 850 pF1KE2 KLTFLVAQSIHKEPSLELANHLFYL ::.:::.::::.::.: :.:.:.:: CCDS92 KLAFLVGQSIHREPNLSLSNRLYYL 840 850 860 >>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa) initn: 1749 init1: 554 opt: 1952 Z-score: 2438.5 bits: 462.4 E(32554): 1.7e-129 Smith-Waterman score: 1952; 39.4% identity (69.1% similar) in 779 aa overlap (83-852:204-973) 60 70 80 90 100 110 pF1KE2 STNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNL :.. .:: : : ::.: : .: :: CCDS60 FSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIV---KQGSKGTPQSLGLNL 180 190 200 210 220 230 120 130 140 150 160 170 pF1KE2 FNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKV ... .. .::::::. :.. . .:...: .:. ..... ::::.::.: ::.. : CCDS60 VKIQC-HNEAVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-V 240 250 260 270 280 180 190 200 210 220 230 pF1KE2 TELSSETQRGET-IKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE ::.:. . . :.. : . . : : .:: .:..::...: :.: .:::::.:. CCDS60 LELKSQRKTDSAEISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTS 290 300 310 320 330 340 240 250 260 270 280 290 pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ : . ::.:..:::.: :. . :.. ::::.::.::. ::. : :. :.. : . CCDS60 AMVLQQHRLQIWPGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNK-EHFQD 350 360 370 380 390 400 300 310 320 330 340 350 pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL : : :.: ::.:::::::: :::.::. : .: :: :::...::...: :::.. CCDS60 ECTKLLVGNIVITRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEE 410 420 430 440 450 460 360 370 380 390 400 pF1KE2 NQPMLVSLLKKKRNDNSEAQLAH---LIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPS .::.:. ..:.:: : :.::: :.::. .. .::. :: .:.. :::. CCDS60 DQPLLIHR-PSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPK 470 480 490 500 510 520 410 420 430 440 450 460 pF1KE2 GRQQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQPVSAA ... : :.. : .: : :: :::.. ... .. ::..: :.: ... . CCDS60 QHHSALECLLQRIAKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQEL 530 540 550 560 570 580 470 480 490 500 510 520 pF1KE2 DWSKDI-RTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQ .: :.. : .::. .. : .. :. :. ..: :...:: .:. .. : .... CCDS60 NWVKEVTRDPSILTIP-MHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELK 590 600 610 620 630 640 530 540 550 560 570 580 pF1KE2 ENPA-AFVRAIQQYVDPD--VQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLN .. ..::.::. . . .:.:.::. . . : .::: . ::::: : .::.. CCDS60 DDRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIG 650 660 670 680 690 700 590 600 610 620 630 640 pF1KE2 KQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVN . . :.: :: .:..::::::::.:.::::.:::.:.:: .: ::: :::.: CCDS60 QPTRLRSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASIN 710 720 730 740 750 760 650 660 670 680 690 700 pF1KE2 PRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTL .:.:.:: ..: ...: ::. ..:.:.:.:. :: :: .:.::: ::.::::::. CCDS60 LTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTV 770 780 790 800 810 820 710 720 730 740 750 760 pF1KE2 IEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRN .::.::: .. :. : . .. :.::.:: .. .. .: ::::: : CCDS60 ANYEIPQL-QKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSC 830 840 850 860 870 880 770 780 790 800 810 820 pF1KE2 EWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPC :: ::::... . .: ::.: . . .:.:::::::::::::.:.:::: . ::::: CCDS60 EWVDFYLLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPC 890 900 910 920 930 940 830 840 850 pF1KE2 QYAHKLTFLVAQSIHKEPSLELANHLFYL .:::::.:: .. .:.::...: ..::.: CCDS60 KYAHKLAFLSGHILHHEPAIQLCENLFFL 950 960 970 >>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa) initn: 1641 init1: 554 opt: 1603 Z-score: 2001.2 bits: 381.5 E(32554): 3.8e-105 Smith-Waterman score: 1767; 37.5% identity (65.9% similar) in 779 aa overlap (83-852:204-937) 60 70 80 90 100 110 pF1KE2 STNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNL :.. .:: : : ::.: : .: :: CCDS83 FSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIV---KQGSKGTPQSLGLNL 180 190 200 210 220 230 120 130 140 150 160 170 pF1KE2 FNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKV ... .. .::::::. :.. . .:...: .:. ..... ::::.::.: ::.. : CCDS83 VKIQC-HNEAVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-V 240 250 260 270 280 180 190 200 210 220 230 pF1KE2 TELSSETQRGET-IKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE ::.:. . . :.. : . . : : .:: .:..::...: :.: .:::::.:. CCDS83 LELKSQRKTDSAEISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTS 290 300 310 320 330 340 240 250 260 270 280 290 pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ : . ::.:..:::.: :. . :.. ::::.::.::. ::. : :. :.. : . CCDS83 AMVLQQHRLQIWPGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNK-EHFQD 350 360 370 380 390 400 300 310 320 330 340 350 pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL : : :.: ::.:::::::: :::.::. : .: :: :::...::...: :::.. CCDS83 ECTKLLVGNIVITRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEE 410 420 430 440 450 460 360 370 380 390 400 pF1KE2 NQPMLVSLLKKKRNDNSEAQLAH---LIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPS .::.:. ..:.:: : :.::: :.::. .. .::. :: .:.. :::. CCDS83 DQPLLIHR-PSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPK 470 480 490 500 510 520 410 420 430 440 450 460 pF1KE2 GRQQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQPVSAA ... : :.. : .: : :: :::.. ... .. ::..: :.: ... . CCDS83 QHHSALECLLQRIAKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQEL 530 540 550 560 570 580 470 480 490 500 510 520 pF1KE2 DWSKDI-RTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQ .: :.. : .::. .. : .. :. :. ..: :...:: .:. .. : .... CCDS83 NWVKEVTRDPSILTIP-MHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELK 590 600 610 620 630 640 530 540 550 560 570 580 pF1KE2 ENPA-AFVRAIQQYVDPD--VQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLN .. ..::.::. . . .:.:.::. . . : .::: . ::::: : .::.. CCDS83 DDRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIG 650 660 670 680 690 700 590 600 610 620 630 640 pF1KE2 KQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVN . . :.: :: .:..::::::::.:.::::.:::.:.:: .: ::: :::.: CCDS83 QPTRLRSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASIN 710 720 730 740 750 760 650 660 670 680 690 700 pF1KE2 PRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTL .:.:.:: ..: ...: ::. ..:.:.:.:. :: :: .:.::: ::.::::::. CCDS83 LTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTV 770 780 790 800 810 820 710 720 730 740 750 760 pF1KE2 IEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRN .::.::: .. :. : . .. :.::.:: .. .. .: ::::: : CCDS83 ANYEIPQL-QKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSC 830 840 850 860 870 880 770 780 790 800 810 820 pF1KE2 EWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPC :: :::::::.:.:::: . ::::: CCDS83 EW------------------------------------LTFKLCHMYWNWPGTIRVPAPC 890 900 830 840 850 pF1KE2 QYAHKLTFLVAQSIHKEPSLELANHLFYL .:::::.:: .. .:.::...: ..::.: CCDS83 KYAHKLAFLSGHILHHEPAIQLCENLFFL 910 920 930 >>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa) initn: 1432 init1: 561 opt: 1454 Z-score: 1814.8 bits: 346.9 E(32554): 9.1e-95 Smith-Waterman score: 2193; 39.5% identity (69.7% similar) in 887 aa overlap (1-852:1-882) 10 20 30 pF1KE2 MSGRARVKARGIAR--------SP-------SAT--EVGRIQASPLPRSVDLSN----NE : ::::..::: :: .: ::: : ..:..: : . .. . CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 ASSSNGFLGTSRISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKT .. .: : .. . . : .: . ..:: . . :.:: . ::. . ::.. :: CCDS33 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV--FQDLVVNTRQDMKHVKDSKT 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 GSSGIPVKLVTNLFN-LDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFD :: : :.:..: : .. :: : :.:.: : ::. . :: :: .: . .. . :: CCDS33 GSEGTVVQLLANHFRVISRPQ-WVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFD 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 GAILFLSQKLEEKVTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLS : :.::. :.:. .: : :. . .:.:. ...:: .:: :.. .::.::. .: :. CCDS33 GNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLD 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 MYQIGRNFYNPSEPMEIPQHKLSL--WPGFAISVSYFERKLLFSADVSYKVLRNETVLEF . :.:::.:. .. ... .: :: : :.. :: .: .. . ::::.:.:: ::. .: CCDS33 FEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 MTALCQRTGLSCFTQTCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITY . .. . . . ..::: ::::.:::.:: .:::::. .: ::.: ::..::: CCDS33 IKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITY 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE2 VDYYKQQYDITVSDLNQPMLVSLLKKKRN-DNSEAQLAHLIPELCFLTGLTDQATSDFQL .:::.::. :. .::.::: . :.. ... . :::.:: .:::::. .:... CCDS33 IDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSI 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE2 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQ-ISLTGRIVPSEKI .: .:..::::: :.. : ......: : ..: :. : :.: .. .:. ::.. . .: CCDS33 VKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANI 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE2 LMQDHICQPVSAADWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMG .. .. . : .:::..:: .:::. :..:::: : .. : :. . :. :.. :: CCDS33 VQGRRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMG 480 490 500 510 520 530 520 530 540 550 560 pF1KE2 FNVDYPKIIKVQENPAAFVRAIQQYVDPDVQL---------VMCILPSNQKTYYDSIKKY ... ..:.:. . ... ....:. : .:. :.::::...: :::::.: CCDS33 ITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRY 540 550 560 570 580 590 570 580 590 600 610 620 pF1KE2 LSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVC : . ::.:::::. .::.: . .:.::::.::.::.:: :: :: .. : :::: CCDS33 LCTKCPIPSQCVVKKTLEKV-QARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCF 600 610 620 630 640 650 630 640 650 660 670 680 pF1KE2 KDALSKDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLP .: .... ..: :::.: ..:.:.:.:..:.: ... :.. . .::. : : . ..: CCDS33 HDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMP 660 670 680 690 700 710 690 700 710 720 730 740 pF1KE2 ARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNR .:::: :::::::..:...:. .. :. .. : .. :. :::.:. ::: . . CCDS33 HSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGS 720 730 740 750 760 770 750 760 770 780 790 800 pF1KE2 TVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFK . :::: :::.: : ::::::::...:: . :::.::.:::::: ::.:: .::::. CCDS33 NFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYC 780 790 800 810 820 830 810 820 830 840 850 pF1KE2 LCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLFYL :::.::: :::. :::::.:::::..::.::::.::. :...:::: CCDS33 LCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL 840 850 860 870 880 >>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa) initn: 427 init1: 254 opt: 383 Z-score: 474.5 bits: 98.4 E(32554): 4.2e-20 Smith-Waterman score: 548; 24.7% identity (57.0% similar) in 567 aa overlap (295-831:27-578) 270 280 290 300 310 320 pF1KE2 YKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGLIVLTRYNN---RTYSIDDIDWSVK :.. :: : . . . : : . .. CCDS40 MCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPA 10 20 30 40 50 330 340 350 360 370 pF1KE2 PTHTF--QKRDGTEI--TYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIP .:: : ..: . : ..:....: . .. . : : .. ..... .. ... CCDS40 SHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVA 60 70 80 90 100 110 380 390 400 410 420 430 pF1KE2 ELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLH . :::. :: ..::.: : .:. ::....::: . . .:. : : CCDS40 GQRCIKKLTDNQTST--MIKATA---RSAPD-RQEEISRLVRSANYETDP-FVQEFQFKV 120 130 140 150 160 440 450 460 470 480 490 pF1KE2 FGSQISLTGRIVPSEKILM--QDHICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SD . .:::..:. . . ... : . : :.: .. .. .. : : : .. CCDS40 RDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQ 170 180 190 200 210 220 500 510 520 530 540 pF1KE2 RT--EYVAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLV : : . ..: . ::... . :. .. : . : .. : :. . ... .::. CCDS40 RQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLI 230 240 250 260 270 280 550 560 570 580 590 600 pF1KE2 MCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGEL . :::.. .: . .:. .. . .::: .... : . . ... .... :::: . CCDS40 IVILPGKTPVYAE-VKRVGDTLLGMATQCVQVKNVIKTSPQ--TLSNLCLKINVKLGG-I 290 300 310 320 330 340 610 620 630 640 650 pF1KE2 WAVEIP-------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRT . .: . .. .: :: . . : ... :.:.. . .:. . .:: CCDS40 NNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRP 350 360 370 380 390 400 660 670 680 690 700 710 pF1KE2 MTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAES .. . : .. : ..:: .. :.::: :: ::..::.. .. ::. . . CCDS40 RQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISL 410 420 430 440 450 460 720 730 740 750 760 770 pF1KE2 SSNTSSRLSVIVVRKKCMPRFF----TEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQV .. . .. :::.:. :.: :: : : ::.::.. :. .:::: :.. CCDS40 EKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHA 470 480 490 500 510 520 780 790 800 810 820 830 pF1KE2 ACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVA . .:: :..:.:..::: . :..: ::..::: : ::.::: ::: ..: CCDS40 GIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRAR 530 540 550 560 570 580 840 850 pF1KE2 QSIHKEPSLELANHLFYL CCDS40 YHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 590 600 610 620 >>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa) initn: 436 init1: 254 opt: 383 Z-score: 472.2 bits: 98.4 E(32554): 5.6e-20 Smith-Waterman score: 661; 23.4% identity (54.7% similar) in 806 aa overlap (100-831:24-812) 70 80 90 100 110 120 pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT :. : :.::..: :....:. ..: :.: CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQVEIPK-IDVYLYEVD 10 20 30 40 50 130 140 150 160 170 pF1KE2 YIPDLASRRLR---IALLYSHSELS---NKAKAFDGA-ILFLSQKLEEKVT------ELS :: ::. . . .: ... .. ..:: :. .. : .: : CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP 60 70 80 90 100 110 180 190 200 210 pF1KE2 SETQRGETIKMTI------------------TLKRELPSSSPVC---IQVFNIIFRKILK .: . . .:..: :: . : ..:. ... ....:. : CCDS39 GEGGKDRPFKVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRH-LP 120 130 140 150 160 170 220 230 240 250 260 270 pF1KE2 KLSMYQIGRNFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETV .... .::.:.. : .. : .: :: :: :.... ::: .. . . : CCDS39 SMKYTPVGRSFFSAPEGYDHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPV 180 190 200 210 220 230 280 290 300 310 320 pF1KE2 LEFMTALCQ--------RTGLSCFTQTCEKQLIGLIVLTRYNN---RTYSIDDIDWSVKP ..:: . . : . :.. :: : . . . : : . .. CCDS39 IQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPAS 240 250 260 270 280 290 330 340 350 360 370 pF1KE2 THTF--QKRDGTEI--TYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPE .:: : ..: . : ..:....: . .. . : : .. ..... .. ... CCDS39 HQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAG 300 310 320 330 340 350 380 390 400 410 420 430 pF1KE2 LCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHF . :::. :: ..::.: : .:. ::....::: . . .:. : : CCDS39 QRCIKKLTDNQTS--TMIKATA---RSAPD-RQEEISRLVRSANYETDP-FVQEFQFKVR 360 370 380 390 400 440 450 460 470 480 490 pF1KE2 GSQISLTGRIVPSEKILM--QDHICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SDR . .:::..:. . . ... : . : :.: .. .. .. : : : ..: CCDS39 DEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQR 410 420 430 440 450 460 500 510 520 530 540 pF1KE2 T--EYVAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVM : . ..: . ::... . :. .. : . : .. : :. . ... .::.. CCDS39 QCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLII 470 480 490 500 510 520 550 560 570 580 590 600 pF1KE2 CILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELW :::.. .: . .:. .. . .::: .... : . . ... .... :::: . CCDS39 VILPGKTPVYAE-VKRVGDTLLGMATQCVQVKNVIKTSPQ--TLSNLCLKINVKLGG-IN 530 540 550 560 570 610 620 630 640 650 pF1KE2 AVEIP-------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTM . .: . .. .: :: . . : ... :.:.. . .:. . .:: CCDS39 NILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPR 580 590 600 610 620 630 660 670 680 690 700 710 pF1KE2 TDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESS .. . : .. : ..:: .. :.::: :: ::..::.. .. ::. . . CCDS39 QEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLE 640 650 660 670 680 690 720 730 740 750 760 770 pF1KE2 SNTSSRLSVIVVRKKCMPRFF----TEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVA .. . .. :::.:. :.: :: : : ::.::.. :. .:::: :... CCDS39 KDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAG 700 710 720 730 740 750 780 790 800 810 820 830 pF1KE2 CRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQ .:: :..:.:..::: . :..: ::..::: : ::.::: ::: ..: CCDS39 IQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARY 760 770 780 790 800 810 840 850 pF1KE2 SIHKEPSLELANHLFYL CCDS39 HLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA 820 830 840 850 860 >>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa) initn: 410 init1: 242 opt: 379 Z-score: 467.2 bits: 97.5 E(32554): 1.1e-19 Smith-Waterman score: 679; 24.8% identity (57.4% similar) in 800 aa overlap (100-831:32-811) 70 80 90 100 110 120 pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT :.:: .:: .:.:..:.:. ..:.:.. CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPK-IDIYHYELD 10 20 30 40 50 60 130 140 150 160 170 pF1KE2 YIPDLASRRLR---IALLYSHSE---LSNKAKAFDG-AILFLSQKL---EEKVTELSSET :. ::. . . .: . .... .::: :. .. : ..:: . CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP 70 80 90 100 110 120 180 190 200 210 220 pF1KE2 QRGET--IKMTI-------------TLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGR .:. .:..: .:. .::: ::......:. : .. . .:: CCDS63 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRH-LPSMRYTPVGR 130 140 150 160 170 230 240 250 260 270 280 pF1KE2 NFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTALC- .:.. :: : .: :: :: :.... ::: .. . . :.::. . CCDS63 SFFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLD 180 190 200 210 220 230 290 300 310 320 pF1KE2 ------QRTGLSCFTQTCE--KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--QK :. :. .: . :.. :: : . . : : . .. .:: :. CCDS63 FKSIEEQQKPLTD-SQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQ 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE2 RDG--TEITYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGLT ..: .: : ..:.:... ... . : : .. ..... .. ... . :: CCDS63 ESGQTVECTVAQYFKDRHKLVLRYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKLT 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE2 DQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-LT :. :: ...:.: : .:. ::.....:. . . ::. .. .:. .... .: CCDS63 DNQTS--TMIRATA---RSAPD-RQEEISKLMRSASFNTDPY--VREFGIMVKDEMTDVT 360 370 380 390 400 450 460 470 480 490 pF1KE2 GRIVPSEKILMQDH---ICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SDR--TEYV ::.. .::. . : ::... : :.:. .. .. ...: : : .: :: CCDS63 GRVLQPPSILYGGRNKAIATPVQGV-W--DMRNKQFHTGIEIKVWAIACFAPQRQCTEVH 410 420 430 440 450 460 500 510 520 530 540 550 pF1KE2 AESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPSN .:: . ::... . :. .. : . : .. : :. . ... .:::. :::.. CCDS63 LKSFTEQLRKISRDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYAGLQLVVVILPGK 470 480 490 500 510 520 560 570 580 590 600 610 pF1KE2 QKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPL .: . .:. .. . .::: . : : . ... .... :::: . . .: CCDS63 TPVYAE-VKRVGDTVLGMATQCVQMK--NVQRTTPQTLSNLCLKINVKLGG-VNNILLPQ 530 540 550 560 570 580 620 630 640 650 660 pF1KE2 -------KSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVADC . .. .: :: . . : ... :.:.. . .:. . .:. .. . CCDS63 GRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQD 590 600 610 620 630 640 670 680 690 700 710 720 pF1KE2 LKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSR : ... : ..:: .. :.::: :: ::..::.. ....:. . . . .. . CCDS63 LAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPG 650 660 670 680 690 700 730 740 750 760 770 780 pF1KE2 LSVIVVRKKCMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTVS .. :::.:. :.: :. :. : : : ::.::.. :. .:::: :... .:: CCDS63 ITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSR 710 720 730 740 750 760 790 800 810 820 830 840 pF1KE2 PTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEP :..:.:..::: .. :..: ::..::: : ::.::: ::: ..: CCDS63 PSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKE 770 780 790 800 810 820 850 pF1KE2 SLELANHLFYL CCDS63 HDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA 830 840 850 >>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa) initn: 414 init1: 225 opt: 374 Z-score: 461.6 bits: 96.3 E(32554): 2.2e-19 Smith-Waterman score: 646; 24.7% identity (58.6% similar) in 671 aa overlap (203-831:82-734) 180 190 200 210 220 230 pF1KE2 TELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEP .:.... .:. : .. . .::.:..: : CCDS81 KVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPVGRSFFSPPEG 60 70 80 90 100 110 240 250 260 270 280 pF1KE2 MEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTALCQRTGLSC-- . : .: :: :: :.... ::: .. . . :.::: . . ... CCDS81 YYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRNIDEQP 120 130 140 150 160 170 290 300 310 320 330 pF1KE2 --FTQTCE----KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--QKRDG--TEIT .:.. . :.. :: : . . . : : . .. .:: : ..: .: : CCDS81 KPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECT 180 190 200 210 220 230 340 350 360 370 380 390 pF1KE2 YVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQL ..:.::.:.. .. . : : .. ..... .. ... . :::. :: . CCDS81 VAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQTS--TM 240 250 260 270 280 400 410 420 430 440 450 pF1KE2 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-LTGRIVPSEKI .::.: : .:. ::....::. : . : . .. .:.. .... .:::..:. : CCDS81 IKATA---RSAPD-RQEEISRLMKNASYNLDPY--IQEFGIKVKDDMTEVTGRVLPAP-I 290 300 310 320 330 340 460 470 480 490 500 pF1KE2 LMQDHICQPVSAAD---WSKDIRTCKILNAQSLNTWLILC----SDRTEYVAESFLNCLR :. . ... . : :.: .. :. ...: : : .. : : ..: . :: CCDS81 LQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLR 350 360 370 380 390 510 520 530 540 550 560 pF1KE2 RVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPSNQKTYYDSIK ... . :. .. : . : .. : :. . ... .::.. :::.. .: . .: CCDS81 KISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLIIVILPGKTPVYAE-VK 400 410 420 430 440 450 570 580 590 600 610 pF1KE2 KYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIP-------LKS . .. . .::: .... : . . ... .... :::: . . .: . CCDS81 RVGDTLLGMATQCVQVKNVVKTSPQT--LSNLCLKINVKLGG-INNILVPHQRSAVFQQP 460 470 480 490 500 510 620 630 640 650 660 670 pF1KE2 LMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGAL .. .: :: . . : ... :.:.. . .:. . .:: .. . :. .. : CCDS81 VIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELL 520 530 540 550 560 570 680 690 700 710 720 730 pF1KE2 NKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKK ..:: .. :.::: :: :: .::: ...::. . .. . .. . .. :::.:. CCDS81 IQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKR 580 590 600 610 620 630 740 750 760 770 780 790 pF1KE2 CMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYD :.: .. :. . : : ::.::.. :. .:::: :... .:: :..: :..: CCDS81 HHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWD 640 650 660 670 680 690 800 810 820 830 840 850 pF1KE2 DNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLF :: . :..: ::..::: : ::.::: ::. ..: CCDS81 DNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHI 700 710 720 730 740 750 pF1KE2 YL CCDS81 SGQSNGRDPQALAKAVQVHQDTLRTMYFA 760 770 780 >>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa) initn: 414 init1: 225 opt: 374 Z-score: 460.9 bits: 96.3 E(32554): 2.4e-19 Smith-Waterman score: 708; 24.5% identity (58.1% similar) in 801 aa overlap (100-831:30-809) 70 80 90 100 110 120 pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT :. : :.::..: :..:.:. ..:.:.: CCDS39 MEAGPSGAAAGAYLPPLQQVFQAPRRPGIGTVGKPIKLLANYFEVDIPK-IDVYHYEVD 10 20 30 40 50 130 140 150 160 170 pF1KE2 YIPDLASRRLR---IALLYSHSE---LSNKAKAFDG--------AILFLSQKLEEKVTEL :: ::. . . .: . .... ..:: :. . ..... .:: . CCDS39 IKPDKCPRRVNREVVEYMVQHFKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVT-I 60 70 80 90 100 110 180 190 200 210 220 pF1KE2 SSETQRGETIKMTIT---------LKRELPSSS-PV---CIQVFNIIFRKILKKLSMYQI .: . . .:..: :.. : :.. :: .:.... .:. : .. . . CCDS39 PGEG-KDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPV 120 130 140 150 160 170 230 240 250 260 270 280 pF1KE2 GRNFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTAL ::.:..: : . : .: :: :: :.... ::: .. . . :.::: . CCDS39 GRSFFSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEV 180 190 200 210 220 230 290 300 310 320 pF1KE2 CQRTGLSC----FTQTCE----KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--Q . ... .:.. . :.. :: : . . . : : . .. .:: : CCDS39 LDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQ 240 250 260 270 280 290 330 340 350 360 370 380 pF1KE2 KRDG--TEITYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGL ..: .: : ..:.::.:.. .. . : : .. ..... .. ... . : CCDS39 LESGQTVECTVAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKL 300 310 320 330 340 350 390 400 410 420 430 440 pF1KE2 TDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-L ::. :: ..::.: : .:. ::....::. : . : . .. .:.. .... . CCDS39 TDNQTS--TMIKATA---RSAPD-RQEEISRLMKNASYNLDPY--IQEFGIKVKDDMTEV 360 370 380 390 400 450 460 470 480 490 pF1KE2 TGRIVPSEKILMQDHICQPVSAAD---WSKDIRTCKILNAQSLNTWLILC----SDRTEY :::..:. ::. . ... . : :.: .. :. ...: : : .. : CCDS39 TGRVLPAP-ILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREE 410 420 430 440 450 460 500 510 520 530 540 550 pF1KE2 VAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPS : ..: . ::... . :. .. : . : .. : :. . ... .::.. :::. CCDS39 VLKNFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLIIVILPG 470 480 490 500 510 520 560 570 580 590 600 610 pF1KE2 NQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIP . .: . .:. .. . .::: .... : . . ... .... :::: . . .: CCDS39 KTPVYAE-VKRVGDTLLGMATQCVQVKNVVKTSPQ--TLSNLCLKINVKLGG-INNILVP 530 540 550 560 570 620 630 640 650 660 pF1KE2 -------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVAD . .. .: :: . . : ... :.:.. . .:. . .:: .. . CCDS39 HQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIE 580 590 600 610 620 630 670 680 690 700 710 720 pF1KE2 CLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSS :. .. : ..:: .. :.::: :: :: .::: ...::. . .. . .. . CCDS39 DLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQP 640 650 660 670 680 690 730 740 750 760 770 780 pF1KE2 RLSVIVVRKKCMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTV .. :::.:. :.: .. :. . : : ::.::.. :. .:::: :... .:: CCDS39 GITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTS 700 710 720 730 740 750 790 800 810 820 830 840 pF1KE2 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE :..: :..::: . :..: ::..::: : ::.::: ::. ..: CCDS39 RPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDK 760 770 780 790 800 810 850 pF1KE2 PSLELANHLFYL CCDS39 EHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA 820 830 840 850 852 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 00:11:28 2016 done: Mon Nov 7 00:11:29 2016 Total Scan time: 3.730 Total Display time: 0.300 Function used was FASTA [36.3.4 Apr, 2011]