FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4251, 973 aa
1>>>pF1KB4251 973 - 973 aa - 973 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.7185+/-0.00103; mu= 10.4360+/- 0.062
mean_var=125.7459+/-25.037, 0's: 0 Z-trim(108.3): 21 B-trim: 0 in 0/49
Lambda= 0.114374
statistics sampled from 10107 (10124) to 10107 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.656), E-opt: 0.2 (0.311), width: 16
Scan time: 4.350
The best scores are: opt bits E(32554)
CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 6629 1105.7 0
CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 5996 1001.3 0
CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 2324 395.3 2.7e-109
CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 1952 334.0 7.9e-91
CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 1791 307.4 8.1e-83
CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 421 81.3 6.8e-15
CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 421 81.3 8.9e-15
CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 419 81.0 1e-14
CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 419 81.0 1.1e-14
CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 412 79.8 2.5e-14
CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 356 70.6 1.5e-11
>>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa)
initn: 6629 init1: 6629 opt: 6629 Z-score: 5914.0 bits: 1105.7 E(32554): 0
Smith-Waterman score: 6629; 100.0% identity (100.0% similar) in 973 aa overlap (1-973:1-973)
10 20 30 40 50 60
pF1KB4 MDPFRPSFRGQSPIHPSQCQAVRMPGCWPQASKPLDPALGRGAPAGRGHVFGKPEEPSTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 MDPFRPSFRGQSPIHPSQCQAVRMPGCWPQASKPLDPALGRGAPAGRGHVFGKPEEPSTQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 RGPAQRESVGLVSMFRGLGIETVSKTPLKREMLPSGRGILGRGLSANLVRKDREELSPTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 RGPAQRESVGLVSMFRGLGIETVSKTPLKREMLPSGRGILGRGLSANLVRKDREELSPTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 WDPKVLAAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 WDPKVLAAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 PPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 YQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQVLELKSQRKTDSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 YQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQVLELKSQRKTDSA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 EISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 EISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIW
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEHFQDECTKLLVGNIVIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEHFQDECTKLLVGNIVIT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 RYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 RYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 DNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 DNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 KNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSILT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 KNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSILT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 IPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 IPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 GAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 GAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 INCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 INCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 HQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 HQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
910 920 930 940 950 960
970
pF1KB4 EPAIQLCENLFFL
:::::::::::::
CCDS60 EPAIQLCENLFFL
970
>>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa)
initn: 5996 init1: 5996 opt: 5996 Z-score: 5349.8 bits: 1001.3 E(32554): 0
Smith-Waterman score: 6286; 96.3% identity (96.3% similar) in 973 aa overlap (1-973:1-937)
10 20 30 40 50 60
pF1KB4 MDPFRPSFRGQSPIHPSQCQAVRMPGCWPQASKPLDPALGRGAPAGRGHVFGKPEEPSTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MDPFRPSFRGQSPIHPSQCQAVRMPGCWPQASKPLDPALGRGAPAGRGHVFGKPEEPSTQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 RGPAQRESVGLVSMFRGLGIETVSKTPLKREMLPSGRGILGRGLSANLVRKDREELSPTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 RGPAQRESVGLVSMFRGLGIETVSKTPLKREMLPSGRGILGRGLSANLVRKDREELSPTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 WDPKVLAAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 WDPKVLAAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 PPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 YQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQVLELKSQRKTDSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 YQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQVLELKSQRKTDSA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 EISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 EISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIW
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEHFQDECTKLLVGNIVIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEHFQDECTKLLVGNIVIT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 RYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 RYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 DNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 DNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 KNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSILT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 KNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSILT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 IPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 IPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 GAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 GAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 INCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 INCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 HQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 HQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC
::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEW--------------
850 860 870 880
910 920 930 940 950 960
pF1KB4 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
::::::::::::::::::::::::::::::::::::::
CCDS83 ----------------------LTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
890 900 910 920
970
pF1KB4 EPAIQLCENLFFL
:::::::::::::
CCDS83 EPAIQLCENLFFL
930
>>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa)
initn: 1806 init1: 690 opt: 2324 Z-score: 2075.8 bits: 395.3 E(32554): 2.7e-109
Smith-Waterman score: 2324; 43.0% identity (74.6% similar) in 763 aa overlap (216-973:104-861)
190 200 210 220 230 240
pF1KB4 SPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNE-AVYQYH
: ::.: :. : .. . . :.::::
CCDS92 LSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYH
80 90 100 110 120 130
250 260 270 280 290 300
pF1KB4 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-VLELKSQRKTDSAEIS
. ..: .: . .: ..: .:. . :. ::::.::.:: .::: : :. :. . .. ..
CCDS92 IDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTEVFSKTR-NGEDVR
140 150 160 170 180 190
310 320 330 340 350 360
pF1KB4 IKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIWPGY
: : .:. : : : :. :::..:::..:..... .:::.:.:.. . . .::: ::::.
CCDS92 ITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPIDIPSHRLVIWPGF
200 210 220 230 240 250
370 380 390 400 410 420
pF1KB4 AASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQDECTKLLVGNIVITRY
..:: . .....: .::::::.:.. ::: : .:.:..:: ::.. .: :.: .:.:.:
CCDS92 TTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKY
260 270 280 290 300 310
430 440 450 460 470 480
pF1KB4 NNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQDN
::.:::.::.::...::..: .::.:..::::: :.:. . . ::.:. .:..:. .
CCDS92 NNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQPVLVSQPKRRR-G
320 330 340 350 360 370
490 500 510 520 530 540
pF1KB4 HGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIAKN
: : : .:.::: ..::. .::..:: .::::: . :.:.:.. . :.. : ::
CCDS92 PGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKN
380 390 400 410 420 430
550 560 570 580 590 600
pF1KB4 EAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSF-ITSQELNWVKEVTRDPSILTI
. . :: ::: ..... .. ::.: :.:. . .: . : .: ::. : : .
CCDS92 DNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSKETRGAPLISVK
440 450 460 470 480 490
610 620 630 640 650 660
pF1KB4 PMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTLG
:. : :.: .: .. : :.. : :.. .::.: .:. ::: :.:.:..:. .
CCDS92 PLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEV-DDRTEAYLRVLQQKVT
500 510 520 530 540 550
670 680 690 700 710 720
pF1KB4 AEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQI
:. :.:::.. . : : : :::: :.. :.::: : .::.:. . ..: :: ::.
CCDS92 AD--TQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQM
560 570 580 590 600
730 740 750 760 770 780
pF1KB4 NCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMPH
:::.::::: :::::: .:..:.: ::: . : ::..::::::: .:.:.:: .::
CCDS92 NCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRG
610 620 630 640 650 660
790 800 810 820 830 840
pF1KB4 QEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF-
::.::.::.:: ..:. . :. .: .:.::::::.::::::..:::.::. :....
CCDS92 QELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIG
670 680 690 700 710 720
850 860 870 880 890 900
pF1KB4 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC
..:.:...:.::.:...: .. . . .: ::::.: .: :: ::..... ::.:
CCDS92 RGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS
730 740 750 760 770 780
910 920 930 940 950 960
pF1KB4 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
:::: . ....:.:::.::::.::::.:.::::.:::::::.:::::::: :. .:.
CCDS92 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR
790 800 810 820 830 840
970
pF1KB4 EPAIQLCENLFFL
:: ..: . :..:
CCDS92 EPNLSLSNRLYYL
850 860
>>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa)
initn: 1749 init1: 554 opt: 1952 Z-score: 1744.1 bits: 334.0 E(32554): 7.9e-91
Smith-Waterman score: 1952; 39.4% identity (68.9% similar) in 779 aa overlap (204-973:83-852)
180 190 200 210 220 230
pF1KB4 FSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIV---KQGSKGTPQSLGLNL
:.. .:: : : ::.: : .: ::
CCDS31 STNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNL
60 70 80 90 100 110
240 250 260 270 280
pF1KB4 VKIQCHNE-AVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-V
... .. .::::::. :.. . .:...: .:. ..... ::::.::.: ::.. :
CCDS31 FNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKV
120 130 140 150 160 170
290 300 310 320 330 340
pF1KB4 LELKSQRKTDSAEISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTS
::.:. . . :.. : . . : : .:: .:..::...: :.: .:::::.:.
CCDS31 TELSSETQR-GETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE
180 190 200 210 220 230
350 360 370 380 390 400
pF1KB4 AMVLQQHRLQIWPGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQD
: . ::.:..:::.: :. . :.. ::::.::.::. ::. : :. :.. : .
CCDS31 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ
240 250 260 270 280 290
410 420 430 440 450 460
pF1KB4 ECTKLLVGNIVITRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEE
: : :.: ::.:::::::: :::.::. : .: :: :::...::...: :::..
CCDS31 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL
300 310 320 330 340 350
470 480 490 500 510 520
pF1KB4 DQPLLIHR-PSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPK
.::.:. ..:.:: : :.::: :.::. .. .::. :: .:.. :::.
CCDS31 NQPMLVSLLKKKRNDNSEAQLAH---LIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPS
360 370 380 390 400
530 540 550 560 570 580
pF1KB4 QHHSALECLLQRIAKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQEL
... : :.. : .: : :: :::.. ... .. ::..: :.: ... .
CCDS31 GRQQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQPVSAA
410 420 430 440 450 460
590 600 610 620 630 640
pF1KB4 NWVKEVTRDPSILTIP-MHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELK
.: :.. : .::. .. : .. :. :. ..: :...:: .:. .. : ....
CCDS31 DWSKDI-RTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQ
470 480 490 500 510 520
650 660 670 680 690 700
pF1KB4 DDRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIG
.. ..::.::. . . .:.:.::. . . : .::: . ::::: : .::..
CCDS31 ENPA-AFVRAIQQYVDPD--VQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLN
530 540 550 560 570 580
710 720 730 740 750 760
pF1KB4 QPTRLRSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASIN
. . :.: :: .:..::::::::.:.::::.:::.:.:: .: ::: :::.:
CCDS31 KQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVN
590 600 610 620 630 640
770 780 790 800 810 820
pF1KB4 LTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTV
.:.:.:: ..: ...: ::. ..:.:.:.:. :: :: .:.::: ::.::::::.
CCDS31 PRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTL
650 660 670 680 690 700
830 840 850 860 870 880
pF1KB4 ANYEIPQLQKCF-EAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSC
.::.::: . :. : . .. :.::.:: .. .. .: ::::: :
CCDS31 IEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRN
710 720 730 740 750 760
890 900 910 920 930 940
pF1KB4 EWVDFYLLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPC
:: ::::... . .: ::.: . . .:.:::::::::::::.:.:::: . :::::
CCDS31 EWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPC
770 780 790 800 810 820
950 960 970
pF1KB4 KYAHKLAFLSGHILHHEPAIQLCENLFFL
.:::::.:: .. .:.::...: ..::.:
CCDS31 QYAHKLTFLVAQSIHKEPSLELANHLFYL
830 840 850
>>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa)
initn: 1322 init1: 809 opt: 1791 Z-score: 1600.3 bits: 307.4 E(32554): 8.1e-83
Smith-Waterman score: 1799; 34.7% identity (66.3% similar) in 833 aa overlap (157-973:65-882)
130 140 150 160 170 180
pF1KB4 AAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSS
: :.:: . . : : : : : .
CCDS33 TQEPPQLQSTPRPLQEEVPVVRPLQPRAARGGAGGGAQSQGVKEP----GPEAG---LHT
40 50 60 70 80
190 200 210 220 230 240
pF1KB4 PPALPQSPLHSPDRPLVLTVEHKEKELI-VKQGSKGTPQSLGLNLVKIQCHNEAV-YQYH
: : . . . . ::..... :.. : ::.:: .: : .. . . : :.:.
CCDS33 AP-LQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYN
90 100 110 120 130 140
250 260 270 280 290 300
pF1KB4 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYL--PVKLQQVLELKSQRKTDSAEI
: ..:..: ..: .: .:. :. :::. : : :.: ..: :.. . :. .
CCDS33 VDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNSLLLSRPLKERRVEWLSTTK--DKNIV
150 160 170 180 190 200
310 320 330 340 350 360
pF1KB4 SIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQH--RLQIW
.: ....: : : : :. .::..:::..::::.. ::::.: .:. : .: :.::
CCDS33 KITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRHGTSLEIW
210 220 230 240 250 260
370 380 390 400 410
pF1KB4 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKE-HFQDECTKLLVGNIVI
::..:. . .... : ::::::..: . . : .. : . ....: :. :.:.::.
CCDS33 LGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKRTSAQAQTGNIREEVTNKLIGSIVL
270 280 290 300 310 320
420 430 440 450 460 470
pF1KB4 TRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSER
:.:::.:::.::.::...:.:.:. :::..::...:: ... : . ::::. . .
CCDS33 TKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDYYRQQHKEIVTVKKQPLLVSQGRWK
330 340 350 360 370 380
480 490 500 510 520 530
pF1KB4 QDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRI
. : . :::.:.: :::. ... ::. .:.::.. :::...: .:. ... .
CCDS33 KGLTGTQ-REPILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTL
390 400 410 420 430 440
540 550 560 570 580 590
pF1KB4 AKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSIL
:. . . :. : :... . .. :::: : .... .: .:. . : .
CCDS33 QDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQGRRMVKANSQGDWSREIRELPLLN
450 460 470 480 490 500
600 610 620 630 640 650
pF1KB4 TIPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQST
..:.: : ..: . . .: : . :.....:.:. :.: .:. : ..:. :...
CCDS33 AMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITMKPAEMIEVDGD-ANSYIDTLRKY
510 520 530 540 550 560
660 670 680 690 700 710
pF1KB4 LGAEGKIQM-------VVCIIMGPRDDL--YGAIKKLCCVQSPVPSQVVNVRTIGQPTRL
.. : :.::. : :: : .::. :.. :.::: : .:. . ..
CCDS33 TRPTLQMGMSCLLVFKVICIL--PNDDKRRYDSIKRYLCTKCPIPSQCVVKKTL-EKVQA
570 580 590 600 610
720 730 740 750 760 770
pF1KB4 RSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTK
:... :: :.:::.:: :: :. ... : .:.: .:: ..:..::::: : :::
CCDS33 RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIVNRQKSIAGFVASTNAELTK
620 630 640 650 660 670
780 790 800 810 820 830
pF1KB4 WYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEI
:::. :.: .:.: :..:: ..: . . . .:....::::::.::::... ..:
CCDS33 WYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEA
680 690 700 710 720 730
840 850 860 870 880 890
pF1KB4 PQLQKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFY
... .... . .. .::.:.:.: ..: .:: .: ::::.: .: :: ::.
CCDS33 KKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNPPPGTVIDVELTRNEWYDFF
740 750 760 770 780 790
900 910 920 930 940 950
pF1KB4 LLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKL
.... :..: :::: . .: .:::: .::::. :::::.: :: :::::::.:::::
CCDS33 IVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKL
800 810 820 830 840 850
960 970
pF1KB4 AFLSGHILHHEPAIQLCENLFFL
:.: :. .:.:: .: ::.:
CCDS33 AYLVGQSIHQEPNRSLSTRLFYL
860 870 880
>>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa)
initn: 407 init1: 202 opt: 421 Z-score: 380.9 bits: 81.3 E(32554): 6.8e-15
Smith-Waterman score: 552; 25.2% identity (56.4% similar) in 615 aa overlap (389-961:2-588)
360 370 380 390 400 410
pF1KB4 IWPGYAASIRRTDGGLFLLADVSHKVIRNDC-VLDVMHAIYQQNK---EHFQDECTKLLV
: :::. : : .: . . . . :: .
CCDS40 MCEVLDI-HNIDEQPRPLTDSHRVKFTKEIK
10 20 30
420 430 440 450 460
pF1KB4 G-NIVITRYNN--RTYRIDDVDWNKTPKDSFTMS--DGKEI--TFLEYYSKNYGITVKEE
: .. .:. .. : ::. .: . ...: .. .:. . : .:. ..: . .:
CCDS40 GLKVEVTHCGTMRRKYRVCNVTRRPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYP
40 50 60 70 80 90
470 480 490 500 510 520
pF1KB4 DQPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKD--LAQQINLSP
: : . :. : : : ....: .. .. . : . .:. .
CCDS40 HLPCL---------QVGQEQKHTYLPLEVCNIVAG-----QRCIKKLTDNQTSTMIKATA
100 110 120 130
530 540 550 560 570 580
pF1KB4 KQHHSALECLLQRIAKNEAATNELMR-WGLRLQKDVHKIEGRVLP--MERINLKNTSFIT
.. . : . . . . . :. ... . .... .. .. ::::: : . . .: . :
CCDS40 RSAPDRQEEISRLVRSANYETDPFVQEFQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVAT
140 150 160 170 180 190
590 600 610 620 630
pF1KB4 SQELNWVKEVTRDPSILT-IPMHFWAL--FYPKRAMDQARELV-----NMLEKIAGPIGM
.. : : .. : . ...::. : .: : :: . ..:.::. ::
CCDS40 PSHGVWD---MRGKQFHTGVEIKMWAIACFATQR---QCREEILKGFTDQLRKISKDAGM
200 210 220 230 240 250
640 650 660 670 680 690
pF1KB4 RMS-PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQ
.. : . . . : .: . : ...: .. .:... :. : . .:. .:.. .
CCDS40 PIQGQPCFCKYAQGADSVEPMFRHLKNTYSG---LQLIIVILPG-KTPVYAEVKRVGDTL
260 270 280 290 300
700 710 720 730 740
pF1KB4 SPVPSQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIPLKQ-------LMVIGM
. .: :.:... . . .. ... :.:: :::: . .. .: .. .. .:
CCDS40 LGMATQCVQVKNVIKTSP--QTLSNLCLKINVKLGG-INNILVPHQRPSVFQQPVIFLGA
310 320 330 340 350 360
750 760 770 780 790 800
pF1KB4 DVYHDPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEV
:: : :. : . :... :.:.. ... . : : :.:::...: . : .::.
CCDS40 DVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPRQEIIQDLASMVRELLIQFYKS
370 380 390 400 410 420
810 820 830 840 850 860
pF1KB4 NHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFVVQKKISTNLY
.. : .:. ::::::.::.. : ::. ... :. ..::: .. .::::. : :.
CCDS40 TRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLEKDYQPGITYIVVQKRHHTRLF
430 440 450 460 470 480
870 880 890 900 910
pF1KB4 LAAPQNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYVCVLNTANLSP
: . : . : ::.:: :: :::: .: :: . :.:: . . ..
CCDS40 CADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTA
490 500 510 520 530 540
920 930 940 950 960 970
pF1KB4 DHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQLCENLFFL
:..: ::..::: : .. .::: ::: .:: . :.. .:
CCDS40 DELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNG
550 560 570 580 590 600
CCDS40 RDPQALAKAVQIHQDTLRTMYFA
610 620
>>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa)
initn: 407 init1: 202 opt: 421 Z-score: 378.7 bits: 81.3 E(32554): 8.9e-15
Smith-Waterman score: 600; 24.9% identity (52.4% similar) in 865 aa overlap (185-961:5-822)
160 170 180 190 200 210
pF1KB4 PLGRAAGGISREVDKPPCTFSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELI
:. :: : : : ::
CCDS39 MEIGSAGPAGAQPLLMVPRRP-------------
10 20
220 230 240 250 260 270
pF1KB4 VKQGSKGTPQSLGLNLVKIQCHNEAVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAF
:. : : .: : ... . :: :.: ..:. .: . : .. .:: :
CCDS39 -GYGTMGKPIKLLANCFQVEIPKIDVYLYEVDIKPD-KCPRRVNREVVDSMVQHFKVTIF
30 40 50 60 70
280 290 300 310
pF1KB4 -------DGS-ILY----LPVKLQQV---LELKSQRKTDSA-EISIKI-------QMTKI
::. :: ::: : . : .. : ..:::. . ..
CCDS39 GDRRPVYDGKRSLYTANPLPVATTGVDLDVTLPGEGGKDRPFKVSIKFVSRVSWHLLHEV
80 90 100 110 120 130
320 330 340 350
pF1KB4 L------------EPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRL--
: .: : . .::.:. . . . :::.:. :: .: :
CCDS39 LTGRTLPEPLELDKPISTNPVHAVDVVLRH-LPSMKYTPVGRSFF---SAPEGYDHPLGG
140 150 160 170 180 190
360 370 380 390 400
pF1KB4 --QIWPGYAASIRRTDGGLFLLADVS-------HKVIRNDC-VLDVMHAIYQQNK---EH
..: :. :.: . ..: ::: . ::. : :::. : : .: . .
CCDS39 GREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIQFMCEVLDI-HNIDEQPRPLTDS
200 210 220 230 240 250
410 420 430 440 450
pF1KB4 FQDECTKLLVG-NIVITRYNN--RTYRIDDVDWNKTPKDSFTMS--DGKEI--TFLEYYS
. . :: . : .. .:. .. : ::. .: . ...: .. .:. . : .:.
CCDS39 HRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPASHQTFPLQLENGQTVERTVAQYFR
260 270 280 290 300 310
460 470 480 490 500 510
pF1KB4 KNYGITVKEEDQPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKD-
..: . .: : : . :. : : : ....: .. .. . :
CCDS39 EKYTLQLKYPHLPCL---------QVGQEQKHTYLPLEVCNIVAG-----QRCIKKLTDN
320 330 340 350 360
520 530 540 550 560 570
pF1KB4 -LAQQINLSPKQHHSALECLLQRIAKNEAATNELMR-WGLRLQKDVHKIEGRVLP--MER
. .:. . .. . : . . . . . :. ... . .... .. .. ::::: : .
CCDS39 QTSTMIKATARSAPDRQEEISRLVRSANYETDPFVQEFQFKVRDEMAHVTGRVLPAPMLQ
370 380 390 400 410 420
580 590 600 610 620
pF1KB4 INLKNTSFITSQELNWVKEVTRDPSILT-IPMHFWAL--FYPKRAMDQARELV-----NM
. .: . : .. : : .. : . ...::. : .: : :: . ..
CCDS39 YGGRNRTVATPSHGVWD---MRGKQFHTGVEIKMWAIACFATQR---QCREEILKGFTDQ
430 440 450 460 470
630 640 650 660 670 680
pF1KB4 LEKIAGPIGMRMS-PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLY
:.::. :: .. : . . . : .: . : ...: .. .:... :. : . .:
CCDS39 LRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG---LQLIIVILPG-KTPVY
480 490 500 510 520 530
690 700 710 720 730
pF1KB4 GAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIPLKQ---
. .:.. . . .: :.:... . . .. ... :.:: :::: . .. .: ..
CCDS39 AEVKRVGDTLLGMATQCVQVKNVIKTSP--QTLSNLCLKINVKLGG-INNILVPHQRPSV
540 550 560 570 580
740 750 760 770 780 790
pF1KB4 ----LMVIGMDVYHDPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCL
.. .: :: : :. : . :... :.:.. ... . : : :.:::...: .
CCDS39 FQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPRQEIIQDLASMV
590 600 610 620 630 640
800 810 820 830 840 850
pF1KB4 VGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFV
: .::. .. : .:. ::::::.::.. : ::. ... :. ..::: .. .:
CCDS39 RELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLEKDYQPGITYIV
650 660 670 680 690 700
860 870 880 890 900
pF1KB4 VQKKISTNLYLAAPQNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYV
:::. : :. : . : . : ::.:: :: :::: .: :: . :.::
CCDS39 VQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAGIQGTSRPSHYH
710 720 730 740 750 760
910 920 930 940 950 960
pF1KB4 CVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQL
. . .. :..: ::..::: : .. .::: ::: .:: . :.. .:
CCDS39 VLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAE
770 780 790 800 810 820
970
pF1KB4 CENLFFL
CCDS39 GSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
830 840 850 860
>>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa)
initn: 312 init1: 195 opt: 419 Z-score: 377.6 bits: 81.0 E(32554): 1e-14
Smith-Waterman score: 620; 25.2% identity (57.2% similar) in 671 aa overlap (339-961:100-744)
310 320 330 340 350 360
pF1KB4 TKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMV--LQQHRLQIWPGYAAS
:::.:..: .. : : ..: :. :
CCDS81 LVSGQIPVPLESVQALDVAMRHLASMRYTPVGRSFFSPPEGYYHPLGGGR-EVWFGFHQS
70 80 90 100 110 120
370 380 390 400 410
pF1KB4 IRRTDGGLFLLADVS-------HKVIRNDC-VLDVMHAIYQQNKEHFQDE---CTKLLVG
.: . ..: ::: . ::. : :::. . : .: : ... :: . :
CCDS81 VRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRN-IDEQPKPLTDSQRVRFTKEIKG
130 140 150 160 170 180
420 430 440 450 460
pF1KB4 -NIVITRYNN--RTYRIDDVDWNKTPKDSFTMS--DGK--EITFLEYYSKNYGITVKEED
.. .:. .. : ::. .: . ...: .. .:. : : .:....:.. .:
CCDS81 LKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECTVAQYFKQKYNLQLKYPH
190 200 210 220 230 240
470 480 490 500 510 520
pF1KB4 QPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKD--LAQQINLSPK
: : . :. : : : ....: .. .. . : . .:. . .
CCDS81 LPCL---------QVGQEQKHTYLPLEVCNIVAG-----QRCIKKLTDNQTSTMIKATAR
250 260 270 280 290
530 540 550 560 570 580
pF1KB4 QHHSALECLLQRIAKNEAATNE--LMRWGLRLQKDVHKIEGRVLPMERINL--KNTSFIT
. . : . .:. :: . . . ....:.... :. .. ::::: .. .: .. :
CCDS81 SAPDRQEEI-SRLMKNASYNLDPYIQEFGIKVKDDMTEVTGRVLPAPILQYGGRNRAIAT
300 310 320 330 340 350
590 600 610 620 630
pF1KB4 SQELNWVKEVTRDPSILTIPMHFWAL--FYPKRAMDQA--RELVNMLEKIAGPIGMRMS-
.. : .. : .. ::. : :.. . ......:.::. :: ..
CCDS81 PNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLRKISKDAGMPIQG
360 370 380 390 400 410
640 650 660 670 680 690
pF1KB4 PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVP
: . . . : .: . : ...: .. .:... :. : . .:. .:.. . .
CCDS81 QPCFCKYAQGADSVEPMFRHLKNTYSG---LQLIIVILPG-KTPVYAEVKRVGDTLLGMA
420 430 440 450 460
700 710 720 730 740
pF1KB4 SQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIPLKQ-------LMVIGMDVYH
.: :.:... . . .. ... :.:: :::: . .. .: .. .. .: :: :
CCDS81 TQCVQVKNVVKTSP--QTLSNLCLKINVKLGG-INNILVPHQRSAVFQQPVIFLGADVTH
470 480 490 500 510 520
750 760 770 780 790 800
pF1KB4 DPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCL
:. : . :... :.:.. ... . : : :.:::...:. . : .::. ..
CCDS81 PPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELLIQFYKSTRFK
530 540 550 560 570 580
810 820 830 840 850 860
pF1KB4 PEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFVVQKKISTNLYLAAP
: .:. ::::: .::: . .::. .. :.. ..::: .. .::::. : :. :
CCDS81 PTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKRHHTRLFCADK
590 600 610 620 630 640
870 880 890 900 910 920
pF1KB4 QNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYVCVLNTANLSPDHMQ
.. . . : ::.:: .:: :::: .: :: . :.:: . . .. :..:
CCDS81 NERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWDDNRFTADELQ
650 660 670 680 690 700
930 940 950 960 970
pF1KB4 RLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQLCENLFFL
::..::: : .. .::: ::. .:: . :.. .:
CCDS81 ILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHISGQSNGRDPQ
710 720 730 740 750 760
CCDS81 ALAKAVQVHQDTLRTMYFA
770 780
>>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa)
initn: 312 init1: 195 opt: 419 Z-score: 377.0 bits: 81.0 E(32554): 1.1e-14
Smith-Waterman score: 649; 23.9% identity (55.6% similar) in 856 aa overlap (180-961:4-819)
150 160 170 180 190 200
pF1KB4 DASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSSPPALP--QSPLHSPDRPLVLTVE
:: .. :: :. ...: :: .
CCDS39 MEAGPSGAAAGAYLPPLQQVFQAPRRPGI----
10 20
210 220 230 240 250 260
pF1KB4 HKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAVYQYHVTFSPN-----VECKSMRFGMLK
:. : : .: : ... . ::.:.: ..:. :. . ... . .
CCDS39 ----------GTVGKPIKLLANYFEVDIPKIDVYHYEVDIKPDKCPRRVNREVVEYMVQH
30 40 50 60 70
270 280 290 300 310
pF1KB4 DHQAVTGNVT-AFDG-----SILYLPVKLQQV---LELKSQRKTDSAEISIK---IQMTK
. . :. ..:: .. ::. ..: . . .. : ..::: : .
CCDS39 FKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVTIPGEGKDRIFKVSIKWLAIVSWR
80 90 100 110 120 130
320 330 340 350 360
pF1KB4 ILEPC---SDLCIPFYNV-VFRRVMK-LLDMKL--VGRNFYDPTSAMV--LQQHRLQIWP
.:. ... .:. .: .. .:. : .:. :::.:..: .. : : ..:
CCDS39 MLHEALVSGQIPVPLESVQALDVAMRHLASMRYTPVGRSFFSPPEGYYHPLGGGR-EVWF
140 150 160 170 180 190
370 380 390 400 410
pF1KB4 GYAASIRRTDGGLFLLADVS-------HKVIRNDC-VLDVMHAIYQQNKEHFQDE---CT
:. :.: . ..: ::: . ::. : :::. . : .: : ... :
CCDS39 GFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRN-IDEQPKPLTDSQRVRFT
200 210 220 230 240 250
420 430 440 450 460
pF1KB4 KLLVG-NIVITRYNN--RTYRIDDVDWNKTPKDSFTMS--DGK--EITFLEYYSKNYGIT
: . : .. .:. .. : ::. .: . ...: .. .:. : : .:....:..
CCDS39 KEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECTVAQYFKQKYNLQ
260 270 280 290 300 310
470 480 490 500 510 520
pF1KB4 VKEEDQPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKD--LAQQI
.: : : . :. : : : ....: .. .. . : . .:
CCDS39 LKYPHLPCL---------QVGQEQKHTYLPLEVCNIVAG-----QRCIKKLTDNQTSTMI
320 330 340 350 360
530 540 550 560 570
pF1KB4 NLSPKQHHSALECLLQRIAKNEAATNE--LMRWGLRLQKDVHKIEGRVLPMERINL--KN
. . .. . : . .:. :: . . . ....:.... :. .. ::::: .. .:
CCDS39 KATARSAPDRQEEI-SRLMKNASYNLDPYIQEFGIKVKDDMTEVTGRVLPAPILQYGGRN
370 380 390 400 410 420
580 590 600 610 620 630
pF1KB4 TSFITSQELNWVKEVTRDPSILTIPMHFWAL--FYPKRAMDQA--RELVNMLEKIAGPIG
.. : .. : .. : .. ::. : :.. . ......:.::. :
CCDS39 RAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLRKISKDAG
430 440 450 460 470 480
640 650 660 670 680 690
pF1KB4 MRMS-PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCV
: .. : . . . : .: . : ...: .. .:... :. : . .:. .:.. .
CCDS39 MPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG---LQLIIVILPG-KTPVYAEVKRVGDT
490 500 510 520 530
700 710 720 730 740
pF1KB4 QSPVPSQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIPLKQ-------LMVIG
. .: :.:... . . .. ... :.:: :::: . .. .: .. .. .:
CCDS39 LLGMATQCVQVKNVVKTSP--QTLSNLCLKINVKLGG-INNILVPHQRSAVFQQPVIFLG
540 550 560 570 580 590
750 760 770 780 790 800
pF1KB4 MDVYHDPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYE
:: : :. : . :... :.:.. ... . : : :.:::...:. . : .::.
CCDS39 ADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELLIQFYK
600 610 620 630 640 650
810 820 830 840 850 860
pF1KB4 VNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFVVQKKISTNL
.. : .:. ::::: .::: . .::. .. :.. ..::: .. .::::. : :
CCDS39 STRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKRHHTRL
660 670 680 690 700 710
870 880 890 900 910
pF1KB4 YLAAPQNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYVCVLNTANLS
. : .. . . : ::.:: .:: :::: .: :: . :.:: . . ..
CCDS39 FCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWDDNRFT
720 730 740 750 760 770
920 930 940 950 960 970
pF1KB4 PDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQLCENLFFL
:..: ::..::: : .. .::: ::. .:: . :.. .:
CCDS39 ADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHISGQSN
780 790 800 810 820 830
CCDS39 GRDPQALAKAVQVHQDTLRTMYFA
840 850
>>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa)
initn: 368 init1: 206 opt: 412 Z-score: 370.7 bits: 79.8 E(32554): 2.5e-14
Smith-Waterman score: 609; 24.5% identity (54.3% similar) in 858 aa overlap (177-961:7-821)
150 160 170 180 190 200
pF1KB4 GSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTV
:. .:: . :: . .. : ::
CCDS63 MYSGAGPALAPP--APPPPIQGYAFKPPPRPDF---
10 20 30
210 220 230 240 250 260
pF1KB4 EHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAVYQYHVTFSPNVEC-----KSMRFGML
:..: .: :. ... . .:.:.. ..:. .: . . :.
CCDS63 -----------GTSGRTIKLQANFFEMDIPKIDIYHYELDIKPE-KCPRRVNREIVEHMV
40 50 60 70
270 280 290 300 310
pF1KB4 KDHQA-VTGNVT-AFDG-----SILYLPV---KLQQVLELKSQRKTDSAEISIKIQMTKI
. .. . :. .::: . . ::. :.. . : .. : ..:::
CCDS63 QHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLPGEGKDRIFKVSIKWVSCVS
80 90 100 110 120 130
320 330 340 350
pF1KB4 LEPCSDL------CIPFYNV-VFRRVMKLL-DMKL--VGRNFYDPTSAMV--LQQHRLQI
:. : .:: .. .. ::. : .:. :::.:. . . : : ..
CCDS63 LQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRSFFTASEGCSNPLGGGR-EV
140 150 160 170 180 190
360 370 380 390 400
pF1KB4 WPGYAASIRRTDGGLFLLADVS-------HKVIRNDC-VLDVMHAIYQQNKEHFQDE---
: :. :.: . ..: ::: . ::. : ::: ...: .:.: ...
CCDS63 WFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLD-FKSIEEQQKPLTDSQRVK
200 210 220 230 240 250
410 420 430 440 450 460
pF1KB4 CTKLLVG-NIVITRYNN--RTYRIDDVDWNKTPKDSFTMSD--GK--EITFLEYYSKNYG
:: . : .. ::. .. : ::. .: . ...: ... :. : : .:.. .
CCDS63 FTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQESGQTVECTVAQYFKDRHK
260 270 280 290 300 310
470 480 490 500 510
pF1KB4 ITVKEEDQPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKD--LAQ
.... : : . :. : : : ....: .. .. . : .
CCDS63 LVLRYPHLPCL---------QVGQEQKHTYLPLEVCNIVAG-----QRCIKKLTDNQTST
320 330 340 350 360
520 530 540 550 560 570
pF1KB4 QINLSPKQHHSALECLLQRIAKNEAATNELMR-WGLRLQKDVHKIEGRVL--PMERINLK
.: . .. . : . . . . :. .: .:. .. .. . :::: : . .
CCDS63 MIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILYGGR
370 380 390 400 410 420
580 590 600 610 620 630
pF1KB4 NTSFITSQELNWVKEVTRDPSILT-IPMHFWAL--FYPKRAMDQA--RELVNMLEKIAGP
: .. : . : :. .. : : .. ::. : :.: .. . ....:.::.
CCDS63 NKAIATPVQGVWD---MRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRD
430 440 450 460 470 480
640 650 660 670 680
pF1KB4 IGMRMS-PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLC
:: .. : . . . : .: . : ...: .. .:.:: :. : . .:. .:..
CCDS63 AGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAG---LQLVVVILPG-KTPVYAEVKRVG
490 500 510 520 530
690 700 710 720 730 740
pF1KB4 CVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIP------LKQ-LMV
. . .: :..... : : ..... . :.:: :::: . .. .: ..: ..
CCDS63 DTVLGMATQCVQMKNV-QRTTPQTLSN-LCLKINVKLGG-VNNILLPQGRPPVFQQPVIF
540 550 560 570 580 590
750 760 770 780 790
pF1KB4 IGMDVYHDPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKF
.: :: : :. : . :... :.:.. ... . : :. .:::...: . : .:
CCDS63 LGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQF
600 610 620 630 640 650
800 810 820 830 840 850
pF1KB4 YEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFVVQKKIST
:. .. : .:. ::::::.::.. : ..:. ... :.. ..::: .. .::::. :
CCDS63 YKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHT
660 670 680 690 700 710
860 870 880 890 900 910
pF1KB4 NLYLAAPQNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYVCVLNTAN
:. . .. : . : ::.:: :: :::: .: :: . :.:: . .
CCDS63 RLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNR
720 730 740 750 760 770
920 930 940 950 960 970
pF1KB4 LSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQLCENLFFL
.: :..: ::..::: : .. .::: ::: .:: . :.. .:
CCDS63 FSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQ
780 790 800 810 820 830
CCDS63 SNGRDHQALAKAVQVHQDTLRTMYFA
840 850
973 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:40:57 2016 done: Thu Nov 3 14:40:58 2016
Total Scan time: 4.350 Total Display time: 0.330
Function used was FASTA [36.3.4 Apr, 2011]