FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9628, 882 aa
1>>>pF1KE9628 882 - 882 aa - 882 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8519+/-0.00105; mu= 16.1490+/- 0.063
mean_var=140.4763+/-27.654, 0's: 0 Z-trim(108.6): 16 B-trim: 0 in 0/52
Lambda= 0.108211
statistics sampled from 10288 (10301) to 10288 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.654), E-opt: 0.2 (0.316), width: 16
Scan time: 4.350
The best scores are: opt bits E(32554)
CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 5913 935.4 0
CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 2902 465.3 2.1e-130
CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 1791 291.9 3.7e-78
CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 1454 239.3 2.3e-62
CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1454 239.3 2.5e-62
CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 432 79.7 2.5e-14
CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 412 76.5 1.7e-13
CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 412 76.6 2.2e-13
CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 397 74.2 1e-12
CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 397 74.3 1.1e-12
>>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa)
initn: 5913 init1: 5913 opt: 5913 Z-score: 4995.1 bits: 935.4 E(32554): 0
Smith-Waterman score: 5913; 100.0% identity (100.0% similar) in 882 aa overlap (1-882:1-882)
10 20 30 40 50 60
pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQDMKHVKDSKTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQDMKHVKDSKTGS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 EGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 LLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 VGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 TSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 YRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 YRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 LAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 RRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITM
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 KPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 KCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 KCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 NRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVI
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 VYRDGVGDGQLQALLDHEAKKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 VYRDGVGDGQLQALLDHEAKKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 PPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMY
790 800 810 820 830 840
850 860 870 880
pF1KE9 YNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
::::::::::::::::::::::::::::::::::::::::::
CCDS33 YNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
850 860 870 880
>>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa)
initn: 2904 init1: 783 opt: 2902 Z-score: 2454.8 bits: 465.3 E(32554): 2.1e-130
Smith-Waterman score: 2945; 50.5% identity (76.2% similar) in 889 aa overlap (1-882:1-861)
10 20 30 40 50 60
pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
: ::::.::::::: .:. : ::...:.: .: :.: :. :
CCDS92 MTGRARARARGRARGQETAQLV--------GSTASQQPGYIQPRPQP----PPAEGELFG
10 20 30 40
70 80 90 100 110
pF1KE9 RA-ARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV---FQDLVVNTRQDMKHVKDS
:. :: ::: :.:::.. ::.. : :: :: :.:: :::::.. :::.:
CCDS92 RGRQRGTAGGTAKSQGLQ---ISAGFQELSLAER--GGRRRDFHDLGVNTRQNLDHVKES
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE9 KTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIF
:::: : .:.: .::::. :::::. :.:..::.: .: ::. :: ::. .:. : :
CCDS92 KTGSSGIIVRLSTNHFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAF
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE9 DGNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLL
::. :.: . :... .: .: :.. . :.::. ...:: :::: ::..:::.::: .:..
CCDS92 DGTILFLPKRLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIM
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE9 DFEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYD
...:.:::::. . :.. : : :: :..::.::::::: ::.:::::.:: ::. :
CCDS92 NLQQIGRNYYNPNDPIDIPSH--RLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLD
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE9 FIKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKIT
:. :.. ...:.:...::: .::::::::::::::::: :::..::.:.:::...
CCDS92 FMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVS
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE9 YIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYS
...:::.:... .: :::.:::: . ..: :: : .:::.::..:::::.. .:..
CCDS92 FLEYYRKQYNQEITDLKQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFN
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE9 IVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNAN
..:.:: ::::.:..:.. . ..:. .. : .:.. :. : :.::.:.:: ::.:.. .
CCDS92 VMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEK
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE9 IVQGRRMVKANSQ-GDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAP
: :: . : : .:::.: : ::... :: .::..:.: ... : :: .: .::
CCDS92 IHQGGKTFDYNPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPA
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE9 MGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIK
::. :. : ::::: ...:. .:.. . :. :.:.: .. : .::.::
CCDS92 MGMQMRKAIMIEVDDRTEAYLRVLQQKVTADTQI---------VVCLLSSNRKDKYDAIK
530 540 550 560 570
600 610 620 630 640 650
pF1KE9 RYLCTKCPIPSQCVVKKTLEKVQA-RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGID
.:::: :: :::::: .:: : :. .:.:::: :::::::: ::.:. .. .:.::::
CCDS92 KYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGID
580 590 600 610 620 630
660 670 680 690 700 710
pF1KE9 CFHDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESS
:.::.. ..:::::::: : .:.:.:.:..: :.::: :..::.::: .: . .
CCDS92 CYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEY
640 650 660 670 680 690
720 730 740 750 760 770
pF1KE9 MPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKH
:: .::::::::::::..:...:. .. ::.:. . : :. ::::::.::::: .
CCDS92 MPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQS
700 710 720 730 740 750
780 790 800 810 820 830
pF1KE9 GSNFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLT
:. .::: ::::::::.:: ::::::::::.:..:.:.:::::::::. ::.:: .::::
CCDS92 GGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLT
760 770 780 790 800 810
840 850 860 870 880
pF1KE9 YCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
: :::.::: ::.:::::::.::::::.:::::::.::: :::.::.::
CCDS92 YKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL
820 830 840 850 860
>>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa)
initn: 1322 init1: 809 opt: 1791 Z-score: 1516.7 bits: 291.9 E(32554): 3.7e-78
Smith-Waterman score: 1799; 34.7% identity (66.3% similar) in 833 aa overlap (65-882:157-973)
40 50 60 70 80
pF1KE9 TQEPPQLQSTPRPLQEEVPVVRPLQPRAARGGAGGGAQSQGVKEP----GPEAG---LHT
: :.:: . . : : : : : .
CCDS60 AAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSS
130 140 150 160 170 180
90 100 110 120 130 140
pF1KE9 AP-LQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYN
: : . . . . ::..... :.. : ::.:: .: : .. . . : :.:.
CCDS60 PPALPQSPLHSPDRPLVLTVEHKEKELI-VKQGSKGTPQSLGLNLVKIQCHNEAV-YQYH
190 200 210 220 230 240
150 160 170 180 190 200
pF1KE9 VDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNSLLLSRPLKERRVEWLSTTK--DKNIV
: ..:..: ..: .: .:. :. :::. : : :.: ..: :.. . :. .
CCDS60 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYL--PVKLQQVLELKSQRKTDSAEI
250 260 270 280 290 300
210 220 230 240 250 260
pF1KE9 KITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRHGTSLEIW
.: ....: : : : :. .::..:::..::::.. ::::.: .:. : .: :.::
CCDS60 SIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQH--RLQIW
310 320 330 340 350 360
270 280 290 300 310 320
pF1KE9 LGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKRTSAQAQTGNIREEVTNKLIGSIVL
::..:. . .... : ::::::..: . . : .. : . ....: :. :.:.::.
CCDS60 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKE-HFQDECTKLLVGNIVI
370 380 390 400 410
330 340 350 360 370 380
pF1KE9 TKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDYYRQQHKEIVTVKKQPLLVSQGRWK
:.:::.:::.::.::...:.:.:. :::..::...:: ... : . ::::. . .
CCDS60 TRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSER
420 430 440 450 460 470
390 400 410 420 430 440
pF1KE9 KGLTGTQ-REPILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTL
. : . :::.:.: :::. ... ::. .:.::.. :::...: .:. ... .
CCDS60 QDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRI
480 490 500 510 520 530
450 460 470 480 490 500
pF1KE9 QDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQGRRMVKANSQGDWSREIRELPLLN
:. . . :. : :... . .. :::: : .... .: .:. . : .
CCDS60 AKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSIL
540 550 560 570 580 590
510 520 530 540 550 560
pF1KE9 AMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITMKPAEMIEVDGD-ANSYIDTLRKY
..:.: : ..: . . .: : . :.....:.:. :.: .:. : ..:. :...
CCDS60 TIPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQST
600 610 620 630 640 650
570 580 590 600 610
pF1KE9 TRPTLQMGMSCLLVFKVICIL--PNDDKRRYDSIKRYLCTKCPIPSQCVVKKTL-EKVQA
.. : :.::. : :: : .::. :.. :.::: : .:. . ..
CCDS60 LGAEGKIQM-------VVCIIMGPRDDL--YGAIKKLCCVQSPVPSQVVNVRTIGQPTRL
660 670 680 690 700 710
620 630 640 650 660 670
pF1KE9 RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIVNRQKSIAGFVASTNAELTK
:... :: :.:::.:: :: :. ... : .:.: .:: ..:..::::: : :::
CCDS60 RSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTK
720 730 740 750 760 770
680 690 700 710 720 730
pF1KE9 WYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEA
:::. :.: .:.: :..:: ..: . . . .:....::::::.::::... ..:
CCDS60 WYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEI
780 790 800 810 820 830
740 750 760 770 780 790
pF1KE9 KKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNPPPGTVIDVELTRNEWYDFF
... .... . .. .::.:.:.: ..: .:: .: ::::.: .: :: ::.
CCDS60 PQLQKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFY
840 850 860 870 880 890
800 810 820 830 840 850
pF1KE9 IVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKL
.... :..: :::: . .: .:::: .::::. :::::.: :: :::::::.:::::
CCDS60 LLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKL
900 910 920 930 940 950
860 870 880
pF1KE9 AYLVGQSIHQEPNRSLSTRLFYL
:.: :. .:.:: .: ::.:
CCDS60 AFLSGHILHHEPAIQLCENLFFL
960 970
>>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa)
initn: 1432 init1: 561 opt: 1454 Z-score: 1233.1 bits: 239.3 E(32554): 2.3e-62
Smith-Waterman score: 2193; 39.5% identity (69.7% similar) in 887 aa overlap (1-882:1-852)
10 20 30 40 50 60
pF1KE9 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
: ::::..::: : :.: ::: : ..:..: : . .. .
CCDS31 MSGRARVKARGIA--------------RSP-SAT--EVGRIQASPLPRSVDLSN----NE
10 20 30
70 80 90 100 110
pF1KE9 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV--FQDLVVNTRQDMKHVKDSKT
.. .: : .. . . : .: . ..:: . . :.:: . ::. . ::.. ::
CCDS31 ASSSNGFLGTSRISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKT
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE9 GSEGTVVQLLANHFRVISRPQ-WVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFD
:: : :.:..: : .. :: : :.:.: : ::. . :: :: .: . .. . ::
CCDS31 GSSGIPVKLVTNLFN-LDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFD
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE9 GNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLD
: :.::. :.:. .: : :. . .:.:. ...:: .:: :.. .::.::. .: :.
CCDS31 GAILFLSQKLEEKVTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE9 FEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDF
. :.:::.:. .. ... .: :: : :.. :: .: .. . ::::.:.:: ::. .:
CCDS31 MYQIGRNFYNPSEPMEIPQHKLSL--WPGFAISVSYFERKLLFSADVSYKVLRNETVLEF
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE9 IKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITY
. .. . . . ..::: ::::.:::.:: .:::::. .: ::.: ::..:::
CCDS31 MTALCQRTGLSCFTQTCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITY
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE9 IDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSI
.:::.::. :. .::.::: . :.. ... . :::.:: .:::::. .:...
CCDS31 VDYYKQQYDITVSDLNQPMLVSLLKKKRN-DNSEAQLAHLIPELCFLTGLTDQATSDFQL
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE9 VKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANI
.: .:..::::: :.. : ......: : ..: :. : :.: .. .:. ::.. . .:
CCDS31 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQ-ISLTGRIVPSEKI
400 410 420 430 440 450
480 490 500 510 520 530
pF1KE9 VQGRRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMG
.. .. . : .:::..:: .:::. :..:::: : .. : :. . :. :.. ::
CCDS31 LMQDHICQPVSAADWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMG
460 470 480 490 500 510
540 550 560 570 580 590
pF1KE9 ITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRY
... ..:.:. . ... ....:. : .:. :.::::...: :::::.:
CCDS31 FNVDYPKIIKVQENPAAFVRAIQQYVDPDVQL---------VMCILPSNQKTYYDSIKKY
520 530 540 550 560
600 610 620 630 640 650
pF1KE9 LCTKCPIPSQCVVKKTLEKV-QARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCF
: . ::.:::::. .::.: . .:.::::.::.::.:: :: :: .. : ::::
CCDS31 LSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVC
570 580 590 600 610 620
660 670 680 690 700 710
pF1KE9 HDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMP
.: .... ..: :::.: ..:.:.:.:..:.: ... :.. . .::. : : . ..:
CCDS31 KDALSKDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLP
630 640 650 660 670 680
720 730 740 750 760 770
pF1KE9 HSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGS
.:::: :::::::..:...:. .. :. .. : .. :. :::.:. ::: . .
CCDS31 ARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNR
690 700 710 720 730 740
780 790 800 810 820 830
pF1KE9 NFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYC
. :::: :::.: : ::::::::...:: . :::.::.:::::: ::.:: .::::.
CCDS31 TVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFK
750 760 770 780 790 800
840 850 860 870 880
pF1KE9 LCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
:::.::: :::. :::::.:::::..::.::::.::. :...::::
CCDS31 LCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLFYL
810 820 830 840 850
>>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa)
initn: 1216 init1: 484 opt: 1454 Z-score: 1232.6 bits: 239.3 E(32554): 2.5e-62
Smith-Waterman score: 1607; 32.9% identity (63.1% similar) in 833 aa overlap (65-882:157-937)
40 50 60 70 80
pF1KE9 TQEPPQLQSTPRPLQEEVPVVRPLQPRAARGGAGGGAQSQGVKEP----GPEAG---LHT
: :.:: . . : : : : : .
CCDS83 AAGDSKMAETSVGWSRTLGRGSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSS
130 140 150 160 170 180
90 100 110 120 130 140
pF1KE9 AP-LQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYN
: : . . . . ::..... :.. : ::.:: .: : .. . . : :.:.
CCDS83 PPALPQSPLHSPDRPLVLTVEHKEKELI-VKQGSKGTPQSLGLNLVKIQCHNEAV-YQYH
190 200 210 220 230 240
150 160 170 180 190 200
pF1KE9 VDYKPDIEDGNLRTILLDQHRRKFGERHIFDGNSLLLSRPLKERRVEWLSTTK--DKNIV
: ..:..: ..: .: .:. :. :::. : : :.: ..: :.. . :. .
CCDS83 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYL--PVKLQQVLELKSQRKTDSAEI
250 260 270 280 290 300
210 220 230 240 250 260
pF1KE9 KITVEFSKELTPTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRHGTSLEIW
.: ....: : : : :. .::..:::..::::.. ::::.: .:. : .: :.::
CCDS83 SIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQH--RLQIW
310 320 330 340 350 360
270 280 290 300 310 320
pF1KE9 LGYVTSVLQYENSITLCADVSHKLLRIETAYDFIKRTSAQAQTGNIREEVTNKLIGSIVL
::..:. . .... : ::::::..: . . : .. : . ....: :. :.:.::.
CCDS83 PGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKE-HFQDECTKLLVGNIVI
370 380 390 400 410
330 340 350 360 370 380
pF1KE9 TKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITYIDYYRQQHKEIVTVKKQPLLVSQGRWK
:.:::.:::.::.::...:.:.:. :::..::...:: ... : . ::::. . .
CCDS83 TRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSER
420 430 440 450 460 470
390 400 410 420 430 440
pF1KE9 KGLTGTQ-REPILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTL
. : . :::.:.: :::. ... ::. .:.::.. :::...: .:. ... .
CCDS83 QDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRI
480 490 500 510 520 530
450 460 470 480 490 500
pF1KE9 QDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANIVQGRRMVKANSQGDWSREIRELPLLN
:. . . :. : :... . .. :::: : .... .: .:. . : .
CCDS83 AKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQELNWVKEVTRDPSIL
540 550 560 570 580 590
510 520 530 540 550 560
pF1KE9 AMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMGITMKPAEMIEVDGD-ANSYIDTLRKY
..:.: : ..: . . .: : . :.....:.:. :.: .:. : ..:. :...
CCDS83 TIPMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQST
600 610 620 630 640 650
570 580 590 600 610
pF1KE9 TRPTLQMGMSCLLVFKVICIL--PNDDKRRYDSIKRYLCTKCPIPSQCVVKKTL-EKVQA
.. : :.::. : :: : .::. :.. :.::: : .:. . ..
CCDS83 LGAEGKIQM-------VVCIIMGPRDDL--YGAIKKLCCVQSPVPSQVVNVRTIGQPTRL
660 670 680 690 700 710
620 630 640 650 660 670
pF1KE9 RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCFHDIVNRQKSIAGFVASTNAELTK
:... :: :.:::.:: :: :. ... : .:.: .:: ..:..::::: : :::
CCDS83 RSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTK
720 730 740 750 760 770
680 690 700 710 720 730
pF1KE9 WYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEA
:::. :.: .:.: :..:: ..: . . . .:....::::::.::::... ..:
CCDS83 WYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEI
780 790 800 810 820 830
740 750 760 770 780 790
pF1KE9 KKMSTYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNFQNPPPGTVIDVELTRNEWYDFF
... .... . .. .::.:.:.: ..: .:: .: ::::.: .: ::
CCDS83 PQLQKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEW----
840 850 860 870 880
800 810 820 830 840 850
pF1KE9 IVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKL
::. :::::.: :: :::::::.:::::
CCDS83 --------------------------------LTFKLCHMYWNWPGTIRVPAPCKYAHKL
890 900 910
860 870 880
pF1KE9 AYLVGQSIHQEPNRSLSTRLFYL
:.: :. .:.:: .: ::.:
CCDS83 AFLSGHILHHEPAIQLCENLFFL
920 930
>>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa)
initn: 345 init1: 221 opt: 432 Z-score: 370.8 bits: 79.7 E(32554): 2.5e-14
Smith-Waterman score: 665; 25.1% identity (54.8% similar) in 809 aa overlap (119-861:32-811)
90 100 110 120 130 140
pF1KE9 PLQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVD
:. : ...: :: :. .. :. :.:..:
CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFE-MDIPKIDIYHYELD
10 20 30 40 50 60
150 160 170 180 190
pF1KE9 YKPDIEDGNL-RTIL--LDQHRRK--FGERH-IFDGNSLLLSR---PLKERRVEWLSTT-
::. . : :. . :: . ::.:. .::: . : . :. . .:: :
CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
70 80 90 100 110 120
200 210 220 230 240
pF1KE9 ---KDKNIVKITVEFSKELT------------PTSP-DCLRYYNILFRRTFKLLDFEQVG
::. : :..... . .. :. : . .. ....:. . . . ::
CCDS63 GEGKDR-IFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRH-LPSMRYTPVG
130 140 150 160 170
250 260 270 280 290
pF1KE9 RNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHK-LLRIETAYDFI---
:...: ... . : . :.:.:. :: .. : ::: . . . . .:.
CCDS63 RSFFTASEGCS-NPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV
180 190 200 210 220 230
300 310 320 330 340
pF1KE9 ---KRTSAQAQ--TGNIREEVTNKLIG-SIVLTKYNN--KTYRVDDIDWKQNPEDTF--N
: : . : . : . :... : .. .:. .. . ::: .. . ..:: .
CCDS63 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ
240 250 260 270 280 290
350 360 370 380 390 400
pF1KE9 KSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTG
. .:. . : .:....:: .. . : : . :. .: . .. : : .
CCDS63 QESGQTVECTVAQYFKDRHKLVLRYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKK
300 310 320 330 340 350
410 420 430 440 450 460
pF1KE9 LTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFIN-TLQDNKKVRELLQLWDLKFDTNFL
:::. . .... : : .: :... : . . ... . :::. . ..
CCDS63 LTDN--QTSTMIRATA---RSAPDRQEEISKLMRSASFNTDPYVREF----GIMVKDEMT
360 370 380 390 400
470 480 490 500 510 520
pF1KE9 SVPGRVLKNANIVQGRR--MVKANSQGDWSREIRELPLLNAMPLHSWLIL-YSRSSHREA
.: ::::. .:. : : . . :: : ..:. . ... .. : : .. . .
CCDS63 DVTGRVLQPPSILYGGRNKAIATPVQGVW--DMRNKQFHTGIEIKVWAIACFAPQRQCTE
410 420 430 440 450 460
530 540 550 560 570
pF1KE9 MSLKG---HLQSVT--APMGITMKPAEMIEVDGDANSYIDTLR--KYTRPTLQMGMSCLL
. ::. .:.... : : : .: ..: :.: .: : : ::.
CCDS63 VHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYAGLQL------
470 480 490 500 510
580 590 600 610 620 630
pF1KE9 VFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMG
:. :::. : .:: : . .::: :..... .:. ... ..: :.:
CCDS63 ---VVVILPGKTPV-YAEVKRVGDTVLGMATQCVQMKNVQRTTPQTL-SNLCLKINVKLG
520 530 540 550 560 570
640 650 660 670 680
pF1KE9 GA----LWKVETDV--QRTMFVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQ
:. : . . : : ..:.: : : .. .. :::. :.: .:. ... . .:
CCDS63 GVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQ
580 590 600 610 620 630
690 700 710 720 730 740
pF1KE9 KTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKMSTY-L
. .:....: .. : . :. : .: :::::..::.: .: :: . .
CCDS63 QHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACI
640 650 660 670 680 690
750 760 770 780 790 800
pF1KE9 KTISPNNFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVS
: . . ..::::.:: .::.: .. : : ::..:...:. .::.. :
CCDS63 KLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCS
700 710 720 730 740 750
810 820 830 840 850 860
pF1KE9 QSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYL
.. .:: :.::.:..: .: : .: ::: ::: : . .::: .::: .:.
CCDS63 HAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFR
760 770 780 790 800 810
870 880
pF1KE9 VGQSIHQEPNRSLSTRLFYL
CCDS63 ARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
820 830 840 850
>>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa)
initn: 304 init1: 219 opt: 412 Z-score: 355.7 bits: 76.5 E(32554): 1.7e-13
Smith-Waterman score: 518; 24.7% identity (56.8% similar) in 558 aa overlap (330-861:44-578)
300 310 320 330 340 350
pF1KE9 RTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTF--NKSDGSKI--
. ::: .. . ..:: . .:. .
CCDS40 PRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPASHQTFPLQLENGQTVER
20 30 40 50 60 70
360 370 380 390 400 410
pF1KE9 TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDY
: .:.:... . . : : . :. .: . .. : : . :::. .
CCDS40 TVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKKLTDN--QTS
80 90 100 110 120
420 430 440 450 460 470
pF1KE9 SIVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNA
...: : : .: :... ..... . : .. ..: ...: .. : :::: :
CCDS40 TMIKATA---RSAPDRQEE-ISRLVRSA--NYETDPFVQEFQFKVRDEMAHVTGRVLP-A
130 140 150 160 170 180
480 490 500 510 520
pF1KE9 NIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLHSWLI--LYSRSSHREAMSLKG---
..: :: : : . :.: : ..: . ... .. : : . .. . :: . :::
CCDS40 PMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQRQCREEI-LKGFTD
190 200 210 220 230
530 540 550 560 570 580
pF1KE9 HLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDD
.:.... :. .. . ... . .. . .. . : . :.. ..: :::.
CCDS40 QLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYS-GLQLIIV-----ILPGKT
240 250 260 270 280 290
590 600 610 620 630 640
pF1KE9 KRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQR
: .:: : . .::: :.. :.. .:. ... ..: :.:: . .. . ::
CCDS40 PV-YAEVKRVGDTLLGMATQCVQVKNVIKTSPQTL-SNLCLKINVKLGG-INNILVPHQR
300 310 320 330 340 350
650 660 670 680 690
pF1KE9 -------TMFVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELE
..:.: : : .. .. :::. :.: .:. ... . .:. .:....:
CCDS40 PSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPRQEIIQDLA
360 370 380 390 400 410
700 710 720 730 740 750
pF1KE9 ICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLA
.. : . :. : .: :::::..::.. .: .: . .. . . ..
CCDS40 SMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLEKDYQPGIT
420 430 440 450 460 470
760 770 780 790 800 810
pF1KE9 FIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPT
.:::.:: .::.: .. : : ::..:...:. .::.. :.. .:: :.
CCDS40 YIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAGIQGTSRPS
480 490 500 510 520 530
820 830 840 850 860 870
pF1KE9 HYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNR
::.:..: .. : .: ::: ::: : . .::: .::: .:.
CCDS40 HYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHD
540 550 560 570 580 590
880
pF1KE9 SLSTRLFYL
CCDS40 SAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
600 610 620
>>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa)
initn: 373 init1: 219 opt: 412 Z-score: 353.9 bits: 76.6 E(32554): 2.2e-13
Smith-Waterman score: 622; 24.3% identity (54.5% similar) in 818 aa overlap (119-861:24-812)
90 100 110 120 130 140
pF1KE9 PLQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVD
:. : ..:::: :.: :. .: :.::
CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQV-EIPKIDVYLYEVD
10 20 30 40 50
150 160 170 180 190
pF1KE9 YKPDIEDGNLRTILLD---QHRRK--FGERH-IFDGN-SLLLSRPLKERRVEW-LSTT--
::: . ..: :: . ::.:. ..::. :: . :: . :..:
CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP
60 70 80 90 100 110
200 210 220 230
pF1KE9 ----KDKNIVKITVEFSKELT---------------------PTSPDCLRYYNILFRRTF
::. . :....: .... : : . .. ....:. .
CCDS39 GEGGKDRPF-KVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRH-L
120 130 140 150 160 170
240 250 260 270 280 290
pF1KE9 KLLDFEQVGRNYYTKKKAIQLYRH--GTSLEIWLGYVTSVLQYENSITLCADVSHK-LLR
. . :::.... : . : : : . :.:.:. :: .. : ::: . .
CCDS39 PSMKYTPVGRSFFS---APEGYDHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYK
180 190 200 210 220
300 310 320 330
pF1KE9 IETAYDF------IKRTSAQAQ--TGNIREEVTNKLIGSIVLTKYNN---KTYRVDDIDW
. . .: :. . : . : . : . :... : : . . . . ::: ..
CCDS39 AQPVIQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTR
230 240 250 260 270 280
340 350 360 370 380 390
pF1KE9 KQNPEDTF--NKSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPI
. ..:: . .:. . : .:.:... . . : : . :. .: .
CCDS39 RPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCN
290 300 310 320 330 340
400 410 420 430 440 450
pF1KE9 LLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQL
.. : : . :::. . ...: : : .: :... ..... . : .. ..:
CCDS39 IVAGQRC-IKKLTDN--QTSTMIKATA---RSAPDRQEE-ISRLVRS--ANYETDPFVQE
350 360 370 380 390
460 470 480 490 500 510
pF1KE9 WDLKFDTNFLSVPGRVLKNANIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLHSWLI
...: .. : :::: : ..: :: : : . :.: : ..: . ... .. : :
CCDS39 FQFKVRDEMAHVTGRVLP-APMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAI
400 410 420 430 440 450
520 530 540 550 560
pF1KE9 --LYSRSSHREAMSLKG---HLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTRPTL
. .. . :: . ::: .:.... :. .. . ... . .. . .. . :
CCDS39 ACFATQRQCREEI-LKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTY
460 470 480 490 500 510
570 580 590 600 610 620
pF1KE9 QMGMSCLLVFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIA
. :.. ..: :::. : .:: : . .::: :.. :.. .:. ...
CCDS39 S-GLQLIIV-----ILPGKTPV-YAEVKRVGDTLLGMATQCVQVKNVIKTSPQTL-SNLC
520 530 540 550 560
630 640 650 660 670
pF1KE9 QQMNCKMGGALWKVETDVQR-------TMFVGIDCFHDIVN--RQKSIAGFVASTNAELT
..: :.:: . .. . :: ..:.: : : .. .. :::. :.: .:. .
CCDS39 LKINVKLGG-INNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPS
570 580 590 600 610 620
680 690 700 710 720 730
pF1KE9 KWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHE
.. . .:. .:....: .. : . :. : .: :::::..::.. .: .:
CCDS39 RYCATVRVQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYE
630 640 650 660 670 680
740 750 760 770 780 790
pF1KE9 AKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVELTRN
. .. . . ...:::.:: .::.: .. : : ::..:...:.
CCDS39 LLAIREACISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHP
690 700 710 720 730 740
800 810 820 830 840 850
pF1KE9 EWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPC
.::.. :.. .:: :.::.:..: .. : .: ::: ::: : . .:::
CCDS39 YEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPA
750 760 770 780 790 800
860 870 880
pF1KE9 HYAHKLAYLVGQSIHQEPNRSLSTRLFYL
.::: .:.
CCDS39 YYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
810 820 830 840 850 860
>>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa)
initn: 290 init1: 202 opt: 397 Z-score: 341.8 bits: 74.2 E(32554): 1e-12
Smith-Waterman score: 573; 23.5% identity (54.1% similar) in 761 aa overlap (165-861:3-734)
140 150 160 170 180
pF1KE9 ISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRK--FGERH-IFDGNS---LLLSRPLK
:: . ::.:. ..::.. . . :.
CCDS81 MVQHFKPQIFGDRKPVYDGKKNIYTVTALPIG
10 20 30
190 200 210 220 230
pF1KE9 ERRVEWLSTT----KDKNIVKITVEFSKELT-------------PTSPDCLRYYNILFRR
..::.. : ::. : :..... .. :. . .. .. .:.
CCDS81 NERVDFEVTIPGEGKDR-IFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH
40 50 60 70 80 90
240 250 260 270 280
pF1KE9 TFKLLDFEQVGRNYYTKKKAIQLYRH--GTSLEIWLGYVTSVLQYENSITLCADVSHK-L
. . . :::.... .. : : : . :.:.:. :: .. : ::: .
CCDS81 -LASMRYTPVGRSFFSPPEG---YYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAF
100 110 120 130 140
290 300 310 320 330
pF1KE9 LRIETAYDF------IKRTSAQAQ--TGNIREEVTNKLIGSIVLTKYNN---KTYRVDDI
. . . .: :. . : . : . : . :... : : . . . . ::: ..
CCDS81 YKAQPVIEFMCEVLDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNV
150 160 170 180 190 200
340 350 360 370 380 390
pF1KE9 DWKQNPEDTF--NKSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQRE
. ..:: . .:. . : .:..:... . . : : . :. .: .
CCDS81 TRRPASHQTFPLQLESGQTVECTVAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEV
210 220 230 240 250 260
400 410 420 430 440 450
pF1KE9 PILLIPQLCHMTGLTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFINTLQDNKK--VRE
.. : : . :::. . ...: : : .: : .: :. :. : . .
CCDS81 CNIVAGQRC-IKKLTDN--QTSTMIKATA---RSAPDR-----QEEISRLMKNASYNLDP
270 280 290 300 310
460 470 480 490 500
pF1KE9 LLQLWDLKFDTNFLSVPGRVLKNANIVQ--GR-RMVKANSQGDWSREIRELPLLNAMPLH
.: . .: .. : :::: : :.: :: : . . .:: : ..: . :.. ..
CCDS81 YIQEFGIKVKDDMTEVTGRVLP-APILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIK
320 330 340 350 360 370
510 520 530 540 550 560
pF1KE9 SWLI--LYSRSSHREAM--SLKGHLQSVTAPMGITMKPAEMIEVDGDANSYIDTLRKYTR
: : . ... :: . .. .:.... :. .. . ... . .. . .. .
CCDS81 VWAIACFAPQKQCREEVLKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLK
380 390 400 410 420 430
570 580 590 600 610 620
pF1KE9 PTLQMGMSCLLVFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVT
: . :.. ..: :::. : .:: : . .::: :.. :.. .:. .
CCDS81 NTYS-GLQLIIV-----ILPGKTPV-YAEVKRVGDTLLGMATQCVQVKNVVKTSPQTL-S
440 450 460 470 480
630 640 650 660 670
pF1KE9 KIAQQMNCKMGGALWKVETDVQRT-------MFVGIDCFHDIVN--RQKSIAGFVASTNA
.. ..: :.:: . .. . ::. .:.: : : .. .. ::.. :.: .:
CCDS81 NLCLKINVKLGG-INNILVPHQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDA
490 500 510 520 530 540
680 690 700 710 720 730
pF1KE9 ELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALL
. ... . .:. .:....: .. : . :. : .: ::::: .::: .:
CCDS81 HPSRYCATVRVQRPRQEIIEDLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQIL
550 560 570 580 590 600
740 750 760 770 780 790
pF1KE9 DHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGSNF----QNPPPGTVIDVEL
.: . .. .: . . ...:::.:: .::.: .. : : ::..:...
CCDS81 HYELLAIRDACIKLEKDYQPGITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNI
610 620 630 640 650 660
800 810 820 830 840 850
pF1KE9 TRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVP
:. .::.. :.. .:: :.:: :..: .. : .: ::: ::: : . .:
CCDS81 THPFEFDFYLCSHAGIQGTSRPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIP
670 680 690 700 710 720
860 870 880
pF1KE9 APCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
:: .::. .:.
CCDS81 APAYYARLVAFRARYHLVDKEHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA
730 740 750 760 770 780
>>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa)
initn: 362 init1: 202 opt: 397 Z-score: 341.3 bits: 74.3 E(32554): 1.1e-12
Smith-Waterman score: 645; 24.3% identity (53.8% similar) in 849 aa overlap (80-861:7-809)
50 60 70 80 90 100
pF1KE9 EEVPVVRPLQPRAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGVFQDLVVNTRQD
: :: . :::. ::: . :
CCDS39 MEAGPSGAAAGAYLPPLQQ-----VFQ---APRRPG
10 20
110 120 130 140 150 160
pF1KE9 MKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNL-RTIL--LDQH
. :. : ..::::.:.: . :. .:.:.:: ::: . : .. . ::
CCDS39 I--------GTVGKPIKLLANYFEV-DIPKIDVYHYEVDIKPDKCPRRVNREVVEYMVQH
30 40 50 60 70
170 180 190 200 210
pF1KE9 RRK--FGERH-IFDGNS---LLLSRPLKERRVEWLSTT----KDKNIVKITVEFSKELT-
. ::.:. ..::.. . . :. ..::.. : ::. : :..... ..
CCDS39 FKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVTIPGEGKDR-IFKVSIKWLAIVSW
80 90 100 110 120 130
220 230 240 250 260
pF1KE9 ------------PTSPDCLRYYNILFRRTFKLLDFEQVGRNYYTKKKAIQLYRH--GTSL
:. . .. .. .:. . . . :::.... .. : : : .
CCDS39 RMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPVGRSFFSPPEG---YYHPLGGGR
140 150 160 170 180 190
270 280 290 300 310
pF1KE9 EIWLGYVTSVLQYENSITLCADVSHK-LLRIETAYDF------IKRTSAQAQ--TGNIRE
:.:.:. :: .. : ::: . . . . .: :. . : . : . :
CCDS39 EVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRNIDEQPKPLTDSQRV
200 210 220 230 240 250
320 330 340 350 360
pF1KE9 EVTNKLIGSIVLTKYNN---KTYRVDDIDWKQNPEDTF--NKSDGSKI--TYIDYYRQQH
. :... : : . . . . ::: .. . ..:: . .:. . : .:..:..
CCDS39 RFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECTVAQYFKQKY
260 270 280 290 300 310
370 380 390 400 410 420
pF1KE9 KEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSIVKELAKHT
. . . : : . :. .: . .. : : . :::. . ...: :
CCDS39 NLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKKLTDN--QTSTMIKATA---
320 330 340 350 360
430 440 450 460 470 480
pF1KE9 RLSPRRRHHTLKEFINTLQDNKK--VRELLQLWDLKFDTNFLSVPGRVLKNANIVQ--GR
: .: : .: :. :. : . . .: . .: .. : :::: : :.: ::
CCDS39 RSAPDR-----QEEISRLMKNASYNLDPYIQEFGIKVKDDMTEVTGRVLP-APILQYGGR
370 380 390 400 410 420
490 500 510 520 530
pF1KE9 -RMVKANSQGDWSREIRELPLLNAMPLHSWLI--LYSRSSHREAM--SLKGHLQSVTAPM
: . . .:: : ..: . :.. .. : : . ... :: . .. .:....
CCDS39 NRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLRKISKDA
430 440 450 460 470
540 550 560 570 580 590
pF1KE9 GITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKR
:. .. . ... . .. . .. . : . :.. ..: :::. : .::
CCDS39 GMPIQGQPCFCKYAQGADSVEPMFRHLKNTYS-GLQLIIV-----ILPGKTPV-YAEVKR
480 490 500 510 520 530
600 610 620 630 640
pF1KE9 YLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKMGGALWKVETDVQRT-------M
: . .::: :.. :.. .:. ... ..: :.:: . .. . ::. .
CCDS39 VGDTLLGMATQCVQVKNVVKTSPQTL-SNLCLKINVKLGG-INNILVPHQRSAVFQQPVI
540 550 560 570 580 590
650 660 670 680 690 700
pF1KE9 FVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDV
:.: : : .. .. ::.. :.: .:. ... . .:. .:....: .. :
CCDS39 FLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELLIQ
600 610 620 630 640 650
710 720 730 740 750 760
pF1KE9 WCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRIN
. :. : .: ::::: .::: .: .: . .. .: . . ...:::.:: .
CCDS39 FYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKRHH
660 670 680 690 700 710
770 780 790 800 810 820
pF1KE9 TRFFLKHGSNF----QNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTI
::.: .. : : ::..:...:. .::.. :.. .:: :.:: :..:
CCDS39 TRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWDDN
720 730 740 750 760 770
830 840 850 860 870 880
pF1KE9 GLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
.. : .: ::: ::: : . .::: .::. .:.
CCDS39 RFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHISG
780 790 800 810 820 830
CCDS39 QSNGRDPQALAKAVQVHQDTLRTMYFA
840 850
882 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 17:48:01 2016 done: Mon Nov 7 17:48:02 2016
Total Scan time: 4.350 Total Display time: 0.290
Function used was FASTA [36.3.4 Apr, 2011]