FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9627, 861 aa
1>>>pF1KE9627 861 - 861 aa - 861 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3671+/-0.000898; mu= 16.0545+/- 0.054
mean_var=85.5436+/-17.062, 0's: 0 Z-trim(107.5): 24 B-trim: 0 in 0/51
Lambda= 0.138669
statistics sampled from 9620 (9639) to 9620 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.296), width: 16
Scan time: 4.220
The best scores are: opt bits E(32554)
CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 5816 1173.8 0
CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 2902 590.8 3.4e-168
CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 2818 574.0 3.8e-163
CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 2324 475.2 2.4e-133
CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1949 400.2 8.9e-111
CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 450 100.2 1.2e-20
CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 450 100.3 1.6e-20
CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 444 99.1 3.6e-20
CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 433 96.9 1.5e-19
CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 433 96.9 1.6e-19
CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 365 83.3 2e-15
>>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa)
initn: 5816 init1: 5816 opt: 5816 Z-score: 6283.9 bits: 1173.8 E(32554): 0
Smith-Waterman score: 5816; 100.0% identity (100.0% similar) in 861 aa overlap (1-861:1-861)
10 20 30 40 50 60
pF1KE9 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 KSQGLQISAGFQELSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 KSQGLQISAGFQELSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 LTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 LTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 VFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 VFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPID
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 IPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 IPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 KELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 KELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 VLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 VLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQRE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 VGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 VGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 ETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDDRTEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 ETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDDRTEA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 ATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 ATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 RCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 RCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 LDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 LDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 SQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS92 SQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAF
790 800 810 820 830 840
850 860
pF1KE9 LVGQSIHREPNLSLSNRLYYL
:::::::::::::::::::::
CCDS92 LVGQSIHREPNLSLSNRLYYL
850 860
>>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa)
initn: 2907 init1: 783 opt: 2902 Z-score: 3133.1 bits: 590.8 E(32554): 3.4e-168
Smith-Waterman score: 2945; 50.5% identity (76.2% similar) in 889 aa overlap (1-861:1-882)
10 20 30 40
pF1KE9 MTGRARARARGRARGQETAQLV--------GSTASQQPGYIQPRPQP----PPAEGELFG
: ::::.::::::: .:. : ::...:.: .: :.: :. :
CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE9 RGRQRGTAGGTAKSQGLQ---ISAGFQELSLAER--GGRRRDFHDLGVNTRQNLDHVKES
:. :: ::: :.:::.. ::.. : :: :: :.:: :::::.. :::.:
CCDS33 RA-ARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV---FQDLVVNTRQDMKHVKDS
70 80 90 100 110
110 120 130 140 150 160
pF1KE9 KTGSSGIIVRLSTNHFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAF
:::: : .:.: .::::. :::::. :.:..::.: .: ::. :: ::. .:. : :
CCDS33 KTGSEGTVVQLLANHFRVISRPQWVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIF
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE9 DGTILFLPKRLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIM
::. :.: . :... .: .: :.. . :.::. ...:: :::: ::..:::.::: .:..
CCDS33 DGNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLL
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE9 NLQQIGRNYYNPNDPIDIPSH--RLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLD
...:.:::::. . :.. : : :: :..::.::::::: ::.:::::.:: ::. :
CCDS33 DFEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYD
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE9 FMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVS
:. :.. ...:.:...::: .::::::::::::::::: :::..::.:.:::...
CCDS33 FIKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKIT
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE9 FLEYYRKQYNQEITDLKQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFN
...:::.:... .: :::.:::: . ..: :: : .:::.::..:::::.. .:..
CCDS33 YIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYS
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE9 VMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEK
..:.:: ::::.:..:.. . ..:. .. : .:.. :. : :.::.:.:: ::.:.. .
CCDS33 IVKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNAN
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE9 IHQGGKTFDYNPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPA
: :: . : : .:::.: : ::... :: .::..:.: ... : :: .: .::
CCDS33 IVQGRRMVKANSQ-GDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAP
480 490 500 510 520 530
530 540 550 560 570
pF1KE9 MGMQMRKAIMIEVDDRTEAYLRVLQQKVTADTQI---------VVCLLSSNRKDKYDAIK
::. :. : ::::: ...:. .:.. . :. :.:.: .. : .::.::
CCDS33 MGITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIK
540 550 560 570 580 590
580 590 600 610 620 630
pF1KE9 KYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGID
.:::: :: :::::: .:: : :. .:.:::: :::::::: ::.:. .. .:.::::
CCDS33 RYLCTKCPIPSQCVVKKTLEKVQA-RTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGID
600 610 620 630 640 650
640 650 660 670 680 690
pF1KE9 CYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEY
:.::.. ..:::::::: : .:.:.:.:..: :.::: :..::.::: .: . .
CCDS33 CFHDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESS
660 670 680 690 700 710
700 710 720 730 740 750
pF1KE9 MPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQS
:: .::::::::::::..:...:. .. ::.:. . : :. ::::::.::::: .
CCDS33 MPHSVIVYRDGVGDGQLQALLDHEAKKMSTYLKTISPN-NFTLAFIVVKKRINTRFFLKH
720 730 740 750 760 770
760 770 780 790 800 810
pF1KE9 GGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLT
:. .::: ::::::::.:: ::::::::::.:..:.:.:::::::::. ::.:: .::::
CCDS33 GSNFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLT
780 790 800 810 820 830
820 830 840 850 860
pF1KE9 YKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL
: :::.::: ::.:::::::.::::::.:::::::.::: :::.::.::
CCDS33 YCLCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
840 850 860 870 880
>>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa)
initn: 2808 init1: 1472 opt: 2818 Z-score: 3042.5 bits: 574.0 E(32554): 3.8e-163
Smith-Waterman score: 2840; 49.1% identity (76.3% similar) in 865 aa overlap (1-861:1-852)
10 20 30 40 50 60
pF1KE9 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA
:.::::..::: :: : .. . : :: : : .. . . : : .
CCDS31 MSGRARVKARGIAR---------SPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSR
10 20 30 40 50
70 80 90 100 110
pF1KE9 KSQGLQ--ISAGFQELSLAERGGR-RRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTN
: . . ::.: .. ::: . ..:: ::.. ::..: ::.. ::::::: :.: ::
CCDS31 ISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE9 HFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQK
: : .: :::::. : : . .:::: :::..: .: .: .::::.:::: ..:..:
CCDS31 LFNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE9 VTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPND
:::. :.:. :: ...:::: ::: .::.:.: .:::::..:: ... :::::.:::..
CCDS31 VTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE9 PIDIPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQE
:..::.:.: .::::. :. .: .... .:::.::::.::::.:: . ..: : .
CCDS31 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE9 QVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDL
:.::::.:::.:::.:: .:::::. .: ::.: ::.:.....::..::. ..::
CCDS31 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE9 KQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQR
.::.::: :..:. . . : ::::::.::::::. .::..:: .: .:::.: :
CCDS31 NQPMLVSLLKKKRNDN-SEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE9 QREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNP-QFA
:....::.: :..: :.. ::. ::: : :.. :..:::. .::: . . . : . :
CCDS31 QQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQ--PVSAA
420 430 440 450 460
480 490 500 510 520 530
pF1KE9 DWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDD
::::. : ..... :..::.. . :. .:.:... : .:. .::... .:.:..
CCDS31 DWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQE
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE9 RTEAYLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQT
:..:..:: : :.:.:.:.: ::.: ::.::::: .:::.:::::.::::.::
CCDS31 NPAAFVRAIQQYVDPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGM
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE9 VMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMT
.:.::::::.::.::.::::: :.:::: .:.:::: .: . ..: :::.: .:
CCDS31 MMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRIT
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE9 RWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYE
:::::::.: ...: ::: . .:: : . :. .:.:::::: ::::::::::..::
CCDS31 RWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYE
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE9 VPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYD
:::.:. . . . . ::.::::.:. :::.. . .::: :::.: :.:: ::::
CCDS31 VPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYD
710 720 730 740 750 760
780 790 800 810 820 830
pF1KE9 FFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAH
:...::.. :.::::.::::::..::::::.::::.::::.::::::.. :::::::::
CCDS31 FYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAH
770 780 790 800 810 820
840 850 860
pF1KE9 KLAFLVGQSIHREPNLSLSNRLYYL
::.:::.::::.::.: :.:.:.::
CCDS31 KLTFLVAQSIHKEPSLELANHLFYL
830 840 850
>>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa)
initn: 1806 init1: 690 opt: 2324 Z-score: 2507.5 bits: 475.2 E(32554): 2.4e-133
Smith-Waterman score: 2324; 43.0% identity (74.4% similar) in 763 aa overlap (104-861:216-973)
80 90 100 110 120 130
pF1KE9 LSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYH
: ::.: :. : .. . . :.::::
CCDS60 SPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNE-AVYQYH
190 200 210 220 230 240
140 150 160 170 180 190
pF1KE9 IDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTEVFSKTR-NGEDVR
. ..: .: . .: ..: .:. . :. ::::.::.:: .::: : :. :. . .. ..
CCDS60 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-VLELKSQRKTDSAEIS
250 260 270 280 290 300
200 210 220 230 240 250
pF1KE9 ITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPIDIPSHRLVIWPGF
: : .:. : : : :. :::..:::..:..... .:::.:.:.. . . .::: ::::.
CCDS60 IKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIWPGY
310 320 330 340 350 360
260 270 280 290 300 310
pF1KE9 TTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKY
..:: . .....: .::::::.:.. ::: : .:.:..:: ::.. .: :.: .:.:.:
CCDS60 AASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQDECTKLLVGNIVITRY
370 380 390 400 410 420
320 330 340 350 360 370
pF1KE9 NNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQPVLVSQPKRRRGP
::.:::.::.::...::..: .::.:..::::: :.:. . . ::.:. .:..:.
CCDS60 NNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQDN
430 440 450 460 470 480
380 390 400 410 420 430
pF1KE9 GGTL-PGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKN
: : : .:.::: ..::. .::..:: .::::: . :.:.:.. . :.. : ::
CCDS60 HGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIAKN
490 500 510 520 530 540
440 450 460 470 480 490
pF1KE9 DNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSKETRGAPLISVK
. . :: ::: ..... .. ::.: :.:. . .: . : .: ::. : : .
CCDS60 EAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSF-ITSQELNWVKEVTRDPSILTI
550 560 570 580 590 600
500 510 520 530 540 550
pF1KE9 PLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEV-DDRTEAYLRVLQQKVT
:. : :.: .: .. : :.. : :.. .::.: .:. ::: :.:.:..:. .
CCDS60 PMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTLG
610 620 630 640 650 660
560 570 580 590 600
pF1KE9 AD--TQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQM
:. :.:::.. . : : : :::: :.. :.::: : .::.:. . ..: :: ::.
CCDS60 AEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQI
670 680 690 700 710 720
610 620 630 640 650 660
pF1KE9 NCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRG
:::.::::: :::::: .:..:.: ::: . : ::..::::::: .:.:.:: .::
CCDS60 NCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMPH
730 740 750 760 770 780
670 680 690 700 710 720
pF1KE9 QELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIG
::.::.::.:: ..:. . :. .: .:.::::::.::::::..:::.::. :....
CCDS60 QEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF-
790 800 810 820 830 840
730 740 750 760 770 780
pF1KE9 RGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS
..:.:...:.::.:...: .. . . .: ::::.: .: :: ::..... ::.:
CCDS60 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEWVDFYLLAHHVRQGC
850 860 870 880 890 900
790 800 810 820 830 840
pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR
:::: . ....:.:::.::::.::::.:.::::.:::::::.:::::::: :. .:.
CCDS60 GIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
910 920 930 940 950 960
850 860
pF1KE9 EPNLSLSNRLYYL
:: ..: . :..:
CCDS60 EPAIQLCENLFFL
970
>>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa)
initn: 1681 init1: 690 opt: 1949 Z-score: 2102.3 bits: 400.2 E(32554): 8.9e-111
Smith-Waterman score: 2124; 41.0% identity (70.8% similar) in 763 aa overlap (104-861:216-937)
80 90 100 110 120 130
pF1KE9 LSLAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYH
: ::.: :. : .. . . :.::::
CCDS83 SPPALPQSPLHSPDRPLVLTVEHKEKELIVKQGSKGTPQSLGLNLVKIQCHNE-AVYQYH
190 200 210 220 230 240
140 150 160 170 180 190
pF1KE9 IDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQKVTEVFSKTR-NGEDVR
. ..: .: . .: ..: .:. . :. ::::.::.:: .::: : :. :. . .. ..
CCDS83 VTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-VLELKSQRKTDSAEIS
250 260 270 280 290 300
200 210 220 230 240 250
pF1KE9 ITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPNDPIDIPSHRLVIWPGF
: : .:. : : : :. :::..:::..:..... .:::.:.:.. . . .::: ::::.
CCDS83 IKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTSAMVLQQHRLQIWPGY
310 320 330 340 350 360
260 270 280 290 300 310
pF1KE9 TTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKY
..:: . .....: .::::::.:.. ::: : .:.:..:: ::.. .: :.: .:.:.:
CCDS83 AASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNKEH-FQDECTKLLVGNIVITRY
370 380 390 400 410 420
320 330 340 350 360 370
pF1KE9 NNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDLKQPVLVSQPKRRRGP
::.:::.::.::...::..: .::.:..::::: :.:. . . ::.:. .:..:.
CCDS83 NNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEEDQPLLIHRPSERQDN
430 440 450 460 470 480
380 390 400 410 420 430
pF1KE9 GGTL-PGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKN
: : : .:.::: ..::. .::..:: .::::: . :.:.:.. . :.. : ::
CCDS83 HGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPKQHHSALECLLQRIAKN
490 500 510 520 530 540
440 450 460 470 480 490
pF1KE9 DNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNPQFADWSKETRGAPLISVK
. . :: ::: ..... .. ::.: :.:. . .: . : .: ::. : : .
CCDS83 EAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSF-ITSQELNWVKEVTRDPSILTI
550 560 570 580 590 600
500 510 520 530 540 550
pF1KE9 PLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEV-DDRTEAYLRVLQQKVT
:. : :.: .: .. : :.. : :.. .::.: .:. ::: :.:.:..:. .
CCDS83 PMHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELKDDRIETYVRTIQSTLG
610 620 630 640 650 660
560 570 580 590 600
pF1KE9 AD--TQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQM
:. :.:::.. . : : : :::: :.. :.::: : .::.:. . ..: :: ::.
CCDS83 AEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIGQPTRLRSVAQKILLQI
670 680 690 700 710 720
610 620 630 640 650 660
pF1KE9 NCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMTRWFSRCIFQDRG
:::.::::: :::::: .:..:.: ::: . : ::..::::::: .:.:.:: .::
CCDS83 NCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASINLTLTKWYSRVVFQMPH
730 740 750 760 770 780
670 680 690 700 710 720
pF1KE9 QELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDCLKSIG
::.::.::.:: ..:. . :. .: .:.::::::.::::::..:::.::. :....
CCDS83 QEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQKCFEAF-
790 800 810 820 830 840
730 740 750 760 770 780
pF1KE9 RGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS
..:.:...:.::.:...: .. . . .: ::::.: .: ::
CCDS83 ENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSCEW--------------
850 860 870 880
790 800 810 820 830 840
pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR
::.::::.:.::::.:::::::.:::::::: :. .:.
CCDS83 ----------------------LTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSGHILHH
890 900 910 920
850 860
pF1KE9 EPNLSLSNRLYYL
:: ..: . :..:
CCDS83 EPAIQLCENLFFL
930
>>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa)
initn: 441 init1: 252 opt: 450 Z-score: 484.3 bits: 100.2 E(32554): 1.2e-20
Smith-Waterman score: 597; 25.8% identity (57.4% similar) in 582 aa overlap (290-840:18-578)
260 270 280 290 300 310
pF1KE9 ENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQEQVSKELIGLVVLTKYNN---KT
:. :. . .::. :: : . . . .
CCDS40 MCEVLDIHNIDEQPRPLTDSHRV--KFTKEIKGLKVEVTHCGTMRRK
10 20 30 40
320 330 340 350 360 370
pF1KE9 YRVDDIDWDQNPKSTF--KKADGSEV--SFLEYYRKQYNQEITDLKQPVL-VSQPKRRRG
::: .. ..:: . .:. : . .:.:..:. .. . : : :.: ...
CCDS40 YRVCNVTRRPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCLQVGQEQKHT-
50 60 70 80 90 100
380 390 400 410 420
pF1KE9 PGGTLPGPA--MLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIH
:: . .. . : . ::: :. ..: . . .: .:. ::.:..::.
CCDS40 ---YLPLEVCNIVAGQRC-IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLVR--S
110 120 130 140 150
430 440 450 460 470 480
pF1KE9 KNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLI
: ... .... .. ... .::.: . .. ::.. .:. . : . :: .
CCDS40 ANYETDPFVQEFQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFH
160 170 180 190 200 210
490 500 510 520 530 540
pF1KE9 SVKPLDNWLL--IYTRRN--YEAANSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEA
. . : . . :.:. : ... ..: :.. :: .. . . : .:
CCDS40 TGVEIKMWAIACFATQRQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEP
220 230 240 250 260 270
550 560 570 580 590 600
pF1KE9 YLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAI
..: :.. .. :... .: . . : .:. : .::: .... : :
CCDS40 MFRHLKNTYSG-LQLIIVILPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVIK--TSPQT
280 290 300 310 320
610 620 630 640 650
pF1KE9 ATKIALQMNCKMGG------ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASIN
... :..: :.:: : .. . :...: : : .. :.. :::. :.:..
CCDS40 LSNLCLKINVKLGGINNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMD
330 340 350 360 370 380
660 670 680 690 700 710
pF1KE9 EGMTRWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTL
.:. . : ::... : .. : . . ... :.::: :::::..::.. .
CCDS40 AHPSRYCATVRVQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQV
390 400 410 420 430 440
720 730 740 750 760
pF1KE9 VNYEVPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFF----AQSGGRLQNPLPGTVIDVE
. ::. . . :. . :.: .: :::.:: .::.: .. :: : ::..:..
CCDS40 LYYELLAIREACISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTD
450 460 470 480 490 500
770 780 790 800 810 820
pF1KE9 VTRPEWYDFFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRV
.:.: .::.. :.: .:. :.::.:..:.. . :..: :::.::: : . .
CCDS40 ITHPYEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSI
510 520 530 540 550 560
830 840 850 860
pF1KE9 PAPCQYAHKLAFLVGQSIHREPNLSLSNRLYYL
::: ::: .::
CCDS40 PAPAYYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
570 580 590 600 610 620
>>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa)
initn: 481 init1: 252 opt: 450 Z-score: 482.2 bits: 100.3 E(32554): 1.6e-20
Smith-Waterman score: 679; 24.8% identity (54.9% similar) in 811 aa overlap (106-840:24-812)
80 90 100 110 120 130
pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID
:. : ..: .: :.. :. .: :..:
CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQVEI-PKIDVYLYEVD
10 20 30 40 50
140 150 160 170 180
pF1KE9 YNPLMEARRLRSAL---LFQHED--LIG-KCHAFDGT-ILFLPKRLQQKVT----EVFSK
.: ::. . . :: ..: . ..:: :. . : .: .:
CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP
60 70 80 90 100 110
190 200 210 220
pF1KE9 TRNGED----------VRITITLTNE------LP-------PTSPTCLQFYNIIFRRLLK
..:.: :.. : .: :: : : . .. ....:.: .
CCDS39 GEGGKDRPFKVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRHLPS
120 130 140 150 160 170
230 240 250 260 270
pF1KE9 IMNLQQIGRNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSET
:. .::.... . : : . : : : :: :. ..:: ::: .. ...
CCDS39 -MKYTPVGRSFFSAPEGYDHPLGGGREV-WFGFHQSVRPAMWKMMLNIDVSATAFYKAQP
180 190 200 210 220 230
280 290 300 310 320
pF1KE9 VLDFMFNFY--HQTEEH------KFQEQVSKELIGLVVLTKYNN---KTYRVDDIDWDQN
:..:: . :. .:. . . . .::. :: : . . . . ::: ..
CCDS39 VIQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPA
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE9 PKSTF--KKADGSEV--SFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--
..:: . .:. : . .:.:..:. .. . : : :.: ... :: .
CCDS39 SHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCLQVGQEQKHT----YLPLEVCN
300 310 320 330 340
390 400 410 420 430 440
pF1KE9 MLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRD
.. . : . ::: :. ..: . . .: .:. ::.:..::. : ... ...
CCDS39 IVAGQRC-IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLVR--SANYETDPFVQE
350 360 370 380 390
450 460 470 480 490
pF1KE9 WGLSFDSNLLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLL-
. .. ... .::.: . .. ::.. .:. . : . :: . . . : .
CCDS39 FQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIA
400 410 420 430 440 450
500 510 520 530 540 550
pF1KE9 -IYTRRN--YEAANSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTA
. :.:. : ... ..: :.. :: .. . . : .: ..: :.. ..
CCDS39 CFATQRQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG
460 470 480 490 500 510
560 570 580 590 600 610
pF1KE9 DTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCK
:... .: . . : .:. : .::: .... : : ... :..: :
CCDS39 -LQLIIVILPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVIK--TSPQTLSNLCLKINVK
520 530 540 550 560 570
620 630 640 650 660
pF1KE9 MGG------ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCI
.:: : .. . :...: : : .. :.. :::. :.:.. .:. .
CCDS39 LGGINNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVR
580 590 600 610 620 630
670 680 690 700 710 720
pF1KE9 FQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLDC
: ::... : .. : . . ... :.::: :::::..::.. .. ::. . .
CCDS39 VQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREA
640 650 660 670 680 690
730 740 750 760 770
pF1KE9 LKSIGRGYNPRLTVIVVKKRVNTRFF----AQSGGRLQNPLPGTVIDVEVTRPEWYDFFI
:. . :.: .: :::.:: .::.: .. :: : ::..:...:.: .::..
CCDS39 CISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYL
700 710 720 730 740 750
780 790 800 810 820 830
pF1KE9 VSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLA
:.: .:. :.::.:..:.. . :..: :::.::: : . .::: ::: .:
CCDS39 CSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVA
760 770 780 790 800 810
840 850 860
pF1KE9 FLVGQSIHREPNLSLSNRLYYL
:
CCDS39 FRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
820 830 840 850 860
>>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa)
initn: 502 init1: 243 opt: 444 Z-score: 475.7 bits: 99.1 E(32554): 3.6e-20
Smith-Waterman score: 705; 25.4% identity (56.5% similar) in 802 aa overlap (106-840:32-811)
80 90 100 110 120 130
pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID
:.:: ..:..: :.. . :. .:.:..:
CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEM-DIPKIDIYHYELD
10 20 30 40 50 60
140 150 160 170 180
pF1KE9 YNPLMEARRLRSAL---LFQH--EDLIG-KCHAFDG-----TILFLPKRLQQKVTEVFSK
.: ::. . . :: ...: . .::: : . :: ..:: .
CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIG-RDKVELEVTL
70 80 90 100 110
190 200 210 220
pF1KE9 TRNGED--VRITI-------------TLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIG
.:.: ...: .:...:: . .: ....:.: . : .:
CCDS63 PGEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPS-MRYTPVG
120 130 140 150 160 170
230 240 250 260 270 280
pF1KE9 RNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFM---
:.... .. . : . : : : :: :. ..:: ::: .. ... :..:.
CCDS63 RSFFTASEGCSNPLGGGREV-WFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV
180 190 200 210 220 230
290 300 310 320 330
pF1KE9 FNFYHQTEEHK----FQE-QVSKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF--K
..: :..: :. . .::. :: : . . . ::: .. ..:: .
CCDS63 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ
240 250 260 270 280 290
340 350 360 370 380
pF1KE9 KADGS--EVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCY
. .:. : . .:.. ... . . : : :.: ... :: . .. . :
CCDS63 QESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC-
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE9 LTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSN
. ::: :. ..: . . .: .:. ::.:...:. . :.. .:..:. ..
CCDS63 IKKLTD---NQTSTM--IRATARSAPD-RQEEISKLMR--SASFNTDPYVREFGIMVKDE
360 370 380 390 400
450 460 470 480 490 500
pF1KE9 LLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPL-ISVKPLDNWLLIYTRRNYE
. . .::.:: .: ::.. .: . :. ... : .: . :. :
CCDS63 MTDVTGRVLQPPSILYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTE
410 420 430 440 450 460
510 520 530 540 550 560
pF1KE9 AA-NSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCLLS
. .:. ..: :.. :: .. . . : .: ..: :.. : :.:: .:
CCDS63 VHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTY-AGLQLVVVILP
470 480 490 500 510 520
570 580 590 600 610
pF1KE9 SNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG------E
. . : .:. : .::: ... :.:. ... :..: :.::
CCDS63 G-KTPVYAEVKRVGDTVLGMATQCVQMKNV--QRTTPQTLSNLCLKINVKLGGVNNILLP
530 540 550 560 570 580
620 630 640 650 660 670
pF1KE9 LWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQELVD
: . . :...: : : .. :.. :::. :.:.. .:. . :.. ::...
CCDS63 QGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQ
590 600 610 620 630 640
680 690 700 710 720 730
pF1KE9 GLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRGYN
: . .. : . . ... :.::: :::::..::.. ....:. . . :.: . . :.
CCDS63 DLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIK-LEKDYQ
650 660 670 680 690
740 750 760 770 780
pF1KE9 PRLTVIVVKKRVNTRFFAQSG----GRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS
: .: :::.:: .::.: . :. : ::..:...:.: .::.. :.: .:.
CCDS63 PGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGT
700 710 720 730 740 750
790 800 810 820 830 840
pF1KE9 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR
:.::.:..:.. .. :..: :::.::: : . .::: ::: .::
CCDS63 SRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVD
760 770 780 790 800 810
850 860
pF1KE9 EPNLSLSNRLYYL
CCDS63 KEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
820 830 840 850
>>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa)
initn: 438 init1: 226 opt: 433 Z-score: 464.4 bits: 96.9 E(32554): 1.5e-19
Smith-Waterman score: 658; 25.1% identity (56.9% similar) in 680 aa overlap (203-840:76-734)
180 190 200 210 220 230
pF1KE9 RLQQKVTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNY
:. .: .. .:.: . : .::..
CCDS81 GKDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRHLAS-MRYTPVGRSF
50 60 70 80 90 100
240 250 260 270 280
pF1KE9 YNPNDPIDIP-SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFMF------
..: . : . .: :: :. ..:: ::: .. ... :..::
CCDS81 FSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIR
110 120 130 140 150 160
290 300 310 320 330
pF1KE9 NFYHQTEEHKFQEQV--SKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF----KKA
:. .: . ...: .::. :: : . . . . ::: .. ..:: ...
CCDS81 NIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESG
170 180 190 200 210 220
340 350 360 370 380 390
pF1KE9 DGSEVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCYLTGL
. : . .:....:: .. . : : :.: ... :: . .. . : . :
CCDS81 QTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC-IKKL
230 240 250 260 270
400 410 420 430 440 450
pF1KE9 TDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSF
:: :. ..: . . .: .:. ::.:..::. . . :.. ....:.. ...
CCDS81 TD---NQTSTM--IKATARSAPD-RQEEISRLMK--NASYNLDPYIQEFGIKVKDDMTEV
280 290 300 310 320 330
460 470 480 490 500 510
pF1KE9 SGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSL
.::.: . .. ::.. .:. . : . :: . . . : . . . . .
CCDS81 TGRVLPAPILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEV
340 350 360 370 380
520 530 540 550 560
pF1KE9 IQN----LFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCLLSSN
..: : :.. :: .. . . : .: ..: :.. .. :... .: .
CCDS81 LKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG-LQLIIVILPG-
390 400 410 420 430 440
570 580 590 600 610
pF1KE9 RKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG------ELW
. : .:. : .::: .... : : ... :..: :.::
CCDS81 KTPVYAEVKRVGDTLLGMATQCVQVKNVVK--TSPQTLSNLCLKINVKLGGINNILVPHQ
450 460 470 480 490 500
620 630 640 650 660 670
pF1KE9 RVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQELVDGL
: . . :...: : : .. :.. ::.. :.:.. .:. . : ::... :
CCDS81 RSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDL
510 520 530 540 550 560
680 690 700 710 720 730
pF1KE9 KVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRGYNPR
. .. : . . ... :.::: ::::: .::: ...::. . : :.: . . :.:
CCDS81 SYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIK-LEKDYQPG
570 580 590 600 610 620
740 750 760 770 780 790
pF1KE9 LTVIVVKKRVNTRFF-AQSGGRL--QNPLP-GTVIDVEVTRPEWYDFFIVSQAVRSGSVS
.: :::.:: .::.: :... :. .. .: ::..:...:.: .::.. :.: .:.
CCDS81 ITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSR
630 640 650 660 670 680
800 810 820 830 840 850
pF1KE9 PTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHREP
:.:: :..:.. . :..: :::.::: : . .::: ::. .::
CCDS81 PSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKE
690 700 710 720 730 740
860
pF1KE9 NLSLSNRLYYL
CCDS81 HDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA
750 760 770 780
>>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa)
initn: 438 init1: 226 opt: 433 Z-score: 463.8 bits: 96.9 E(32554): 1.6e-19
Smith-Waterman score: 689; 24.6% identity (55.8% similar) in 804 aa overlap (106-840:30-809)
80 90 100 110 120 130
pF1KE9 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID
:. : ..: .:.:.. . :. .:.:..:
CCDS39 MEAGPSGAAAGAYLPPLQQVFQAPRRPGIGTVGKPIKLLANYFEV-DIPKIDVYHYEVD
10 20 30 40 50
140 150 160 170 180
pF1KE9 YNPLMEARRLRSAL---LFQH--EDLIG-KCHAFDG-----TILFLPKRLQQKVTEVFSK
.: ::. . . :: ...: . ..:: :. :: ...: .
CCDS39 IKPDKCPRRVNREVVEYMVQHFKPQIFGDRKPVYDGKKNIYTVTALPIG-NERVDFEVTI
60 70 80 90 100 110
190 200 210 220
pF1KE9 TRNGED--VRITI-------------TLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIG
.:.: ...: .:.. :. .: .. .:.: . : .:
CCDS39 PGEGKDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRHLAS-MRYTPVG
120 130 140 150 160 170
230 240 250 260 270 280
pF1KE9 RNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFMF--
:....: . : . : : : :: :. ..:: ::: .. ... :..::
CCDS39 RSFFSPPEGYYHPLGGGREV-WFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEV
180 190 200 210 220 230
290 300 310 320 330
pF1KE9 ----NFYHQTEEHKFQEQV--SKELIGLVVLTKYNN---KTYRVDDIDWDQNPKSTF---
:. .: . ...: .::. :: : . . . . ::: .. ..::
CCDS39 LDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQ
240 250 260 270 280 290
340 350 360 370 380
pF1KE9 -KKADGSEVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCY
.... : . .:....:: .. . : : :.: ... :: . .. . :
CCDS39 LESGQTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC-
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE9 LTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSN
. ::: :. ..: . . .: .:. ::.:..::. . . :.. ....:.. ..
CCDS39 IKKLTD---NQTSTM--IKATARSAPD-RQEEISRLMK--NASYNLDPYIQEFGIKVKDD
360 370 380 390 400
450 460 470 480 490 500
pF1KE9 LLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPLISVKPLDNWLLIYTRRNYEA
. .::.: . .. ::.. .:. . : . :: . . . : . . .
CCDS39 MTEVTGRVLPAPILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQC
410 420 430 440 450 460
510 520 530 540 550
pF1KE9 ANSLIQN----LFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCL
. ...: : :.. :: .. . . : .: ..: :.. .. :... .
CCDS39 REEVLKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSG-LQLIIVI
470 480 490 500 510
560 570 580 590 600 610
pF1KE9 LSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG-----
: . . : .:. : .::: .... : : ... :..: :.::
CCDS39 LPG-KTPVYAEVKRVGDTLLGMATQCVQVKNVVK--TSPQTLSNLCLKINVKLGGINNIL
520 530 540 550 560 570
620 630 640 650 660 670
pF1KE9 -ELWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQEL
: . . :...: : : .. :.. ::.. :.:.. .:. . : ::.
CCDS39 VPHQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEI
580 590 600 610 620 630
680 690 700 710 720 730
pF1KE9 VDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRG
.. :. .. : . . ... :.::: ::::: .::: ...::. . : :.: . .
CCDS39 IEDLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIK-LEKD
640 650 660 670 680 690
740 750 760 770 780
pF1KE9 YNPRLTVIVVKKRVNTRFF-AQSGGRL--QNPLP-GTVIDVEVTRPEWYDFFIVSQAVRS
:.: .: :::.:: .::.: :... :. .. .: ::..:...:.: .::.. :.: .
CCDS39 YQPGITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQ
700 710 720 730 740 750
790 800 810 820 830 840
pF1KE9 GSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSI
:. :.:: :..:.. . :..: :::.::: : . .::: ::. .::
CCDS39 GTSRPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHL
760 770 780 790 800 810
850 860
pF1KE9 HREPNLSLSNRLYYL
CCDS39 VDKEHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA
820 830 840 850
861 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 14:44:56 2016 done: Mon Nov 7 14:44:57 2016
Total Scan time: 4.220 Total Display time: 0.310
Function used was FASTA [36.3.4 Apr, 2011]