FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2266, 852 aa
1>>>pF1KE2266 852 - 852 aa - 852 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6778+/-0.00124; mu= 18.4769+/- 0.075
mean_var=63.6145+/-12.662, 0's: 0 Z-trim(100.0): 24 B-trim: 0 in 0/48
Lambda= 0.160804
statistics sampled from 5923 (5937) to 5923 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.526), E-opt: 0.2 (0.182), width: 16
Scan time: 3.730
The best scores are: opt bits E(32554)
CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 5645 1319.2 0
CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 2818 663.3 4.9e-190
CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 1952 462.4 1.7e-129
CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 1603 381.5 3.8e-105
CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 1454 346.9 9.1e-95
CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 383 98.4 4.2e-20
CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 383 98.4 5.6e-20
CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 379 97.5 1.1e-19
CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 374 96.3 2.2e-19
CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 374 96.3 2.4e-19
CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 337 87.8 9.1e-17
>>CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 (852 aa)
initn: 5645 init1: 5645 opt: 5645 Z-score: 7069.7 bits: 1319.2 E(32554): 0
Smith-Waterman score: 5645; 100.0% identity (100.0% similar) in 852 aa overlap (1-852:1-852)
10 20 30 40 50 60
pF1KE2 MSGRARVKARGIARSPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSRISTNDKYGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MSGRARVKARGIARSPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSRISTNDKYGI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 SSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 WQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKVTELSSETQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 WQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKVTELSSETQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 RGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEPMEIPQHKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEPMEIPQHKL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 SLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 IVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDLNQPMLVSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDLNQPMLVSLL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 KKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 IQRNTNARFELETWGLHFGSQISLTGRIVPSEKILMQDHICQPVSAADWSKDIRTCKILN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 IQRNTNARFELETWGLHFGSQISLTGRIVPSEKILMQDHICQPVSAADWSKDIRTCKILN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 AQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQENPAAFVRAIQQYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 AQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQENPAAFVRAIQQYV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 DPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 CKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRITRWFSRCILQRTMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 CKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRITRWFSRCILQRTMT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 DVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 NTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE
790 800 810 820 830 840
850
pF1KE2 PSLELANHLFYL
::::::::::::
CCDS31 PSLELANHLFYL
850
>>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa)
initn: 2843 init1: 1472 opt: 2818 Z-score: 3525.1 bits: 663.3 E(32554): 4.9e-190
Smith-Waterman score: 2840; 49.1% identity (76.3% similar) in 865 aa overlap (1-852:1-861)
10 20 30 40 50
pF1KE2 MSGRARVKARGIAR---------SPSATEVGRIQASPLPRSVDLSNNEASSSNGFLGTSR
:.::::..::: :: : .. . : :: : : .. . . : : .
CCDS92 MTGRARARARGRARGQETAQLVGSTASQQPGYIQPRPQPPPAEGELFGRGRQRGTAGGTA
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 ISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTN
: . . ::.: .. ::: . ..:: ::.. ::..: ::.. ::::::: :.: ::
CCDS92 KSQGLQ--ISAGFQELSLAERGGR-RRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTN
70 80 90 100 110
120 130 140 150 160 170
pF1KE2 LFNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEK
: : .: :::::. : : . .:::: :::..: .: .: .::::.:::: ..:..:
CCDS92 HFRLTSRPQWALYQYHIDYNPLMEARRLRSALLFQHEDLIGKCHAFDGTILFLPKRLQQK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 VTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE
:::. :.:. :: ...:::: ::: .::.:.: .:::::..:: ... :::::.:::..
CCDS92 VTEVFSKTRNGEDVRITITLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIGRNYYNPND
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ
:..::.:.: .::::. :. .: .... .:::.::::.::::.:: . ..: : .
CCDS92 PIDIPSHRLVIWPGFTTSILQYENSIMLCTDVSHKVLRSETVLDFMFNFYHQTEEHKFQE
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL
:.::::.:::.:::.:: .:::::. .: ::.: ::.:.....::..::. ..::
CCDS92 QVSKELIGLVVLTKYNNKTYRVDDIDWDQNPKSTFKKADGSEVSFLEYYRKQYNQEITDL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 NQPMLVSLLKKKRNDNSEAQL-AHLIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGR
.::.::: :..:. .. : ::::::.::::::. .::..:: .: .:::.: :
CCDS92 KQPVLVSQPKRRRGPGGTLPGPAMLIPELCYLTGLTDKMRNDFNVMKDLAVHTRLTPEQR
360 370 380 390 400 410
420 430 440 450 460
pF1KE2 QQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQ--PVSAA
:....::.: :..: :.. ::. ::: : :.. :..:::. .::: . . . : . :
CCDS92 QREVGRLIDYIHKNDNVQRELRDWGLSFDSNLLSFSGRILQTEKIHQGGKTFDYNP-QFA
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE2 DWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQE
::::. : ..... :..::.. . :. .:.:... : .:. .::... .:.:..
CCDS92 DWSKETRGAPLISVKPLDNWLLIYTRRNYEAANSLIQNLFKVTPAMGMQMRKAIMIEVDD
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE2 NPAAFVRAIQQYVDPDVQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGM
:..:..:: : :.:.:.:.: ::.: ::.::::: .:::.:::::.::::.::
CCDS92 RTEAYLRVLQQKVTADTQIVVCLLSSNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQT
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE2 MMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVNPRIT
.:.::::::.::.::.::::: :.:::: .:.:::: .: . ..: :::.: .:
CCDS92 VMAIATKIALQMNCKMGGELWRVDIPLKLVMIVGIDCYHDMTAGRRSIAGFVASINEGMT
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE2 RWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYE
:::::::.: ...: ::: . .:: : . :. .:.:::::: ::::::::::..::
CCDS92 RWFSRCIFQDRGQELVDGLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYE
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE2 VPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRNEWYD
:::.:. . . . . ::.::::.:. :::.. . .::: :::.: :.:: ::::
CCDS92 VPQFLDCLKSIGRGYNPRLTVIVVKKRVNTRFFAQSGGRLQNPLPGTVIDVEVTRPEWYD
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE2 FYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAH
:...::.. :.::::.::::::..::::::.::::.::::.::::::.. :::::::::
CCDS92 FFIVSQAVRSGSVSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAH
780 790 800 810 820 830
830 840 850
pF1KE2 KLTFLVAQSIHKEPSLELANHLFYL
::.:::.::::.::.: :.:.:.::
CCDS92 KLAFLVGQSIHREPNLSLSNRLYYL
840 850 860
>>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa)
initn: 1749 init1: 554 opt: 1952 Z-score: 2438.5 bits: 462.4 E(32554): 1.7e-129
Smith-Waterman score: 1952; 39.4% identity (69.1% similar) in 779 aa overlap (83-852:204-973)
60 70 80 90 100 110
pF1KE2 STNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNL
:.. .:: : : ::.: : .: ::
CCDS60 FSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIV---KQGSKGTPQSLGLNL
180 190 200 210 220 230
120 130 140 150 160 170
pF1KE2 FNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKV
... .. .::::::. :.. . .:...: .:. ..... ::::.::.: ::.. :
CCDS60 VKIQC-HNEAVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-V
240 250 260 270 280
180 190 200 210 220 230
pF1KE2 TELSSETQRGET-IKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE
::.:. . . :.. : . . : : .:: .:..::...: :.: .:::::.:.
CCDS60 LELKSQRKTDSAEISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTS
290 300 310 320 330 340
240 250 260 270 280 290
pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ
: . ::.:..:::.: :. . :.. ::::.::.::. ::. : :. :.. : .
CCDS60 AMVLQQHRLQIWPGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNK-EHFQD
350 360 370 380 390 400
300 310 320 330 340 350
pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL
: : :.: ::.:::::::: :::.::. : .: :: :::...::...: :::..
CCDS60 ECTKLLVGNIVITRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEE
410 420 430 440 450 460
360 370 380 390 400
pF1KE2 NQPMLVSLLKKKRNDNSEAQLAH---LIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPS
.::.:. ..:.:: : :.::: :.::. .. .::. :: .:.. :::.
CCDS60 DQPLLIHR-PSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPK
470 480 490 500 510 520
410 420 430 440 450 460
pF1KE2 GRQQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQPVSAA
... : :.. : .: : :: :::.. ... .. ::..: :.: ... .
CCDS60 QHHSALECLLQRIAKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQEL
530 540 550 560 570 580
470 480 490 500 510 520
pF1KE2 DWSKDI-RTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQ
.: :.. : .::. .. : .. :. :. ..: :...:: .:. .. : ....
CCDS60 NWVKEVTRDPSILTIP-MHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELK
590 600 610 620 630 640
530 540 550 560 570 580
pF1KE2 ENPA-AFVRAIQQYVDPD--VQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLN
.. ..::.::. . . .:.:.::. . . : .::: . ::::: : .::..
CCDS60 DDRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIG
650 660 670 680 690 700
590 600 610 620 630 640
pF1KE2 KQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVN
. . :.: :: .:..::::::::.:.::::.:::.:.:: .: ::: :::.:
CCDS60 QPTRLRSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASIN
710 720 730 740 750 760
650 660 670 680 690 700
pF1KE2 PRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTL
.:.:.:: ..: ...: ::. ..:.:.:.:. :: :: .:.::: ::.::::::.
CCDS60 LTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTV
770 780 790 800 810 820
710 720 730 740 750 760
pF1KE2 IEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRN
.::.::: .. :. : . .. :.::.:: .. .. .: ::::: :
CCDS60 ANYEIPQL-QKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSC
830 840 850 860 870 880
770 780 790 800 810 820
pF1KE2 EWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPC
:: ::::... . .: ::.: . . .:.:::::::::::::.:.:::: . :::::
CCDS60 EWVDFYLLAHHVRQGCGIPTHYVCVLNTANLSPDHMQRLTFKLCHMYWNWPGTIRVPAPC
890 900 910 920 930 940
830 840 850
pF1KE2 QYAHKLTFLVAQSIHKEPSLELANHLFYL
.:::::.:: .. .:.::...: ..::.:
CCDS60 KYAHKLAFLSGHILHHEPAIQLCENLFFL
950 960 970
>>CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 (937 aa)
initn: 1641 init1: 554 opt: 1603 Z-score: 2001.2 bits: 381.5 E(32554): 3.8e-105
Smith-Waterman score: 1767; 37.5% identity (65.9% similar) in 779 aa overlap (83-852:204-937)
60 70 80 90 100 110
pF1KE2 STNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNL
:.. .:: : : ::.: : .: ::
CCDS83 FSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTVEHKEKELIV---KQGSKGTPQSLGLNL
180 190 200 210 220 230
120 130 140 150 160 170
pF1KE2 FNLDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFDGAILFLSQKLEEKV
... .. .::::::. :.. . .:...: .:. ..... ::::.::.: ::.. :
CCDS83 VKIQC-HNEAVYQYHVTFSPNVECKSMRFGMLKDHQAVTGNVTAFDGSILYLPVKLQQ-V
240 250 260 270 280
180 190 200 210 220 230
pF1KE2 TELSSETQRGET-IKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSE
::.:. . . :.. : . . : : .:: .:..::...: :.: .:::::.:.
CCDS83 LELKSQRKTDSAEISIKIQMTKILEPCSDLCIPFYNVVFRRVMKLLDMKLVGRNFYDPTS
290 300 310 320 330 340
240 250 260 270 280 290
pF1KE2 PMEIPQHKLSLWPGFAISVSYFERKLLFSADVSYKVLRNETVLEFMTALCQRTGLSCFTQ
: . ::.:..:::.: :. . :.. ::::.::.::. ::. : :. :.. : .
CCDS83 AMVLQQHRLQIWPGYAASIRRTDGGLFLLADVSHKVIRNDCVLDVMHAIYQQNK-EHFQD
350 360 370 380 390 400
300 310 320 330 340 350
pF1KE2 TCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITYVDYYKQQYDITVSDL
: : :.: ::.:::::::: :::.::. : .: :: :::...::...: :::..
CCDS83 ECTKLLVGNIVITRYNNRTYRIDDVDWNKTPKDSFTMSDGKEITFLEYYSKNYGITVKEE
410 420 430 440 450 460
360 370 380 390 400
pF1KE2 NQPMLVSLLKKKRNDNSEAQLAH---LIPELCFLTGLTDQATSDFQLMKAVAEKTRLSPS
.::.:. ..:.:: : :.::: :.::. .. .::. :: .:.. :::.
CCDS83 DQPLLIHR-PSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQINLSPK
470 480 490 500 510 520
410 420 430 440 450 460
pF1KE2 GRQQRLARLVDNIQRNTNARFELETWGLHFGSQI-SLTGRIVPSEKILMQDHICQPVSAA
... : :.. : .: : :: :::.. ... .. ::..: :.: ... .
CCDS83 QHHSALECLLQRIAKNEAATNELMRWGLRLQKDVHKIEGRVLPMERINLKNTSFITSQEL
530 540 550 560 570 580
470 480 490 500 510 520
pF1KE2 DWSKDI-RTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMGFNVDYPKIIKVQ
.: :.. : .::. .. : .. :. :. ..: :...:: .:. .. : ....
CCDS83 NWVKEVTRDPSILTIP-MHFWALFYPKRAMDQARELVNMLEKIAGPIGMRMSPPAWVELK
590 600 610 620 630 640
530 540 550 560 570 580
pF1KE2 ENPA-AFVRAIQQYVDPD--VQLVMCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLN
.. ..::.::. . . .:.:.::. . . : .::: . ::::: : .::..
CCDS83 DDRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCVQSPVPSQVVNVRTIG
650 660 670 680 690 700
590 600 610 620 630 640
pF1KE2 KQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVCKDALSKDVMVVGCVASVN
. . :.: :: .:..::::::::.:.::::.:::.:.:: .: ::: :::.:
CCDS83 QPTRLRSVAQKILLQINCKLGGELWGVDIPLKQLMVIGMDVYHDPSRGMRSVVGFVASIN
710 720 730 740 750 760
650 660 670 680 690 700
pF1KE2 PRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTL
.:.:.:: ..: ...: ::. ..:.:.:.:. :: :: .:.::: ::.::::::.
CCDS83 LTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYEVNHCLPEKIVVYRDGVSDGQLKTV
770 780 790 800 810 820
710 720 730 740 750 760
pF1KE2 IEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNRTVQNPPLGTVVDSEATRN
.::.::: .. :. : . .. :.::.:: .. .. .: ::::: :
CCDS83 ANYEIPQL-QKCFEAFENYQPKMVVFVVQKKISTNLYLAAPQNFVTPTPGTVVDHTITSC
830 840 850 860 870 880
770 780 790 800 810 820
pF1KE2 EWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPC
:: :::::::.:.:::: . :::::
CCDS83 EW------------------------------------LTFKLCHMYWNWPGTIRVPAPC
890 900
830 840 850
pF1KE2 QYAHKLTFLVAQSIHKEPSLELANHLFYL
.:::::.:: .. .:.::...: ..::.:
CCDS83 KYAHKLAFLSGHILHHEPAIQLCENLFFL
910 920 930
>>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa)
initn: 1432 init1: 561 opt: 1454 Z-score: 1814.8 bits: 346.9 E(32554): 9.1e-95
Smith-Waterman score: 2193; 39.5% identity (69.7% similar) in 887 aa overlap (1-852:1-882)
10 20 30
pF1KE2 MSGRARVKARGIAR--------SP-------SAT--EVGRIQASPLPRSVDLSN----NE
: ::::..::: :: .: ::: : ..:..: : . .. .
CCDS33 MPGRARTRARGRARRRESYQQEAPGGPRAPGSATTQEPPQLQSTPRPLQEEVPVVRPLQP
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE2 ASSSNGFLGTSRISTNDKYGISSGDAGSTFMERGVKNKQDFMDLSICTREKLAHVRNCKT
.. .: : .. . . : .: . ..:: . . :.:: . ::. . ::.. ::
CCDS33 RAARGGAGGGAQSQGVKEPGPEAGLHTAPLQERRIGGV--FQDLVVNTRQDMKHVKDSKT
70 80 90 100 110
100 110 120 130 140 150
pF1KE2 GSSGIPVKLVTNLFN-LDFPQDWQLYQYHVTYIPDLASRRLRIALLYSHSELSNKAKAFD
:: : :.:..: : .. :: : :.:.: : ::. . :: :: .: . .. . ::
CCDS33 GSEGTVVQLLANHFRVISRPQ-WVAYKYNVDYKPDIEDGNLRTILLDQHRRKFGERHIFD
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE2 GAILFLSQKLEEKVTELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLS
: :.::. :.:. .: : :. . .:.:. ...:: .:: :.. .::.::. .: :.
CCDS33 GNSLLLSRPLKERRVEWLSTTKDKNIVKITVEFSKELTPTSPDCLRYYNILFRRTFKLLD
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE2 MYQIGRNFYNPSEPMEIPQHKLSL--WPGFAISVSYFERKLLFSADVSYKVLRNETVLEF
. :.:::.:. .. ... .: :: : :.. :: .: .. . ::::.:.:: ::. .:
CCDS33 FEQVGRNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHKLLRIETAYDF
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE2 MTALCQRTGLSCFTQTCEKQLIGLIVLTRYNNRTYSIDDIDWSVKPTHTFQKRDGTEITY
. .. . . . ..::: ::::.:::.:: .:::::. .: ::.: ::..:::
CCDS33 IKRTSAQAQTGNIREEVTNKLIGSIVLTKYNNKTYRVDDIDWKQNPEDTFNKSDGSKITY
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE2 VDYYKQQYDITVSDLNQPMLVSLLKKKRN-DNSEAQLAHLIPELCFLTGLTDQATSDFQL
.:::.::. :. .::.::: . :.. ... . :::.:: .:::::. .:...
CCDS33 IDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTGLTDEICKDYSI
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE2 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQ-ISLTGRIVPSEKI
.: .:..::::: :.. : ......: : ..: :. : :.: .. .:. ::.. . .:
CCDS33 VKELAKHTRLSPRRRHHTLKEFINTLQDNKKVRELLQLWDLKFDTNFLSVPGRVLKNANI
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE2 LMQDHICQPVSAADWSKDIRTCKILNAQSLNTWLILCSDRTEYVAESFLNCLRRVAGSMG
.. .. . : .:::..:: .:::. :..:::: : .. : :. . :. :.. ::
CCDS33 VQGRRMVKANSQGDWSREIRELPLLNAMPLHSWLILYSRSSHREAMSLKGHLQSVTAPMG
480 490 500 510 520 530
520 530 540 550 560
pF1KE2 FNVDYPKIIKVQENPAAFVRAIQQYVDPDVQL---------VMCILPSNQKTYYDSIKKY
... ..:.:. . ... ....:. : .:. :.::::...: :::::.:
CCDS33 ITMKPAEMIEVDGDANSYIDTLRKYTRPTLQMGMSCLLVFKVICILPNDDKRRYDSIKRY
540 550 560 570 580 590
570 580 590 600 610 620
pF1KE2 LSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPLKSLMVVGIDVC
: . ::.:::::. .::.: . .:.::::.::.::.:: :: :: .. : ::::
CCDS33 LCTKCPIPSQCVVKKTLEKV-QARTIVTKIAQQMNCKMGGALWKVETDVQRTMFVGIDCF
600 610 620 630 640 650
630 640 650 660 670 680
pF1KE2 KDALSKDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGALNKWYKYNHDLP
.: .... ..: :::.: ..:.:.:.:..:.: ... :.. . .::. : : . ..:
CCDS33 HDIVNRQKSIAGFVASTNAELTKWYSQCVIQKTGEELVKELEICLKAALDVWCKNESSMP
660 670 680 690 700 710
690 700 710 720 730 740
pF1KE2 ARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKKCMPRFFTEMNR
.:::: :::::::..:...:. .. :. .. : .. :. :::.:. ::: . .
CCDS33 HSVIVYRDGVGDGQLQALLDHEAKKM-STYLKTISPNNFTLAFIVVKKRINTRFFLKHGS
720 730 740 750 760 770
750 760 770 780 790 800
pF1KE2 TVQNPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYDDNGLKPDHMQRLTFK
. :::: :::.: : ::::::::...:: . :::.::.:::::: ::.:: .::::.
CCDS33 NFQNPPPGTVIDVELTRNEWYDFFIVSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYC
780 790 800 810 820 830
810 820 830 840 850
pF1KE2 LCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLFYL
:::.::: :::. :::::.:::::..::.::::.::. :...::::
CCDS33 LCHMYYNLPGIIRVPAPCHYAHKLAYLVGQSIHQEPNRSLSTRLFYL
840 850 860 870 880
>>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa)
initn: 427 init1: 254 opt: 383 Z-score: 474.5 bits: 98.4 E(32554): 4.2e-20
Smith-Waterman score: 548; 24.7% identity (57.0% similar) in 567 aa overlap (295-831:27-578)
270 280 290 300 310 320
pF1KE2 YKVLRNETVLEFMTALCQRTGLSCFTQTCEKQLIGLIVLTRYNN---RTYSIDDIDWSVK
:.. :: : . . . : : . ..
CCDS40 MCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPA
10 20 30 40 50
330 340 350 360 370
pF1KE2 PTHTF--QKRDGTEI--TYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIP
.:: : ..: . : ..:....: . .. . : : .. ..... .. ...
CCDS40 SHQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVA
60 70 80 90 100 110
380 390 400 410 420 430
pF1KE2 ELCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLH
. :::. :: ..::.: : .:. ::....::: . . .:. : :
CCDS40 GQRCIKKLTDNQTST--MIKATA---RSAPD-RQEEISRLVRSANYETDP-FVQEFQFKV
120 130 140 150 160
440 450 460 470 480 490
pF1KE2 FGSQISLTGRIVPSEKILM--QDHICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SD
. .:::..:. . . ... : . : :.: .. .. .. : : : ..
CCDS40 RDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQ
170 180 190 200 210 220
500 510 520 530 540
pF1KE2 RT--EYVAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLV
: : . ..: . ::... . :. .. : . : .. : :. . ... .::.
CCDS40 RQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLI
230 240 250 260 270 280
550 560 570 580 590 600
pF1KE2 MCILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGEL
. :::.. .: . .:. .. . .::: .... : . . ... .... :::: .
CCDS40 IVILPGKTPVYAE-VKRVGDTLLGMATQCVQVKNVIKTSPQ--TLSNLCLKINVKLGG-I
290 300 310 320 330 340
610 620 630 640 650
pF1KE2 WAVEIP-------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRT
. .: . .. .: :: . . : ... :.:.. . .:. . .::
CCDS40 NNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRP
350 360 370 380 390 400
660 670 680 690 700 710
pF1KE2 MTDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAES
.. . : .. : ..:: .. :.::: :: ::..::.. .. ::. . .
CCDS40 RQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISL
410 420 430 440 450 460
720 730 740 750 760 770
pF1KE2 SSNTSSRLSVIVVRKKCMPRFF----TEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQV
.. . .. :::.:. :.: :: : : ::.::.. :. .:::: :..
CCDS40 EKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHA
470 480 490 500 510 520
780 790 800 810 820 830
pF1KE2 ACRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVA
. .:: :..:.:..::: . :..: ::..::: : ::.::: ::: ..:
CCDS40 GIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRAR
530 540 550 560 570 580
840 850
pF1KE2 QSIHKEPSLELANHLFYL
CCDS40 YHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
590 600 610 620
>>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa)
initn: 436 init1: 254 opt: 383 Z-score: 472.2 bits: 98.4 E(32554): 5.6e-20
Smith-Waterman score: 661; 23.4% identity (54.7% similar) in 806 aa overlap (100-831:24-812)
70 80 90 100 110 120
pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT
:. : :.::..: :....:. ..: :.:
CCDS39 MEIGSAGPAGAQPLLMVPRRPGYGTMGKPIKLLANCFQVEIPK-IDVYLYEVD
10 20 30 40 50
130 140 150 160 170
pF1KE2 YIPDLASRRLR---IALLYSHSELS---NKAKAFDGA-ILFLSQKLEEKVT------ELS
:: ::. . . .: ... .. ..:: :. .. : .: :
CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP
60 70 80 90 100 110
180 190 200 210
pF1KE2 SETQRGETIKMTI------------------TLKRELPSSSPVC---IQVFNIIFRKILK
.: . . .:..: :: . : ..:. ... ....:. :
CCDS39 GEGGKDRPFKVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRH-LP
120 130 140 150 160 170
220 230 240 250 260 270
pF1KE2 KLSMYQIGRNFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETV
.... .::.:.. : .. : .: :: :: :.... ::: .. . . :
CCDS39 SMKYTPVGRSFFSAPEGYDHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPV
180 190 200 210 220 230
280 290 300 310 320
pF1KE2 LEFMTALCQ--------RTGLSCFTQTCEKQLIGLIVLTRYNN---RTYSIDDIDWSVKP
..:: . . : . :.. :: : . . . : : . ..
CCDS39 IQFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPAS
240 250 260 270 280 290
330 340 350 360 370
pF1KE2 THTF--QKRDGTEI--TYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPE
.:: : ..: . : ..:....: . .. . : : .. ..... .. ...
CCDS39 HQTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAG
300 310 320 330 340 350
380 390 400 410 420 430
pF1KE2 LCFLTGLTDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHF
. :::. :: ..::.: : .:. ::....::: . . .:. : :
CCDS39 QRCIKKLTDNQTS--TMIKATA---RSAPD-RQEEISRLVRSANYETDP-FVQEFQFKVR
360 370 380 390 400
440 450 460 470 480 490
pF1KE2 GSQISLTGRIVPSEKILM--QDHICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SDR
. .:::..:. . . ... : . : :.: .. .. .. : : : ..:
CCDS39 DEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVW--DMRGKQFHTGVEIKMWAIACFATQR
410 420 430 440 450 460
500 510 520 530 540
pF1KE2 T--EYVAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVM
: . ..: . ::... . :. .. : . : .. : :. . ... .::..
CCDS39 QCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLII
470 480 490 500 510 520
550 560 570 580 590 600
pF1KE2 CILPSNQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELW
:::.. .: . .:. .. . .::: .... : . . ... .... :::: .
CCDS39 VILPGKTPVYAE-VKRVGDTLLGMATQCVQVKNVIKTSPQ--TLSNLCLKINVKLGG-IN
530 540 550 560 570
610 620 630 640 650
pF1KE2 AVEIP-------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTM
. .: . .. .: :: . . : ... :.:.. . .:. . .::
CCDS39 NILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPR
580 590 600 610 620 630
660 670 680 690 700 710
pF1KE2 TDVADCLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESS
.. . : .. : ..:: .. :.::: :: ::..::.. .. ::. . .
CCDS39 QEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLE
640 650 660 670 680 690
720 730 740 750 760 770
pF1KE2 SNTSSRLSVIVVRKKCMPRFF----TEMNRTVQNPPLGTVVDSEATRNEWYDFYLISQVA
.. . .. :::.:. :.: :: : : ::.::.. :. .:::: :...
CCDS39 KDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAG
700 710 720 730 740 750
780 790 800 810 820 830
pF1KE2 CRGTVSPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQ
.:: :..:.:..::: . :..: ::..::: : ::.::: ::: ..:
CCDS39 IQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARY
760 770 780 790 800 810
840 850
pF1KE2 SIHKEPSLELANHLFYL
CCDS39 HLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
820 830 840 850 860
>>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa)
initn: 410 init1: 242 opt: 379 Z-score: 467.2 bits: 97.5 E(32554): 1.1e-19
Smith-Waterman score: 679; 24.8% identity (57.4% similar) in 800 aa overlap (100-831:32-811)
70 80 90 100 110 120
pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT
:.:: .:: .:.:..:.:. ..:.:..
CCDS63 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPK-IDIYHYELD
10 20 30 40 50 60
130 140 150 160 170
pF1KE2 YIPDLASRRLR---IALLYSHSE---LSNKAKAFDG-AILFLSQKL---EEKVTELSSET
:. ::. . . .: . .... .::: :. .. : ..:: .
CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
70 80 90 100 110 120
180 190 200 210 220
pF1KE2 QRGET--IKMTI-------------TLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGR
.:. .:..: .:. .::: ::......:. : .. . .::
CCDS63 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRH-LPSMRYTPVGR
130 140 150 160 170
230 240 250 260 270 280
pF1KE2 NFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTALC-
.:.. :: : .: :: :: :.... ::: .. . . :.::. .
CCDS63 SFFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLD
180 190 200 210 220 230
290 300 310 320
pF1KE2 ------QRTGLSCFTQTCE--KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--QK
:. :. .: . :.. :: : . . : : . .. .:: :.
CCDS63 FKSIEEQQKPLTD-SQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQ
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE2 RDG--TEITYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGLT
..: .: : ..:.:... ... . : : .. ..... .. ... . ::
CCDS63 ESGQTVECTVAQYFKDRHKLVLRYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKLT
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE2 DQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-LT
:. :: ...:.: : .:. ::.....:. . . ::. .. .:. .... .:
CCDS63 DNQTS--TMIRATA---RSAPD-RQEEISKLMRSASFNTDPY--VREFGIMVKDEMTDVT
360 370 380 390 400
450 460 470 480 490
pF1KE2 GRIVPSEKILMQDH---ICQPVSAADWSKDIRTCKILNAQSLNTWLILC--SDR--TEYV
::.. .::. . : ::... : :.:. .. .. ...: : : .: ::
CCDS63 GRVLQPPSILYGGRNKAIATPVQGV-W--DMRNKQFHTGIEIKVWAIACFAPQRQCTEVH
410 420 430 440 450 460
500 510 520 530 540 550
pF1KE2 AESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPSN
.:: . ::... . :. .. : . : .. : :. . ... .:::. :::..
CCDS63 LKSFTEQLRKISRDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYAGLQLVVVILPGK
470 480 490 500 510 520
560 570 580 590 600 610
pF1KE2 QKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIPL
.: . .:. .. . .::: . : : . ... .... :::: . . .:
CCDS63 TPVYAE-VKRVGDTVLGMATQCVQMK--NVQRTTPQTLSNLCLKINVKLGG-VNNILLPQ
530 540 550 560 570 580
620 630 640 650 660
pF1KE2 -------KSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVADC
. .. .: :: . . : ... :.:.. . .:. . .:. .. .
CCDS63 GRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQD
590 600 610 620 630 640
670 680 690 700 710 720
pF1KE2 LKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSR
: ... : ..:: .. :.::: :: ::..::.. ....:. . . . .. .
CCDS63 LAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPG
650 660 670 680 690 700
730 740 750 760 770 780
pF1KE2 LSVIVVRKKCMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTVS
.. :::.:. :.: :. :. : : : ::.::.. :. .:::: :... .::
CCDS63 ITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSR
710 720 730 740 750 760
790 800 810 820 830 840
pF1KE2 PTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEP
:..:.:..::: .. :..: ::..::: : ::.::: ::: ..:
CCDS63 PSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKE
770 780 790 800 810 820
850
pF1KE2 SLELANHLFYL
CCDS63 HDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
830 840 850
>>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa)
initn: 414 init1: 225 opt: 374 Z-score: 461.6 bits: 96.3 E(32554): 2.2e-19
Smith-Waterman score: 646; 24.7% identity (58.6% similar) in 671 aa overlap (203-831:82-734)
180 190 200 210 220 230
pF1KE2 TELSSETQRGETIKMTITLKRELPSSSPVCIQVFNIIFRKILKKLSMYQIGRNFYNPSEP
.:.... .:. : .. . .::.:..: :
CCDS81 KVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPVGRSFFSPPEG
60 70 80 90 100 110
240 250 260 270 280
pF1KE2 MEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTALCQRTGLSC--
. : .: :: :: :.... ::: .. . . :.::: . . ...
CCDS81 YYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVLDIRNIDEQP
120 130 140 150 160 170
290 300 310 320 330
pF1KE2 --FTQTCE----KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--QKRDG--TEIT
.:.. . :.. :: : . . . : : . .. .:: : ..: .: :
CCDS81 KPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLESGQTVECT
180 190 200 210 220 230
340 350 360 370 380 390
pF1KE2 YVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGLTDQATSDFQL
..:.::.:.. .. . : : .. ..... .. ... . :::. :: .
CCDS81 VAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQTS--TM
240 250 260 270 280
400 410 420 430 440 450
pF1KE2 MKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-LTGRIVPSEKI
.::.: : .:. ::....::. : . : . .. .:.. .... .:::..:. :
CCDS81 IKATA---RSAPD-RQEEISRLMKNASYNLDPY--IQEFGIKVKDDMTEVTGRVLPAP-I
290 300 310 320 330 340
460 470 480 490 500
pF1KE2 LMQDHICQPVSAAD---WSKDIRTCKILNAQSLNTWLILC----SDRTEYVAESFLNCLR
:. . ... . : :.: .. :. ...: : : .. : : ..: . ::
CCDS81 LQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLR
350 360 370 380 390
510 520 530 540 550 560
pF1KE2 RVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPSNQKTYYDSIK
... . :. .. : . : .. : :. . ... .::.. :::.. .: . .:
CCDS81 KISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLIIVILPGKTPVYAE-VK
400 410 420 430 440 450
570 580 590 600 610
pF1KE2 KYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIP-------LKS
. .. . .::: .... : . . ... .... :::: . . .: .
CCDS81 RVGDTLLGMATQCVQVKNVVKTSPQT--LSNLCLKINVKLGG-INNILVPHQRSAVFQQP
460 470 480 490 500 510
620 630 640 650 660 670
pF1KE2 LMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVADCLKVFMTGAL
.. .: :: . . : ... :.:.. . .:. . .:: .. . :. .. :
CCDS81 VIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELL
520 530 540 550 560 570
680 690 700 710 720 730
pF1KE2 NKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSSRLSVIVVRKK
..:: .. :.::: :: :: .::: ...::. . .. . .. . .. :::.:.
CCDS81 IQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKR
580 590 600 610 620 630
740 750 760 770 780 790
pF1KE2 CMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTVSPTYYNVIYD
:.: .. :. . : : ::.::.. :. .:::: :... .:: :..: :..:
CCDS81 HHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWD
640 650 660 670 680 690
800 810 820 830 840 850
pF1KE2 DNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKEPSLELANHLF
:: . :..: ::..::: : ::.::: ::. ..:
CCDS81 DNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHI
700 710 720 730 740 750
pF1KE2 YL
CCDS81 SGQSNGRDPQALAKAVQVHQDTLRTMYFA
760 770 780
>>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa)
initn: 414 init1: 225 opt: 374 Z-score: 460.9 bits: 96.3 E(32554): 2.4e-19
Smith-Waterman score: 708; 24.5% identity (58.1% similar) in 801 aa overlap (100-831:30-809)
70 80 90 100 110 120
pF1KE2 MERGVKNKQDFMDLSICTREKLAHVRNCKTGSSGIPVKLVTNLFNLDFPQDWQLYQYHVT
:. : :.::..: :..:.:. ..:.:.:
CCDS39 MEAGPSGAAAGAYLPPLQQVFQAPRRPGIGTVGKPIKLLANYFEVDIPK-IDVYHYEVD
10 20 30 40 50
130 140 150 160 170
pF1KE2 YIPDLASRRLR---IALLYSHSE---LSNKAKAFDG--------AILFLSQKLEEKVTEL
:: ::. . . .: . .... ..:: :. . ..... .:: .
CCDS39 IKPDKCPRRVNREVVEYMVQHFKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVT-I
60 70 80 90 100 110
180 190 200 210 220
pF1KE2 SSETQRGETIKMTIT---------LKRELPSSS-PV---CIQVFNIIFRKILKKLSMYQI
.: . . .:..: :.. : :.. :: .:.... .:. : .. . .
CCDS39 PGEG-KDRIFKVSIKWLAIVSWRMLHEALVSGQIPVPLESVQALDVAMRH-LASMRYTPV
120 130 140 150 160 170
230 240 250 260 270 280
pF1KE2 GRNFYNPSEPMEIPQHK-LSLWPGFAISVSYFERKLLFSADVSYKVL-RNETVLEFMTAL
::.:..: : . : .: :: :: :.... ::: .. . . :.::: .
CCDS39 GRSFFSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEV
180 190 200 210 220 230
290 300 310 320
pF1KE2 CQRTGLSC----FTQTCE----KQLIGLIVLTRYNN---RTYSIDDIDWSVKPTHTF--Q
. ... .:.. . :.. :: : . . . : : . .. .:: :
CCDS39 LDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQ
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE2 KRDG--TEITYVDYYKQQYDITVSDLNQPMLVSLLKKKRNDNSEAQLAHLIPELCFLTGL
..: .: : ..:.::.:.. .. . : : .. ..... .. ... . :
CCDS39 LESGQTVECTVAQYFKQKYNLQLKYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRCIKKL
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE2 TDQATSDFQLMKAVAEKTRLSPSGRQQRLARLVDNIQRNTNARFELETWGLHFGSQIS-L
::. :: ..::.: : .:. ::....::. : . : . .. .:.. .... .
CCDS39 TDNQTS--TMIKATA---RSAPD-RQEEISRLMKNASYNLDPY--IQEFGIKVKDDMTEV
360 370 380 390 400
450 460 470 480 490
pF1KE2 TGRIVPSEKILMQDHICQPVSAAD---WSKDIRTCKILNAQSLNTWLILC----SDRTEY
:::..:. ::. . ... . : :.: .. :. ...: : : .. :
CCDS39 TGRVLPAP-ILQYGGRNRAIATPNQGVW--DMRGKQFYNGIEIKVWAIACFAPQKQCREE
410 420 430 440 450 460
500 510 520 530 540 550
pF1KE2 VAESFLNCLRRVAGSMGFNVD-YPKIIKVQENPAAFVRAIQQYVD---PDVQLVMCILPS
: ..: . ::... . :. .. : . : .. : :. . ... .::.. :::.
CCDS39 VLKNFTDQLRKISKDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYSGLQLIIVILPG
470 480 490 500 510 520
560 570 580 590 600 610
pF1KE2 NQKTYYDSIKKYLSSDCPVPSQCVLARTLNKQGMMMSIATKIAMQMTCKLGGELWAVEIP
. .: . .:. .. . .::: .... : . . ... .... :::: . . .:
CCDS39 KTPVYAE-VKRVGDTLLGMATQCVQVKNVVKTSPQ--TLSNLCLKINVKLGG-INNILVP
530 540 550 560 570
620 630 640 650 660
pF1KE2 -------LKSLMVVGIDVCKDALS--KDVMVVGCVASVNPRITRWFSRCILQRTMTDVAD
. .. .: :: . . : ... :.:.. . .:. . .:: .. .
CCDS39 HQRSAVFQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIE
580 590 600 610 620 630
670 680 690 700 710 720
pF1KE2 CLKVFMTGALNKWYKYNHDLPARIIVYRAGVGDGQLKTLIEYEVPQLLSSVAESSSNTSS
:. .. : ..:: .. :.::: :: :: .::: ...::. . .. . .. .
CCDS39 DLSYMVRELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQP
640 650 660 670 680 690
730 740 750 760 770 780
pF1KE2 RLSVIVVRKKCMPRFF-TEMNRTVQ---NPPLGTVVDSEATRNEWYDFYLISQVACRGTV
.. :::.:. :.: .. :. . : : ::.::.. :. .:::: :... .::
CCDS39 GITYIVVQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTS
700 710 720 730 740 750
790 800 810 820 830 840
pF1KE2 SPTYYNVIYDDNGLKPDHMQRLTFKLCHLYYNWPGIVSVPAPCQYAHKLTFLVAQSIHKE
:..: :..::: . :..: ::..::: : ::.::: ::. ..:
CCDS39 RPSHYYVLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDK
760 770 780 790 800 810
850
pF1KE2 PSLELANHLFYL
CCDS39 EHDSGEGSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA
820 830 840 850
852 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 00:11:28 2016 done: Mon Nov 7 00:11:29 2016
Total Scan time: 3.730 Total Display time: 0.300
Function used was FASTA [36.3.4 Apr, 2011]