FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9257, 859 aa
1>>>pF1KE9257 859 - 859 aa - 859 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8696+/-0.000901; mu= 14.7731+/- 0.055
mean_var=111.1954+/-21.906, 0's: 0 Z-trim(109.2): 14 B-trim: 0 in 0/51
Lambda= 0.121627
statistics sampled from 10723 (10735) to 10723 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.666), E-opt: 0.2 (0.33), width: 16
Scan time: 4.250
The best scores are: opt bits E(32554)
CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 ( 859) 5866 1040.5 0
CCDS55279.1 AGO2 gene_id:27161|Hs108|chr8 ( 825) 4936 877.3 0
CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 ( 857) 4926 875.6 0
CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 ( 782) 4607 819.6 0
CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 ( 860) 4302 766.1 0
CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 ( 626) 3722 664.2 2e-190
CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 ( 861) 3450 616.6 6e-176
CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 ( 861) 444 89.1 3.6e-17
CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 ( 882) 432 87.0 1.6e-16
CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 973) 412 83.5 2e-15
CCDS31656.1 PIWIL4 gene_id:143689|Hs108|chr11 ( 852) 379 77.7 9.8e-14
CCDS83261.1 PIWIL2 gene_id:55124|Hs108|chr8 ( 937) 337 70.3 1.7e-11
>>CCDS6380.1 AGO2 gene_id:27161|Hs108|chr8 (859 aa)
initn: 5866 init1: 5866 opt: 5866 Z-score: 5563.5 bits: 1040.5 E(32554): 0
Smith-Waterman score: 5866; 100.0% identity (100.0% similar) in 859 aa overlap (1-859:1-859)
10 20 30 40 50 60
pF1KE9 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 FFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 FFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 KSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 KSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQES
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 GQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 TSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 TSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 GGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 AGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 AGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 GMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 GMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTH
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 PPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 PPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 PTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 PTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 NERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 NERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQ
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 ILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 ILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQ
790 800 810 820 830 840
850
pF1KE9 ALAKAVQVHQDTLRTMYFA
:::::::::::::::::::
CCDS63 ALAKAVQVHQDTLRTMYFA
850
>>CCDS55279.1 AGO2 gene_id:27161|Hs108|chr8 (825 aa)
initn: 4936 init1: 4936 opt: 4936 Z-score: 4681.8 bits: 877.3 E(32554): 0
Smith-Waterman score: 5556; 96.0% identity (96.0% similar) in 859 aa overlap (1-859:1-825)
10 20 30 40 50 60
pF1KE9 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 FFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 KSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQES
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 GQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 TSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 GGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 AGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 AGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 GMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTH
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 PPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 PTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 NERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQ
::: :::::::::::::::::::::::
CCDS55 NER----------------------------------GTSRPSHYHVLWDDNRFSSDELQ
730 740
790 800 810 820 830 840
pF1KE9 ILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQ
750 760 770 780 790 800
850
pF1KE9 ALAKAVQVHQDTLRTMYFA
:::::::::::::::::::
CCDS55 ALAKAVQVHQDTLRTMYFA
810 820
>>CCDS398.1 AGO1 gene_id:26523|Hs108|chr1 (857 aa)
initn: 4904 init1: 4904 opt: 4926 Z-score: 4672.1 bits: 875.6 E(32554): 0
Smith-Waterman score: 4926; 83.0% identity (93.9% similar) in 857 aa overlap (5-859:3-857)
10 20 30 40 50
pF1KE9 MYSGAGPA-LAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYEL
:::. : : ::.: .:. : :: .:: :. ::: ::.::.::::::.::::.
CCDS39 MEAGPSGAAAGAYLPPLQ-QVFQAPRRPGIGTVGKPIKLLANYFEVDIPKIDVYHYEV
10 20 30 40 50
60 70 80 90 100 110
pF1KE9 DIKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTL
::::.:::::::::.::.:::::: :::::::::.::.::.::. :::: ..:..:::.
CCDS39 DIKPDKCPRRVNREVVEYMVQHFKPQIFGDRKPVYDGKKNIYTVTALPIGNERVDFEVTI
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE9 PGEGKDRIFKVSIKWVSCVSLQALHDAL-SGRLPSVPFETIQALDVVMRHLPSMRYTPVG
:::::::::::::::.. :: . ::.:: ::..: ::.:..:::::.:::: ::::::::
CCDS39 PGEGKDRIFKVSIKWLAIVSWRMLHEALVSGQIP-VPLESVQALDVAMRHLASMRYTPVG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE9 RSFFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVL
::::. :: .::::::::::::::::::..:::::::::::::::::::::::.::::
CCDS39 RSFFSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVIEFMCEVL
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE9 DFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQ
:...:.:: :::::::::.:::::::::::.::::::::::::::::::::::::::::
CCDS39 DIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE9 ESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTD
:::::::::::::::....: :.:::::::::::::::::::::::::::::::::::::
CCDS39 ESGQTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTD
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE9 NQTSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSI
:::::::.::::::::::::::.::..::.: :::..:::: :::.::.:::::: : .
CCDS39 NQTSTMIKATARSAPDRQEEISRLMKNASYNLDPYIQEFGIKVKDDMTEVTGRVLPAPIL
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE9 LYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKIS
:::::.::::: :::::::.:::..:::::::::::::::.:: : ::.::.::::::
CCDS39 QYGGRNRAIATPNQGVWDMRGKQFYNGIEIKVWAIACFAPQKQCREEVLKNFTDQLRKIS
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE9 RDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDT
.:::::::::::::::::::::::::::::::::.::::..:::::::::::::::::::
CCDS39 KDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSGLQLIIVILPGKTPVYAEVKRVGDT
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE9 VLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADV
.:::::::::.::: .:.:::::::::::::::::.::::.:. : :::::::::::::
CCDS39 LLGMATQCVQVKNVVKTSPQTLSNLCLKINVKLGGINNILVPHQRSAVFQQPVIFLGADV
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE9 THPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTR
:::::::::::::.::::::::::.:::::::::. :::::.::. ::::::::::::::
CCDS39 THPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMVRELLIQFYKSTR
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE9 FKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCT
::::::::::::: :::. :.::.::::::.::::::::::::::.:::::::::::::.
CCDS39 FKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIVVQKRHHTRLFCA
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE9 DKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDE
:::::.::::::::::::::.:::: :::::::::::::::::::::.::::::::..::
CCDS39 DKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYYVLWDDNRFTADE
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE9 LQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRD
::::::::::::::::::::::::::::.:::::::::::::::::.:::: ::::::::
CCDS39 LQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGEGSHISGQSNGRD
780 790 800 810 820 830
840 850
pF1KE9 HQALAKAVQVHQDTLRTMYFA
::::::::::::::::::::
CCDS39 PQALAKAVQVHQDTLRTMYFA
840 850
>>CCDS81300.1 AGO1 gene_id:26523|Hs108|chr1 (782 aa)
initn: 4594 init1: 4594 opt: 4607 Z-score: 4370.2 bits: 819.6 E(32554): 0
Smith-Waterman score: 4607; 84.8% identity (95.1% similar) in 783 aa overlap (78-859:1-782)
50 60 70 80 90 100
pF1KE9 DIPKIDIYHYELDIKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLP
:::::: :::::::::.::.::.::. ::
CCDS81 MVQHFKPQIFGDRKPVYDGKKNIYTVTALP
10 20 30
110 120 130 140 150 160
pF1KE9 IGRDKVELEVTLPGEGKDRIFKVSIKWVSCVSLQALHDAL-SGRLPSVPFETIQALDVVM
:: ..:..:::.:::::::::::::::.. :: . ::.:: ::..: ::.:..:::::.:
CCDS81 IGNERVDFEVTIPGEGKDRIFKVSIKWLAIVSWRMLHEALVSGQIP-VPLESVQALDVAM
40 50 60 70 80
170 180 190 200 210 220
pF1KE9 RHLPSMRYTPVGRSFFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYK
::: ::::::::::::. :: .::::::::::::::::::..::::::::::::::::
CCDS81 RHLASMRYTPVGRSFFSPPEGYYHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYK
90 100 110 120 130 140
230 240 250 260 270 280
pF1KE9 AQPVIEFVCEVLDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTR
:::::::.:::::...:.:: :::::::::.:::::::::::.:::::::::::::::::
CCDS81 AQPVIEFMCEVLDIRNIDEQPKPLTDSQRVRFTKEIKGLKVEVTHCGQMKRKYRVCNVTR
150 160 170 180 190 200
290 300 310 320 330 340
pF1KE9 RPASHQTFPLQQESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNI
::::::::::: :::::::::::::::....: :.:::::::::::::::::::::::::
CCDS81 RPASHQTFPLQLESGQTVECTVAQYFKQKYNLQLKYPHLPCLQVGQEQKHTYLPLEVCNI
210 220 230 240 250 260
350 360 370 380 390 400
pF1KE9 VAGQRCIKKLTDNQTSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMT
:::::::::::::::::::.::::::::::::::.::..::.: :::..:::: :::.::
CCDS81 VAGQRCIKKLTDNQTSTMIKATARSAPDRQEEISRLMKNASYNLDPYIQEFGIKVKDDMT
270 280 290 300 310 320
410 420 430 440 450 460
pF1KE9 DVTGRVLQPPSILYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVH
.:::::: : . :::::.::::: :::::::.:::..:::::::::::::::.:: :
CCDS81 EVTGRVLPAPILQYGGRNRAIATPNQGVWDMRGKQFYNGIEIKVWAIACFAPQKQCREEV
330 340 350 360 370 380
470 480 490 500 510 520
pF1KE9 LKSFTEQLRKISRDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKT
::.::.::::::.:::::::::::::::::::::::::::::::::.::::..:::::::
CCDS81 LKNFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSGLQLIIVILPGKT
390 400 410 420 430 440
530 540 550 560 570 580
pF1KE9 PVYAEVKRVGDTVLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPV
::::::::::::.:::::::::.::: .:.:::::::::::::::::.::::.:. : :
CCDS81 PVYAEVKRVGDTLLGMATQCVQVKNVVKTSPQTLSNLCLKINVKLGGINNILVPHQRSAV
450 460 470 480 490 500
590 600 610 620 630 640
pF1KE9 FQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMV
:::::::::::::::::::::::::.::::::::::.:::::::::. :::::.::. ::
CCDS81 FQQPVIFLGADVTHPPAGDGKKPSITAVVGSMDAHPSRYCATVRVQRPRQEIIEDLSYMV
510 520 530 540 550 560
650 660 670 680 690 700
pF1KE9 RELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIV
::::::::::::::::::::::::: :::. :.::.::::::.::::::::::::::.::
CCDS81 RELLIQFYKSTRFKPTRIIFYRDGVPEGQLPQILHYELLAIRDACIKLEKDYQPGITYIV
570 580 590 600 610 620
710 720 730 740 750 760
pF1KE9 VQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYH
:::::::::::.:::::.::::::::::::::.:::: :::::::::::::::::::::.
CCDS81 VQKRHHTRLFCADKNERIGKSGNIPAGTTVDTNITHPFEFDFYLCSHAGIQGTSRPSHYY
630 640 650 660 670 680
770 780 790 800 810 820
pF1KE9 VLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAE
::::::::..::::::::::::::::::::::::::::::.:::::::::::::::::.:
CCDS81 VLWDDNRFTADELQILTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKEHDSGE
690 700 710 720 730 740
830 840 850
pF1KE9 GSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
::: :::::::: ::::::::::::::::::::
CCDS81 GSHISGQSNGRDPQALAKAVQVHQDTLRTMYFA
750 760 770 780
>>CCDS399.1 AGO3 gene_id:192669|Hs108|chr1 (860 aa)
initn: 4644 init1: 4176 opt: 4302 Z-score: 4080.3 bits: 766.1 E(32554): 0
Smith-Waterman score: 4737; 80.0% identity (92.0% similar) in 859 aa overlap (10-859:6-860)
10 20 30 40 50 60
pF1KE9 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
: :: :. . : :: .:: :. ::: :: :...:::::.: ::.:
CCDS39 MEIGSAGPAGAQPL----LMVPRRPGYGTMGKPIKLLANCFQVEIPKIDVYLYEVD
10 20 30 40 50
70 80 90 100 110 120
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
:::.:::::::::.:. ::::::. :::::.::.::...:::: :::.. :.:.::::
CCDS39 IKPDKCPRRVNREVVDSMVQHFKVTIFGDRRPVYDGKRSLYTANPLPVATTGVDLDVTLP
60 70 80 90 100 110
130 140 150 160 170
pF1KE9 GEG-KDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFET--------IQALDVVMRHLPS
::: ::: ::::::.:: :: . ::..:.:: :.: ..:.:::.:::::
CCDS39 GEGGKDRPFKVSIKFVSRVSWHLLHEVLTGRTLPEPLELDKPISTNPVHAVDVVLRHLPS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE9 MRYTPVGRSFFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVI
:.:::::::::.: :: ..::::::::::::::::::..:::::::::::::::::::::
CCDS39 MKYTPVGRSFFSAPEGYDHPLGGGREVWFGFHQSVRPAMWKMMLNIDVSATAFYKAQPVI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE9 EFVCEVLDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASH
.:.:::::...:.:: .:::::.::::::::::::::.:::: :.:::::::::::::::
CCDS39 QFMCEVLDIHNIDEQPRPLTDSHRVKFTKEIKGLKVEVTHCGTMRRKYRVCNVTRRPASH
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE9 QTFPLQQESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQR
:::::: :.::::: ::::::.... : :.::::::::::::::::::::::::::::::
CCDS39 QTFPLQLENGQTVERTVAQYFREKYTLQLKYPHLPCLQVGQEQKHTYLPLEVCNIVAGQR
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE9 CIKKLTDNQTSTMIRATARSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTDVTGR
::::::::::::::.::::::::::::::.:.:::...:::.:.:: . :.:::. ::::
CCDS39 CIKKLTDNQTSTMIKATARSAPDRQEEISRLVRSANYETDPFVQEFQFKVRDEMAHVTGR
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE9 VLQPPSILYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFT
:: : . :::::...::: .::::::.::::::.:::.::::::: :::: : ::.::
CCDS39 VLPAPMLQYGGRNRTVATPSHGVWDMRGKQFHTGVEIKMWAIACFATQRQCREEILKGFT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE9 EQLRKISRDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAE
.::::::.:::::::::::::::::::::::::::::::::.::::..::::::::::::
CCDS39 DQLRKISKDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYSGLQLIIVILPGKTPVYAE
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE9 VKRVGDTVLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPV
:::::::.:::::::::.::: .:.:::::::::::::::::.::::.:. :: ::::::
CCDS39 VKRVGDTLLGMATQCVQVKNVIKTSPQTLSNLCLKINVKLGGINNILVPHQRPSVFQQPV
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE9 IFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLI
:::::::::::::::::::::::::::::::.:::::::::. :::::::::.:::::::
CCDS39 IFLGADVTHPPAGDGKKPSIAAVVGSMDAHPSRYCATVRVQRPRQEIIQDLASMVRELLI
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE9 QFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRH
:::::::::::::::::::::::::.:::..::::::::::.::::::::::.:::::::
CCDS39 QFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYELLAIREACISLEKDYQPGITYIVVQKRH
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE9 HTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDD
::::::.:..::::.:::::::::::: :::: :::::::::::::::::::::::::::
CCDS39 HTRLFCADRTERVGRSGNIPAGTTVDTDITHPYEFDFYLCSHAGIQGTSRPSHYHVLWDD
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE9 NRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTS
: :..::::.::::::::::::::::::::::::::::::::::::::::::::::::.:
CCDS39 NCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHVS
780 790 800 810 820 830
840 850
pF1KE9 GQSNGRDHQALAKAVQVHQDTLRTMYFA
::::::: ::::::::.:::::::::::
CCDS39 GQSNGRDPQALAKAVQIHQDTLRTMYFA
840 850 860
>>CCDS400.1 AGO3 gene_id:192669|Hs108|chr1 (626 aa)
initn: 3722 init1: 3722 opt: 3722 Z-score: 3532.4 bits: 664.2 E(32554): 2e-190
Smith-Waterman score: 3722; 85.6% identity (95.8% similar) in 626 aa overlap (234-859:1-626)
210 220 230 240 250 260
pF1KE9 QSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDFKSIEEQQKPLTDSQRVKFTKEIK
.:::::...:.:: .:::::.:::::::::
CCDS40 MCEVLDIHNIDEQPRPLTDSHRVKFTKEIK
10 20 30
270 280 290 300 310 320
pF1KE9 GLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQESGQTVECTVAQYFKDRHKLVLRYP
:::::.:::: :.::::::::::::::::::::: :.::::: ::::::.... : :.::
CCDS40 GLKVEVTHCGTMRRKYRVCNVTRRPASHQTFPLQLENGQTVERTVAQYFREKYTLQLKYP
40 50 60 70 80 90
330 340 350 360 370 380
pF1KE9 HLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQTSTMIRATARSAPDRQEEISKLM
::::::::::::::::::::::::::::::::::::::::::.::::::::::::::.:.
CCDS40 HLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQTSTMIKATARSAPDRQEEISRLV
100 110 120 130 140 150
390 400 410 420 430 440
pF1KE9 RSASFNTDPYVREFGIMVKDEMTDVTGRVLQPPSILYGGRNKAIATPVQGVWDMRNKQFH
:::...:::.:.:: . :.:::. :::::: : . :::::...::: .::::::.::::
CCDS40 RSANYETDPFVQEFQFKVRDEMAHVTGRVLPAPMLQYGGRNRTVATPSHGVWDMRGKQFH
160 170 180 190 200 210
450 460 470 480 490 500
pF1KE9 TGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQGADSVEP
::.:::.::::::: :::: : ::.::.::::::.::::::::::::::::::::::::
CCDS40 TGVEIKMWAIACFATQRQCREEILKGFTDQLRKISKDAGMPIQGQPCFCKYAQGADSVEP
220 230 240 250 260 270
510 520 530 540 550 560
pF1KE9 MFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVLGMATQCVQMKNVQRTTPQTLSNL
:::::::::.::::..:::::::::::::::::::.:::::::::.::: .:.:::::::
CCDS40 MFRHLKNTYSGLQLIIVILPGKTPVYAEVKRVGDTLLGMATQCVQVKNVIKTSPQTLSNL
280 290 300 310 320 330
570 580 590 600 610 620
pF1KE9 CLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPN
::::::::::.::::.:. :: :::::::::::::::::::::::::::::::::::::.
CCDS40 CLKINVKLGGINNILVPHQRPSVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPS
340 350 360 370 380 390
630 640 650 660 670 680
pF1KE9 RYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHE
:::::::::. :::::::::.::::::::::::::::::::::::::::::::.:::..:
CCDS40 RYCATVRVQRPRQEIIQDLASMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFRQVLYYE
400 410 420 430 440 450
690 700 710 720 730 740
pF1KE9 LLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHP
:::::::::.::::::::::.:::::::::::::.:..::::.:::::::::::: ::::
CCDS40 LLAIREACISLEKDYQPGITYIVVQKRHHTRLFCADRTERVGRSGNIPAGTTVDTDITHP
460 470 480 490 500 510
750 760 770 780 790 800
pF1KE9 TEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPA
:::::::::::::::::::::::::::: :..::::.::::::::::::::::::::::
CCDS40 YEFDFYLCSHAGIQGTSRPSHYHVLWDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPA
520 530 540 550 560 570
810 820 830 840 850
pF1KE9 YYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
::::::::::::::::::::::::::.:::::::: ::::::::.:::::::::::
CCDS40 YYAHLVAFRARYHLVDKEHDSAEGSHVSGQSNGRDPQALAKAVQIHQDTLRTMYFA
580 590 600 610 620
>>CCDS397.1 AGO4 gene_id:192670|Hs108|chr1 (861 aa)
initn: 3443 init1: 2009 opt: 3450 Z-score: 3272.3 bits: 616.6 E(32554): 6e-176
Smith-Waterman score: 4698; 78.4% identity (92.0% similar) in 860 aa overlap (12-859:6-861)
10 20 30 40 50 60
pF1KE9 MYSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDIPKIDIYHYELD
:.:: . :.:: :: .:: :. :.: :: :...:::::.:::..:
CCDS39 MEALGPGPPASL----FQPPRRPGLGTVGKPIRLLANHFQVQIPKIDVYHYDVD
10 20 30 40 50
70 80 90 100 110 120
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
::::: :::::::.:. ::.::: ::::::.: .::..:.::: :::::::.:..:::::
CCDS39 IKPEKRPRRVNREVVDTMVRHFKMQIFGDRQPGYDGKRNMYTAHPLPIGRDRVDMEVTLP
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE9 GEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRS
:::::. ::::..::: :::: : .::.:.: :: ...:::::. ::::::::::::::
CCDS39 GEGKDQTFKVSVQWVSVVSLQLLLEALAGHLNEVPDDSVQALDVITRHLPSMRYTPVGRS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE9 FFTASEGCSNPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLDF
::. :: .::::::::::::::::::..:.:::::::::::::.:::.:::.:::::.
CCDS39 FFSPPEGYYHPLGGGREVWFGFHQSVRPAMWNMMLNIDVSATAFYRAQPIIEFMCEVLDI
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE9 KSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQES
..:.:: :::::::::::::::.:::::.:::::::::::::::::::::::::::: :.
CCDS39 QNINEQTKPLTDSQRVKFTKEIRGLKVEVTHCGQMKRKYRVCNVTRRPASHQTFPLQLEN
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE9 GQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
::..:::::::::....: :.:::::::::::::::::::::::::::::::::::::::
CCDS39 GQAMECTVAQYFKQKYSLQLKYPHLPCLQVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQ
300 310 320 330 340 350
370 380 390 400 410
pF1KE9 TSTMIRATARSAPDRQEEISKLMRSASF--NTDPYVREFGIMVKDEMTDVTGRVLQPPSI
:::::.::::::::::::::.:..: :. . :::..::::.:..:::..::::: : .
CCDS39 TSTMIKATARSAPDRQEEISRLVKSNSMVGGPDPYLKEFGIVVHNEMTELTGRVLPAPML
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE9 LYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKIS
::::::..::: :::::::.:::..::::::::.::::::.:: : :::::.::::::
CCDS39 QYGGRNKTVATPNQGVWDMRGKQFYAGIEIKVWAVACFAPQKQCREDLLKSFTDQLRKIS
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE9 RDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDT
.::::::::::::::::::::::::::.::: ::.::::.::::::::::::::::::::
CCDS39 KDAGMPIQGQPCFCKYAQGADSVEPMFKHLKMTYVGLQLIVVILPGKTPVYAEVKRVGDT
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE9 VLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADV
.:::::::::.::: .:.::::::::::::.::::.::.:.:. :: :::::::::::::
CCDS39 LLGMATQCVQVKNVVKTSPQTLSNLCLKINAKLGGINNVLVPHQRPSVFQQPVIFLGADV
540 550 560 570 580 590
600 610 620 630 640
pF1KE9 THPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEI----------IQDLAAMVRE
:::::::::::::::::::::.::.::::::::: :::: ::::. ::::
CCDS39 THPPAGDGKKPSIAAVVGSMDGHPSRYCATVRVQTSRQEISQELLYSQEVIQDLTNMVRE
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE9 LLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQ
:::::::::::::::::.:: ::::::..:: ::.:::.:::.::.::.::::.::::
CCDS39 LLIQFYKSTRFKPTRIIYYRGGVSEGQMKQVAWPELIAIRKACISLEEDYRPGITYIVVQ
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE9 KRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVL
:::::::::.::.::::::::.:::::::. ::::.:::::::::::::::::::::.::
CCDS39 KRHHTRLFCADKTERVGKSGNVPAGTTVDSTITHPSEFDFYLCSHAGIQGTSRPSHYQVL
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE9 WDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGS
:::: :..::::.:::::::::::::::::::::::::.:::::::::::::.:::::::
CCDS39 WDDNCFTADELQLLTYQLCHTYVRCTRSVSIPAPAYYARLVAFRARYHLVDKDHDSAEGS
780 790 800 810 820 830
830 840 850
pF1KE9 HTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
:.:::::::: ::::::::.:.:: .:::::
CCDS39 HVSGQSNGRDPQALAKAVQIHHDTQHTMYFA
840 850 860
>>CCDS9268.1 PIWIL1 gene_id:9271|Hs108|chr12 (861 aa)
initn: 502 init1: 243 opt: 444 Z-score: 421.7 bits: 89.1 E(32554): 3.6e-17
Smith-Waterman score: 705; 25.3% identity (56.0% similar) in 802 aa overlap (32-811:106-840)
10 20 30 40 50 60
pF1KE9 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFEMDI-PKIDIYHYELD
:.:: ..:..: :.. :. .:.:..:
CCDS92 LAERGGRRRDFHDLGVNTRQNLDHVKESKTGSSGIIVRLSTNHFRLTSRPQWALYQYHID
80 90 100 110 120 130
70 80 90 100 110
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIG-RDKVELEVTL
.: ::. . . :: ...: . .::: : . :: ..:: .
CCDS92 YNPLMEARRLRSAL---LFQH--EDLIG-KCHAFDG-----TILFLPKRLQQKVTEVFSK
140 150 160 170 180
120 130 140 150 160 170
pF1KE9 PGEGKDRIFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRHLPS-MRYTPVG
.:.: ...: .:...:: . .: ....:.: . : .:
CCDS92 TRNGED--VRITI-------------TLTNELPPTSPTCLQFYNIIFRRLLKIMNLQQIG
190 200 210 220
180 190 200 210 220 230
pF1KE9 RSFFTASEGCSNPLGGGREV-WFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV
:.... .. . : . : : : :: :. ..:: ::: .. ... :..:.
CCDS92 RNYYNPNDPIDIP--SHRLVIWPGFTTSILQYENSIMLCTDVSHKVL-RSETVLDFM---
230 240 250 260 270 280
240 250 260 270 280 290
pF1KE9 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ
..: :..: . . .::. :: : . .. ::: .. ..:: .
CCDS92 FNFYHQTEEHKF-----QEQVSKELIGLVVLTKY---NNKTYRVDDIDWDQNPKSTF--K
290 300 310 320 330
300 310 320 330 340 350
pF1KE9 QESGQTVECTVAQYFKDRHKLVLRYPHLPCLQVGQEQKHT----YLPLEVCNIVAGQRC-
. .:. : . .:.. ... . . : : :.: ... :: . .. . :
CCDS92 KADGS--EVSFLEYYRKQYNQEITDLKQPVL-VSQPKRRRGPGGTLPGPA--MLIPELCY
340 350 360 370 380
360 370 380 390 400
pF1KE9 IKKLTD---NQTSTM--IRATARSAPD-RQEEISKLMRSASFNTDPY--VREFGIMVKDE
. ::: :. ..: . . .: .:. ::.:...:. : . .:..:. ..
CCDS92 LTGLTDKMRNDFNVMKDLAVHTRLTPEQRQREVGRLIDYIHKNDNVQRELRDWGLSFDSN
390 400 410 420 430 440
410 420 430 440 450 460
pF1KE9 MTDVTGRVLQPPSILYGGRNKAIATPVQGVWDMRNKQFHTGIEIKVWAIACFAPQRQCTE
. . .::.:: .: ::.. .: . :. ... : .: . :. :
CCDS92 LLSFSGRILQTEKIHQGGKTFDY-NPQFADWSKETRGAPL-ISVKPLDNWLLIYTRRNYE
450 460 470 480 490 500
470 480 490 500 510 520
pF1KE9 VHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQGADSVEPMFRHLKNTY-AGLQLVVVILP
. .:. ..: :.. :: .. . . : .: ..: :.. : :.:: .:
CCDS92 AA-NSLIQNLFKVTPAMGMQMRKAI----MIEVDDRTEAYLRVLQQKVTADTQIVVCLLS
510 520 530 540 550 560
530 540 550 560 570 580
pF1KE9 G-KTPVYAEVKRVGDTVLGMATQCVQMKNV--QRTTPQTLSNLCLKINVKLGGVNNILLP
. . : .:. : .::: ... :.:. ... :..: :.::
CCDS92 SNRKDKYDAIKKYLCTDCPTPSQCVVARTLGKQQTVMAIATKIALQMNCKMGG------E
570 580 590 600 610
590 600 610 620 630 640
pF1KE9 QGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQ
: . . :...: : : .. :.. :::. :.:.. .:. . :.. ::...
CCDS92 LWRVDIPLKLVMIVGIDCYHDMTA-GRR-SIAGFVASINEGMTRWFSRCIFQDRGQELVD
620 630 640 650 660 670
650 660 670 680 690
pF1KE9 DLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIK-LEKDYQ
: . .. : . . ... :.::: :::::..::.. ....:. . . :.: . . :.
CCDS92 GLKVCLQAALRAWNSCNEYMPSRIIVYRDGVGDGQLKTLVNYEVPQFLD-CLKSIGRGYN
680 690 700 710 720 730
700 710 720 730 740 750
pF1KE9 PGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGT
: .: :::.:: .::.: . :. : ::..:...:.: .::.. :.: .:.
CCDS92 PRLTVIVVKKRVNTRFFAQSG----GRLQNPLPGTVIDVEVTRPEWYDFFIVSQAVRSGS
740 750 760 770 780
760 770 780 790 800 810
pF1KE9 SRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVD
:.::.:..:.. .. :..: :::.::: : . .::: ::: .::
CCDS92 VSPTHYNVIYDNSGLKPDHIQRLTYKLCHIYYNWPGVIRVPAPCQYAHKLAFLVGQSIHR
790 800 810 820 830 840
820 830 840 850
pF1KE9 KEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
CCDS92 EPNLSLSNRLYYL
850 860
>>CCDS33623.1 PIWIL3 gene_id:440822|Hs108|chr22 (882 aa)
initn: 345 init1: 221 opt: 432 Z-score: 410.1 bits: 87.0 E(32554): 1.6e-16
Smith-Waterman score: 665; 25.4% identity (55.1% similar) in 811 aa overlap (32-811:119-861)
10 20 30 40 50 60
pF1KE9 YSGAGPALAPPAPPPPIQGYAFKPPPRPDFGTSGRTIKLQANFFE-MDIPKIDIYHYELD
:. : ...: :: :. .. :. :.:..:
CCDS33 PLQERRIGGVFQDLVVNTRQDMKHVKDSKTGSEGTVVQLLANHFRVISRPQWVAYKYNVD
90 100 110 120 130 140
70 80 90 100 110 120
pF1KE9 IKPEKCPRRVNREIVEHMVQHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLP
::. . : :. . :: . ::.:. .::: . : . :. . .:: :
CCDS33 YKPDIEDGNL-RTIL--LDQHRRK--FGERH-IFDGNSLLLSR---PLKERRVEWLSTT-
150 160 170 180 190
130 140 150 160 170
pF1KE9 GEGKDR-IFKVSIKWVSCVSLQALHDALSGRLPSVPFETIQALDVVMRH-LPSMRYTPVG
::. : :..... . .. :. : . .. ....:. . . . ::
CCDS33 ---KDKNIVKITVEFSKELT------------PTSP-DCLRYYNILFRRTFKLLDFEQVG
200 210 220 230 240
180 190 200 210 220 230
pF1KE9 RSFFTASEGCS-NPLGGGREVWFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEV
:...: ... . : . :.:.:. :: .. : ::: . . . . .:.
CCDS33 RNYYTKKKAIQLYRHGTSLEIWLGYVTSVLQYENSITLCADVSHK-LLRIETAYDFI---
250 260 270 280 290
240 250 260 270 280 290
pF1KE9 LDFKSIEEQQKPLTDSQRVKFTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQ
: : . : . : . :... : .. .:. .. . ::: .. . ..:: .
CCDS33 ---KRTSAQAQ--TGNIREEVTNKLIG-SIVLTKYNN--KTYRVDDIDWKQNPEDTF--N
300 310 320 330 340
300 310 320 330 340 350
pF1KE9 QESGQTVECTVAQYFKDRHKLVLRYPHLPCL-QVGQEQKHTYLPLEVCNIVAGQRC-IKK
. .:. . : .:....:: .. . : : . :. .: . .. : : .
CCDS33 KSDGSKI--TYIDYYRQQHKEIVTVKKQPLLVSQGRWKKGLTGTQREPILLIPQLCHMTG
350 360 370 380 390 400
360 370 380 390 400
pF1KE9 LTDN--QTSTMIRATA---RSAPDRQEEISKLMRSASFNTDPYVREFGIMVKDEMTD---
:::. . .... : : .: :... : . . ... . :::. ... : :
CCDS33 LTDEICKDYSIVKELAKHTRLSPRRRHHTLKEFIN-TLQDNKKVREL-LQLWDLKFDTNF
410 420 430 440 450 460
410 420 430 440 450 460
pF1KE9 --VTGRVLQPPSILYGGRNKAIATPVQGVW--DMRNKQFHTGIEIKVWAIACFAPQRQCT
: ::::. .:. : : . . :: : ..:. . ... .. : : .. . .
CCDS33 LSVPGRVLKNANIVQGRR--MVKANSQGDWSREIRELPLLNAMPLHSWLIL-YSRSSHRE
470 480 490 500 510 520
470 480 490 500 510
pF1KE9 EVHLKSFTEQLRKISRDAGMPIQGQPCFCKYAQG-ADSVEPMFRHLKNTYAGLQL-----
. ::. .:.... : : : .: ..: :.: .: : : ::.
CCDS33 AMSLKG---HLQSVT--APMGITMKPAEMIEVDGDANSYIDTLR--KYTRPTLQMGMSCL
530 540 550 560 570
520 530 540 550 560 570
pF1KE9 ----VVVILPGKTPV-YAEVKRVGDTVLGMATQCVQMKNVQRTTPQTL-SNLCLKINVKL
:. :::. : .:: : . .::: :..... .:. ... ..: :.
CCDS33 LVFKVICILPNDDKRRYDSIKRYLCTKCPIPSQCVVKKTLEKVQARTIVTKIAQQMNCKM
580 590 600 610 620 630
580 590 600 610 620 630
pF1KE9 GGVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRV
::. : . . : : ..:.: : : .. .. :::. :.: .:. ... . .
CCDS33 GGA----LWKVETDV--QRTMFVGIDCFHDIVN--RQKSIAGFVASTNAELTKWYSQCVI
640 650 660 670 680
640 650 660 670 680 690
pF1KE9 QQHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREAC
:. .:....: .. : . :. : .: :::::..::.: .: :: . .
CCDS33 QKTGEELVKELEICLKAALDVWCKNESSMPHSVIVYRDGVGDGQLQALLDHEAKKMS-TY
690 700 710 720 730 740
700 710 720 730 740 750
pF1KE9 IKLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKS-GNIPAGTTVDTKITHPTEFDFYL
.: . . ..::::.:: .::.: . :.. : : ::..:...:. .::..
CCDS33 LKTISPNNFTLAFIVVKKRINTRFFL-----KHGSNFQNPPPGTVIDVELTRNEWYDFFI
750 760 770 780 790 800
760 770 780 790 800 810
pF1KE9 CSHAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVA
:.. .:: :.::.:..: .: : .: ::: ::: : . .::: .::: .:
CCDS33 VSQSVQDGTVTPTHYNVIYDTIGLSPDTVQRLTYCLCHMYYNLPGIIRVPAPCHYAHKLA
810 820 830 840 850 860
820 830 840 850
pF1KE9 FRARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA
.
CCDS33 YLVGQSIHQEPNRSLSTRLFYL
870 880
>>CCDS6029.1 PIWIL2 gene_id:55124|Hs108|chr8 (973 aa)
initn: 337 init1: 206 opt: 412 Z-score: 390.5 bits: 83.5 E(32554): 2e-15
Smith-Waterman score: 609; 24.5% identity (54.3% similar) in 856 aa overlap (7-821:177-961)
10 20 30
pF1KE9 MYSGAGPALAPP--APPPPIQGYAFKPPPRPDF---
:. .:: . :: . .. : ::
CCDS60 GSSDASLLPLGRAAGGISREVDKPPCTFSTPSRGPPQLSSPPALPQSPLHSPDRPLVLTV
150 160 170 180 190 200
40 50 60 70
pF1KE9 -----------GTSGRTIKLQANFFEMDIPKIDIYHYELDIKPE-KCPRRVNREIVEHMV
:..: .: :. ... . .:.:.. ..:. .: . . :.
CCDS60 EHKEKELIVKQGSKGTPQSLGLNLVKIQCHNEAVYQYHVTFSPNVEC-----KSMRFGML
210 220 230 240 250 260
80 90 100 110 120 130
pF1KE9 QHFKTQIFGDRKPVFDGRKNLYTAMPLPIGRDKVELEVTLPGEGKDRIFKVSIKWVSCVS
. .. . :. .::: . . ::. :.. . : .. : ..::: ..
CCDS60 KDHQA-VTGNVT-AFDG-----SILYLPV---KLQQVLELKSQRKTDSAEISIK----IQ
270 280 290 300
140 150 160 170 180 190
pF1KE9 LQALHDALSGRLPSVPFETIQALDVVMRHLPSMRYTPVGRSFFTASEGCSNPLGGGR-EV
. . . : .:: .. .. ::. : .:. :::.:. . . : : ..
CCDS60 MTKILEPCSDL--CIPFYNV-VFRRVMKLL-DMKL--VGRNFYDPTSAMV--LQQHRLQI
310 320 330 340 350
200 210 220 230 240 250
pF1KE9 WFGFHQSVRPSLWKMMLNIDVSATAFYKAQPVIEFVCEVLD-FKSIEEQQKPLTDSQRVK
: :. :.: . ..: ::: . ::. : ::: ...: .:.: ...
CCDS60 WPGYAASIRRTDGGLFLLADVS-------HKVIRNDC-VLDVMHAIYQQNKEHFQDE---
360 370 380 390 400
260 270 280 290 300 310
pF1KE9 FTKEIKGLKVEITHCGQMKRKYRVCNVTRRPASHQTFPLQQESGQTVECTVAQYFKDRHK
:: . : .. ::. . .: ::. .: . ...: ... :. : : .:.. .
CCDS60 CTKLLVG-NIVITRYN--NRTYRIDDVDWNKTPKDSFTMSD--GK--EITFLEYYSKNYG
410 420 430 440 450 460
320 330 340 350 360
pF1KE9 LVLRYPHLPCL---------QVGQEQKHTYLPLEVCNIVAGQRCIKKLTDNQTSTMIRAT
.... : : . :. : : : ....: : . . .
CCDS60 ITVKEEDQPLLIHRPSERQDNHGMLLKGEILLLPELSFMTGIPEKMKKDFRAMKDLAQQI
470 480 490 500 510 520
370 380 390 400 410 420
pF1KE9 ARSAPDRQEEISKLMRSASFN---TDPYVREFGIMVKDEMTDVTGRVLQPPSILYGGRNK
: ... . :.. . : :. .: .:. .. .. . :::: : . .:
CCDS60 NLSPKQHHSALECLLQRIAKNEAATNELMR-WGLRLQKDVHKIEGRVL--PMERINLKNT
530 540 550 560 570
430 440 450 460 470 480
pF1KE9 AIATPVQGVWD---MRNKQFHTGIEIKVWAIACFAPQRQCTEVHLKSFTEQLRKISRDAG
.. : . : :. .. : : .. ::. : :.: .. . ....:.::. :
CCDS60 SFITSQELNWVKEVTRDPSILT-IPMHFWAL--FYPKRAMDQA--RELVNMLEKIAGPIG
580 590 600 610 620 630
490 500 510 520 530
pF1KE9 MPIQGQPCFCKYAQGADSVEPMFRHLKNTYAG---LQLVVVILPG-KTPVYAEVKRVGDT
: .. : . . . : .: . : ...: .. .:.:: :. : . .:. .:.. .
CCDS60 MRMS-PPAWVELKD--DRIETYVRTIQSTLGAEGKIQMVVCIIMGPRDDLYGAIKKLCCV
640 650 660 670 680 690
540 550 560 570 580 590
pF1KE9 VLGMATQCVQMKNV-QRTTPQTLSN-LCLKINVKLGG-VNNILLPQGRPPVFQQPVIFLG
. .: :..... : : ..... . :.:: :::: . .. .: ..: .. .:
CCDS60 QSPVPSQVVNVRTIGQPTRLRSVAQKILLQINCKLGGELWGVDIP------LKQ-LMVIG
700 710 720 730 740
600 610 620 630 640 650
pF1KE9 ADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYK
:: : :. : . :... :.:.. ... . : :. .:::...: . : .::.
CCDS60 MDVYHDPS-RGMR-SVVGFVASINLTLTKWYSRVVFQMPHQEIVDSLKLCLVGSLKKFYE
750 760 770 780 790 800
660 670 680 690 700 710
pF1KE9 STRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRL
.. : .:. ::::::.::.. : ..:. ... :.. ..::: .. .::::. : :
CCDS60 VNHCLPEKIVVYRDGVSDGQLKTVANYEIPQLQK-CFEAFENYQPKMVVFVVQKKISTNL
810 820 830 840 850 860
720 730 740 750 760 770
pF1KE9 FCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFS
. . .. : . : ::.:: :: :::: .: :: . :.:: . . .:
CCDS60 YLAAPQNFVTPT---P-GTVVDHTITSCEWVDFYLLAHHVRQGCGIPTHYVCVLNTANLS
870 880 890 900 910
780 790 800 810 820 830
pF1KE9 SDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSN
:..: ::..::: : .. .::: ::: .:: . :.. .:
CCDS60 PDHMQRLTFKLCHMYWNWPGTIRVPAPCKYAHKLAFLSG-HILHHEPAIQLCENLFFL
920 930 940 950 960 970
840 850
pF1KE9 GRDHQALAKAVQVHQDTLRTMYFA
859 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:37:22 2016 done: Sun Nov 6 09:37:23 2016
Total Scan time: 4.250 Total Display time: 0.310
Function used was FASTA [36.3.4 Apr, 2011]