FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9259, 1210 aa
1>>>pF1KE9259 1210 - 1210 aa - 1210 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.3882+/-0.00105; mu= 2.9173+/- 0.064
mean_var=396.9575+/-79.696, 0's: 0 Z-trim(115.3): 186 B-trim: 0 in 0/56
Lambda= 0.064373
statistics sampled from 15648 (15838) to 15648 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.487), width: 16
Scan time: 6.350
The best scores are: opt bits E(32554)
CCDS4725.1 EHMT2 gene_id:10919|Hs108|chr6 (1210) 8278 784.0 0
CCDS4726.1 EHMT2 gene_id:10919|Hs108|chr6 (1176) 5613 536.5 1.5e-151
CCDS75425.1 EHMT2 gene_id:10919|Hs108|chr6 (1233) 5613 536.5 1.5e-151
CCDS7050.2 EHMT1 gene_id:79813|Hs108|chr9 (1298) 3764 364.8 7.6e-100
CCDS56595.1 EHMT1 gene_id:79813|Hs108|chr9 ( 808) 1207 127.1 1.7e-28
>>CCDS4725.1 EHMT2 gene_id:10919|Hs108|chr6 (1210 aa)
initn: 8278 init1: 8278 opt: 8278 Z-score: 4172.0 bits: 784.0 E(32554): 0
Smith-Waterman score: 8278; 100.0% identity (100.0% similar) in 1210 aa overlap (1-1210:1-1210)
10 20 30 40 50 60
pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP
1150 1160 1170 1180 1190 1200
1210
pF1KE9 ELGSLPPVNT
::::::::::
CCDS47 ELGSLPPVNT
1210
>>CCDS4726.1 EHMT2 gene_id:10919|Hs108|chr6 (1176 aa)
initn: 5613 init1: 5613 opt: 5613 Z-score: 2834.5 bits: 536.5 E(32554): 1.5e-151
Smith-Waterman score: 7974; 97.2% identity (97.2% similar) in 1210 aa overlap (1-1210:1-1176)
10 20 30 40 50 60
pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF
::::::::::::: :::::::::::::
CCDS47 KREPPRAKEPRGV----------------------------------SNDTSSLETERGF
370 380
430 440 450 460 470 480
pF1KE9 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL
390 400 410 420 430 440
490 500 510 520 530 540
pF1KE9 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA
450 460 470 480 490 500
550 560 570 580 590 600
pF1KE9 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA
510 520 530 540 550 560
610 620 630 640 650 660
pF1KE9 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ
570 580 590 600 610 620
670 680 690 700 710 720
pF1KE9 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT
630 640 650 660 670 680
730 740 750 760 770 780
pF1KE9 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA
690 700 710 720 730 740
790 800 810 820 830 840
pF1KE9 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA
750 760 770 780 790 800
850 860 870 880 890 900
pF1KE9 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA
810 820 830 840 850 860
910 920 930 940 950 960
pF1KE9 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS
870 880 890 900 910 920
970 980 990 1000 1010 1020
pF1KE9 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA
930 940 950 960 970 980
1030 1040 1050 1060 1070 1080
pF1KE9 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR
990 1000 1010 1020 1030 1040
1090 1100 1110 1120 1130 1140
pF1KE9 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS
1050 1060 1070 1080 1090 1100
1150 1160 1170 1180 1190 1200
pF1KE9 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP
1110 1120 1130 1140 1150 1160
1210
pF1KE9 ELGSLPPVNT
::::::::::
CCDS47 ELGSLPPVNT
1170
>>CCDS75425.1 EHMT2 gene_id:10919|Hs108|chr6 (1233 aa)
initn: 5613 init1: 5613 opt: 5613 Z-score: 2834.3 bits: 536.5 E(32554): 1.5e-151
Smith-Waterman score: 7901; 97.0% identity (97.2% similar) in 1198 aa overlap (13-1210:70-1233)
10 20 30 40
pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLG
..::::::::::::::::::::::::::::
CCDS75 RSLLSLPRAQASWTPQLSTGLTSPPVPCLPSQGEAPAEMGALLLEKETRGATERVHGSLG
40 50 60 70 80 90
50 60 70 80 90 100
pF1KE9 DTPRSEETLPKATPDSLEPAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 DTPRSEETLPKATPDSLEPAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDL
100 110 120 130 140 150
110 120 130 140 150 160
pF1KE9 RGGRILLGHATKSFPSSPSKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RGGRILLGHATKSFPSSPSKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAA
160 170 180 190 200 210
170 180 190 200 210 220
pF1KE9 AGSEPPPATTSPEGQPKVHRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 AGSEPPPATTSPEGQPKVHRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTS
220 230 240 250 260 270
230 240 250 260 270 280
pF1KE9 DLAKRRKLNSGGGLSEELGSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 DLAKRRKLNSGGGLSEELGSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDER
280 290 300 310 320 330
290 300 310 320 330 340
pF1KE9 VDSDSKSEVEALTEQLSEEEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 VDSDSKSEVEALTEQLSEEEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKA
340 350 360 370 380 390
350 360 370 380 390 400
pF1KE9 KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSP
:::::::::::::::::::::::::::::::
CCDS75 KKKWRKDSPWVKPSRKRRKREPPRAKEPRGV-----------------------------
400 410 420 430
410 420 430 440 450 460
pF1KE9 NHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 -----SNDTSSLETERGFEELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAA
440 450 460 470 480
470 480 490 500 510 520
pF1KE9 ILKRETMRPSSRVALMVLCETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ILKRETMRPSSRVALMVLCETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKA
490 500 510 520 530 540
530 540 550 560 570 580
pF1KE9 CVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 CVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPS
550 560 570 580 590 600
590 600 610 620 630 640
pF1KE9 ARMRGHGEPRRPPCDPLADTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 ARMRGHGEPRRPPCDPLADTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESE
610 620 630 640 650 660
650 660 670 680 690 700
pF1KE9 RRKKLRFHPRQLYLSVKQGELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RRKKLRFHPRQLYLSVKQGELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICH
670 680 690 700 710 720
710 720 730 740 750 760
pF1KE9 VLLQAGANINAVDKQQRTPLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 VLLQAGANINAVDKQQRTPLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIG
730 740 750 760 770 780
770 780 790 800 810 820
pF1KE9 NLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 NLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICL
790 800 810 820 830 840
830 840 850 860 870 880
pF1KE9 HWASFTGSAAIAEVLLNARCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 HWASFTGSAAIAEVLLNARCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNK
850 860 870 880 890 900
890 900 910 920 930 940
pF1KE9 EGDTAWDLTPERSDVWFALQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 EGDTAWDLTPERSDVWFALQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVD
910 920 930 940 950 960
950 960 970 980 990 1000
pF1KE9 GEPCPEDYKYISENCETSTMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 GEPCPEDYKYISENCETSTMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRL
970 980 990 1000 1010 1020
1010 1020 1030 1040 1050 1060
pF1KE9 LQEFNKIEPPLIFECNQACSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LQEFNKIEPPLIFECNQACSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGT
1030 1040 1050 1060 1070 1080
1070 1080 1090 1100 1110 1120
pF1KE9 FICEYVGELISDAEADVREDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 FICEYVGELISDAEADVREDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPV
1090 1100 1110 1120 1130 1140
1130 1140 1150 1160 1170 1180
pF1KE9 RVFMLHQDLRFPRIAFFSSRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 RVFMLHQDLRFPRIAFFSSRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAI
1150 1160 1170 1180 1190 1200
1190 1200 1210
pF1KE9 ALEQSRLARLDPHPELLPELGSLPPVNT
::::::::::::::::::::::::::::
CCDS75 ALEQSRLARLDPHPELLPELGSLPPVNT
1210 1220 1230
>>CCDS7050.2 EHMT1 gene_id:79813|Hs108|chr9 (1298 aa)
initn: 4044 init1: 2862 opt: 3764 Z-score: 1906.0 bits: 364.8 E(32554): 7.6e-100
Smith-Waterman score: 3794; 50.6% identity (74.0% similar) in 1160 aa overlap (108-1204:147-1291)
80 90 100 110 120 130
pF1KE9 GADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSPSKGGSCPSR------AK
: :::.:..:.. .:: . :: :
CCDS70 TSVIGSNGYILNKPALQAQPLRTTSTLASSLPGHAAKTLPGGAGKGRT-PSAFPQTPAAP
120 130 140 150 160 170
140 150 160 170 180
pF1KE9 MSMTGAG-------KSP-PSVQSLAMRLL-SMP-GAQGAAAAGSEPPPATTSPEGQPKVH
. : : : : :... . : .:: .. : ::...: . . . . .
CCDS70 PATLGEGSADTEDRKLPAPGADVKVHRARKTMPKSVVGLHAASKDPREVREARDHKEPKE
180 190 200 210 220 230
190 200 210 220 230
pF1KE9 RARKTMSKPGNGQ--PPVP--EKRPPEIQHFRMSDDVHS--LGKVTSDLAKRRKLNSGGG
. :..: : : :: : .. :. : . . .. : : . ..:.: :
CCDS70 EINKNISDFGRQQLLPPFPSLHQSLPQNQCYMATTKSQTACLPFVLAAAVSRKKKRRMGT
240 250 260 270 280 290
240 250 260 270 280
pF1KE9 LS------EELGSARRSGEV--TLTKGDPGSLEEWET------VVGDDFSLYYDSYSVDE
: .. . : :. ..:.. :: : . : :... . : . .:
CCDS70 YSLVPKKKTKVLKQRTVIEMFKSITHSTVGSKGEKDLGASSLHVNGESLEMDSDEDDSEE
300 310 320 330 340 350
290 300 310 320 330
pF1KE9 RVDSDSKSEVEAL---TE--QLSEEEEEEEEEEEEEEEEEEEEEEE----EDEESGNQSD
..:... .: :: . :.: : .. .. . : :::.: :.::.:..::
CCDS70 LEEDDGHGAEQAAAFPTEDSRTSKESMSEADRAQKMDGESEEEQESVDTGEEEEGGDESD
360 370 380 390 400 410
340 350 360 370 380
pF1KE9 RSGSSGRRKA--KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGV----GSSGPSE---
:. :. .: :.: . ::::.::.::::.: :.: :. : .:.: .:
CCDS70 LSSESSIKKKFLKRKGKTDSPWIKPARKRRRRS---RKKPSGALGSESYKSSAGSAEQTA
420 430 440 450 460 470
390 400 410 420 430
pF1KE9 ------YMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDR
:::: : ::.: .: :: . :..: . :::. :..:.::::::::.:: .
CCDS70 PGDSTGYMEVSLDSLDLRVKGILSSQAEGLANGPDVLETD-GLQEVPLCSCRMETPKSRE
480 490 500 510 520 530
440 450 460 470 480 490
pF1KE9 ISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVLCETHRARMVKHHCCPGC
:. :...:::::::: ::. :. ...: : ::::... :.:::: ::.:::::.:::::
CCDS70 ITTLANNQCMATESVDHELGRCTNSVVKYELMRPSNKAPLLVLCEDHRGRMVKHQCCPGC
540 550 560 570 580 590
500 510 520 530 540 550
pF1KE9 GYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPP
:::::::.:.::.:. ..::::: :.:..:. .::::::..:.:.:::: ..: ..
CCDS70 GYFCTAGNFMECQPESSISHRFHKDCASRVNNASYCPHCGEESSKAKEVTIAKADTTS--
600 610 620 630 640
560 570 580 590 600 610
pF1KE9 AGTAAPAP-PPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLADTIDS--SGPSLTLPN
:..:.: .. . :::::. :: : : : : . . : . : :
CCDS70 --TVTPVPGQEKGSALEGRADTTTGSAA----GPPLSED-DKLQGAASHVPEGFDPTGPA
650 660 670 680 690 700
620 630 640 650 660 670
pF1KE9 GGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQGELQKVILMLLDNL
: . :: :::.:.::.::. .::. :::::::.:::.:..:::::::.:::.:..
CCDS70 GLGRPTPGLSQGPGKETLESALIALDSEKPKKLRFHPKQLYFSARQGELQKVLLMLVDGI
710 720 730 740 750 760
680 690 700 710 720 730
pF1KE9 DPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRTPLMEAVVNNHLEVA
::::. ..:.::.::::::. : :.:::.:.::::::.. ...::::::::. :::::..
CCDS70 DPNFKMEHQNKRSPLHAAAEAGHVDICHMLVQAGANIDTCSEDQRTPLMEAAENNHLEAV
770 780 790 800 810 820
740 750 760 770 780 790
pF1KE9 RYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAE
.:... :. : :. .:::::: ::: :. :.:. :::.::.::: ::.:::::.:::.:
CCDS70 KYLIKAGALVDPKDAEGSTCLHLAAKKGHYEVVQYLLSNGQMDVNCQDDGGWTPMIWATE
830 840 850 860 870 880
800 810 820 830 840 850
pF1KE9 HKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNARCDLHAVNYHGDTP
.::......::..:.:... :::::::::::.:.: . :::.:: :.::::::: :::.:
CCDS70 YKHVDLVKLLLSKGSDINIRDNEENICLHWAAFSGCVDIAEILLAAKCDLHAVNIHGDSP
890 900 910 920 930 940
860 870 880 890 900 910
pF1KE9 LHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFALQLNRKLRLGVGNR
:::::::. .:::.::::: .. :.::::.: . . :.:: :::... :. .. .:
CCDS70 LHIAARENRYDCVVLFLSRDSDVTLKNKEGETPLQCASLNSQVWSALQMSKALQDSAPDR
950 960 970 980 990 1000
920 930 940 950 960 970
pF1KE9 AIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETSTMNIDRNITHLQHC
.:.:. ::.::::: .::::::.::.:::: .:::.:.:: :: :::::::::::.:
CCDS70 PSPVERIVSRDIARGYERIPIPCVNAVDSEPCPSNYKYVSQNCVTSPMNIDRNITHLQYC
1010 1020 1030 1040 1050 1060
980 990 1000 1010 1020 1030
pF1KE9 TCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQACSCWRNCKNRVVQS
.:.::::::::.:::::.::::::::::: ::: :::::::::.::::::::.:::::.
CCDS70 VCIDDCSSSNCMCGQLSMRCWYDKDGRLLPEFNMAEPPLIFECNHACSCWRNCRNRVVQN
1070 1080 1090 1100 1110 1120
1040 1050 1060 1070 1080 1090
pF1KE9 GIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVREDDSYLFDLDNKDG
:...::::::: ::::::.:: :: :::.::::::::::.::::::.::::::::::::
CCDS70 GLRARLQLYRTRDMGWGVRSLQDIPPGTFVCEYVGELISDSEADVREEDSYLFDLDNKDG
1130 1140 1150 1160 1170 1180
1100 1110 1120 1130 1140 1150
pF1KE9 EVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFSSRDIRTGEELGFDY
::::::::.:::.:::::: :.::..:::::: :::::::::::::.: :..::.:::::
CCDS70 EVYCIDARFYGNVSRFINHHCEPNLVPVRVFMAHQDLRFPRIAFFSTRLIEAGEQLGFDY
1190 1200 1210 1220 1230 1240
1160 1170 1180 1190 1200 1210
pF1KE9 GDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLPELGSLPPVNT
:.::::::.: :.:.::: ::.::. :.: .:. :. . . . ::. .:
CCDS70 GERFWDIKGKLFSCRCGSPKCRHSSAALAQRQASAAQ-EAQEDGLPDTSSAAAADPL
1250 1260 1270 1280 1290
>>CCDS56595.1 EHMT1 gene_id:79813|Hs108|chr9 (808 aa)
initn: 1269 init1: 627 opt: 1207 Z-score: 625.1 bits: 127.1 E(32554): 1.7e-28
Smith-Waterman score: 1318; 38.8% identity (63.4% similar) in 662 aa overlap (108-706:147-794)
80 90 100 110 120 130
pF1KE9 GADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSPSKGGSCPSR------AK
: :::.:..:.. .:: . :: :
CCDS56 TSVIGSNGYILNKPALQAQPLRTTSTLASSLPGHAAKTLPGGAGKGRT-PSAFPQTPAAP
120 130 140 150 160 170
140 150 160 170 180
pF1KE9 MSMTGAG-------KSP-PSVQSLAMRLL-SMP-GAQGAAAAGSEPPPATTSPEGQPKVH
. : : : : :... . : .:: .. : ::...: . . . . .
CCDS56 PATLGEGSADTEDRKLPAPGADVKVHRARKTMPKSVVGLHAASKDPREVREARDHKEPKE
180 190 200 210 220 230
190 200 210 220 230
pF1KE9 RARKTMSKPGNGQ--PPVP--EKRPPEIQHFRMSDDVHS--LGKVTSDLAKRRKLNSGGG
. :..: : : :: : .. :. : . . .. : : . ..:.: :
CCDS56 EINKNISDFGRQQLLPPFPSLHQSLPQNQCYMATTKSQTACLPFVLAAAVSRKKKRRMGT
240 250 260 270 280 290
240 250 260 270 280
pF1KE9 LS------EELGSARRSGEV--TLTKGDPGSLEEWET------VVGDDFSLYYDSYSVDE
: .. . : :. ..:.. :: : . : :... . : . .:
CCDS56 YSLVPKKKTKVLKQRTVIEMFKSITHSTVGSKGEKDLGASSLHVNGESLEMDSDEDDSEE
300 310 320 330 340 350
290 300 310 320 330
pF1KE9 RVDSDSKSEVEAL---TE--QLSEEEEEEEEEEEEEEEEEEEEEEE----EDEESGNQSD
..:... .: :: . :.: : .. .. . : :::.: :.::.:..::
CCDS56 LEEDDGHGAEQAAAFPTEDSRTSKESMSEADRAQKMDGESEEEQESVDTGEEEEGGDESD
360 370 380 390 400 410
340 350 360 370 380
pF1KE9 RSGSSGRRKA--KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGV----GSSGPSE---
:. :. .: :.: . ::::.::.::::.: :.: :. : .:.: .:
CCDS56 LSSESSIKKKFLKRKGKTDSPWIKPARKRRRRS---RKKPSGALGSESYKSSAGSAEQTA
420 430 440 450 460 470
390 400 410 420 430
pF1KE9 ------YMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDR
:::: : ::.: .: :: . :..: . :::. :..:.::::::::.:: .
CCDS56 PGDSTGYMEVSLDSLDLRVKGILSSQAEGLANGPDVLETD-GLQEVPLCSCRMETPKSRE
480 490 500 510 520 530
440 450 460 470 480 490
pF1KE9 ISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVLCETHRARMVKHHCCPGC
:. :...:::::::: ::. :. ...: : ::::... :.:::: ::.:::::.:::::
CCDS56 ITTLANNQCMATESVDHELGRCTNSVVKYELMRPSNKAPLLVLCEDHRGRMVKHQCCPGC
540 550 560 570 580 590
500 510 520 530 540 550
pF1KE9 GYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPP
:::::::.:.::.:. ..::::: :.:..:. .::::::..:.:.:::: ..: ..
CCDS56 GYFCTAGNFMECQPESSISHRFHKDCASRVNNASYCPHCGEESSKAKEVTIAKADTTS--
600 610 620 630 640
560 570 580 590 600 610
pF1KE9 AGTAAPAP-PPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLADTIDS--SGPSLTLPN
:..:.: .. . :::::. :: : : : : . . : . : :
CCDS56 --TVTPVPGQEKGSALEGRADTTTGSAA----GPPLSED-DKLQGAASHVPEGFDPTGPA
650 660 670 680 690 700
620 630 640 650 660 670
pF1KE9 GGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQGELQKVILMLLDNL
: . :: :::.:.::.::. .::. :::::::.:::.:..:::::::.:::.:..
CCDS56 GLGRPTPGLSQGPGKETLESALIALDSEKPKKLRFHPKQLYFSARQGELQKVLLMLVDGI
710 720 730 740 750 760
680 690 700 710 720 730
pF1KE9 DPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRTPLMEAVVNNHLEVA
::::. ..:.::.::::::. : :.:::.:.:
CCDS56 DPNFKMEHQNKRSPLHAAAEAGHVDICHMLVQFCRLGSPRSRGCLW
770 780 790 800
740 750 760 770 780 790
pF1KE9 RYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAE
1210 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 22:22:12 2016 done: Sat Nov 5 22:22:13 2016
Total Scan time: 6.350 Total Display time: 0.260
Function used was FASTA [36.3.4 Apr, 2011]