FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9259, 1210 aa 1>>>pF1KE9259 1210 - 1210 aa - 1210 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.3882+/-0.00105; mu= 2.9173+/- 0.064 mean_var=396.9575+/-79.696, 0's: 0 Z-trim(115.3): 186 B-trim: 0 in 0/56 Lambda= 0.064373 statistics sampled from 15648 (15838) to 15648 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.487), width: 16 Scan time: 6.350 The best scores are: opt bits E(32554) CCDS4725.1 EHMT2 gene_id:10919|Hs108|chr6 (1210) 8278 784.0 0 CCDS4726.1 EHMT2 gene_id:10919|Hs108|chr6 (1176) 5613 536.5 1.5e-151 CCDS75425.1 EHMT2 gene_id:10919|Hs108|chr6 (1233) 5613 536.5 1.5e-151 CCDS7050.2 EHMT1 gene_id:79813|Hs108|chr9 (1298) 3764 364.8 7.6e-100 CCDS56595.1 EHMT1 gene_id:79813|Hs108|chr9 ( 808) 1207 127.1 1.7e-28 >>CCDS4725.1 EHMT2 gene_id:10919|Hs108|chr6 (1210 aa) initn: 8278 init1: 8278 opt: 8278 Z-score: 4172.0 bits: 784.0 E(32554): 0 Smith-Waterman score: 8278; 100.0% identity (100.0% similar) in 1210 aa overlap (1-1210:1-1210) 10 20 30 40 50 60 pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP 1150 1160 1170 1180 1190 1200 1210 pF1KE9 ELGSLPPVNT :::::::::: CCDS47 ELGSLPPVNT 1210 >>CCDS4726.1 EHMT2 gene_id:10919|Hs108|chr6 (1176 aa) initn: 5613 init1: 5613 opt: 5613 Z-score: 2834.5 bits: 536.5 E(32554): 1.5e-151 Smith-Waterman score: 7974; 97.2% identity (97.2% similar) in 1210 aa overlap (1-1210:1-1176) 10 20 30 40 50 60 pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLGDTPRSEETLPKATPDSLE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAAAGSEPPPATTSPEGQPKV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTSDLAKRRKLNSGGGLSEEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDERVDSDSKSEVEALTEQLSE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKAKKKWRKDSPWVKPSRKRR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 KREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGF ::::::::::::: ::::::::::::: CCDS47 KREPPRAKEPRGV----------------------------------SNDTSSLETERGF 370 380 430 440 450 460 470 480 pF1KE9 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVL 390 400 410 420 430 440 490 500 510 520 530 540 pF1KE9 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDA 450 460 470 480 490 500 550 560 570 580 590 600 pF1KE9 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLA 510 520 530 540 550 560 610 620 630 640 650 660 pF1KE9 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQ 570 580 590 600 610 620 670 680 690 700 710 720 pF1KE9 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRT 630 640 650 660 670 680 730 740 750 760 770 780 pF1KE9 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNA 690 700 710 720 730 740 790 800 810 820 830 840 pF1KE9 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNA 750 760 770 780 790 800 850 860 870 880 890 900 pF1KE9 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 RCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFA 810 820 830 840 850 860 910 920 930 940 950 960 pF1KE9 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETS 870 880 890 900 910 920 970 980 990 1000 1010 1020 pF1KE9 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQA 930 940 950 960 970 980 1030 1040 1050 1060 1070 1080 pF1KE9 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 CSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVR 990 1000 1010 1020 1030 1040 1090 1100 1110 1120 1130 1140 pF1KE9 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 EDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFS 1050 1060 1070 1080 1090 1100 1150 1160 1170 1180 1190 1200 pF1KE9 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLP 1110 1120 1130 1140 1150 1160 1210 pF1KE9 ELGSLPPVNT :::::::::: CCDS47 ELGSLPPVNT 1170 >>CCDS75425.1 EHMT2 gene_id:10919|Hs108|chr6 (1233 aa) initn: 5613 init1: 5613 opt: 5613 Z-score: 2834.3 bits: 536.5 E(32554): 1.5e-151 Smith-Waterman score: 7901; 97.0% identity (97.2% similar) in 1198 aa overlap (13-1210:70-1233) 10 20 30 40 pF1KE9 MAAAAGAAAAAAAEGEAPAEMGALLLEKETRGATERVHGSLG ..:::::::::::::::::::::::::::: CCDS75 RSLLSLPRAQASWTPQLSTGLTSPPVPCLPSQGEAPAEMGALLLEKETRGATERVHGSLG 40 50 60 70 80 90 50 60 70 80 90 100 pF1KE9 DTPRSEETLPKATPDSLEPAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 DTPRSEETLPKATPDSLEPAGPSSPASVTVTVGDEGADTPVGATPLIGDESENLEGDGDL 100 110 120 130 140 150 110 120 130 140 150 160 pF1KE9 RGGRILLGHATKSFPSSPSKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 RGGRILLGHATKSFPSSPSKGGSCPSRAKMSMTGAGKSPPSVQSLAMRLLSMPGAQGAAA 160 170 180 190 200 210 170 180 190 200 210 220 pF1KE9 AGSEPPPATTSPEGQPKVHRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AGSEPPPATTSPEGQPKVHRARKTMSKPGNGQPPVPEKRPPEIQHFRMSDDVHSLGKVTS 220 230 240 250 260 270 230 240 250 260 270 280 pF1KE9 DLAKRRKLNSGGGLSEELGSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 DLAKRRKLNSGGGLSEELGSARRSGEVTLTKGDPGSLEEWETVVGDDFSLYYDSYSVDER 280 290 300 310 320 330 290 300 310 320 330 340 pF1KE9 VDSDSKSEVEALTEQLSEEEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 VDSDSKSEVEALTEQLSEEEEEEEEEEEEEEEEEEEEEEEEDEESGNQSDRSGSSGRRKA 340 350 360 370 380 390 350 360 370 380 390 400 pF1KE9 KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGVGSSGPSEYMEVPLGSLELPSEGTLSP ::::::::::::::::::::::::::::::: CCDS75 KKKWRKDSPWVKPSRKRRKREPPRAKEPRGV----------------------------- 400 410 420 430 410 420 430 440 450 460 pF1KE9 NHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAA ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 -----SNDTSSLETERGFEELPLCSCRMEAPKIDRISERAGHKCMATESVDGELSGCNAA 440 450 460 470 480 470 480 490 500 510 520 pF1KE9 ILKRETMRPSSRVALMVLCETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ILKRETMRPSSRVALMVLCETHRARMVKHHCCPGCGYFCTAGTFLECHPDFRVAHRFHKA 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE9 CVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 CVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPPAGTAAPAPPPLSQDVPGRADTSQPS 550 560 570 580 590 600 590 600 610 620 630 640 pF1KE9 ARMRGHGEPRRPPCDPLADTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 ARMRGHGEPRRPPCDPLADTIDSSGPSLTLPNGGCLSAVGLPLGPGREALEKALVIQESE 610 620 630 640 650 660 650 660 670 680 690 700 pF1KE9 RRKKLRFHPRQLYLSVKQGELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 RRKKLRFHPRQLYLSVKQGELQKVILMLLDNLDPNFQSDQQSKRTPLHAAAQKGSVEICH 670 680 690 700 710 720 710 720 730 740 750 760 pF1KE9 VLLQAGANINAVDKQQRTPLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 VLLQAGANINAVDKQQRTPLMEAVVNNHLEVARYMVQRGGCVYSKEEDGSTCLHHAAKIG 730 740 750 760 770 780 770 780 790 800 810 820 pF1KE9 NLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 NLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAEHKHIEVIRMLLTRGADVTLTDNEENICL 790 800 810 820 830 840 830 840 850 860 870 880 pF1KE9 HWASFTGSAAIAEVLLNARCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 HWASFTGSAAIAEVLLNARCDLHAVNYHGDTPLHIAARESYHDCVLLFLSRGANPELRNK 850 860 870 880 890 900 890 900 910 920 930 940 pF1KE9 EGDTAWDLTPERSDVWFALQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 EGDTAWDLTPERSDVWFALQLNRKLRLGVGNRAIRTEKIICRDVARGYENVPIPCVNGVD 910 920 930 940 950 960 950 960 970 980 990 1000 pF1KE9 GEPCPEDYKYISENCETSTMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 GEPCPEDYKYISENCETSTMNIDRNITHLQHCTCVDDCSSSNCLCGQLSIRCWYDKDGRL 970 980 990 1000 1010 1020 1010 1020 1030 1040 1050 1060 pF1KE9 LQEFNKIEPPLIFECNQACSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LQEFNKIEPPLIFECNQACSCWRNCKNRVVQSGIKVRLQLYRTAKMGWGVRALQTIPQGT 1030 1040 1050 1060 1070 1080 1070 1080 1090 1100 1110 1120 pF1KE9 FICEYVGELISDAEADVREDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 FICEYVGELISDAEADVREDDSYLFDLDNKDGEVYCIDARYYGNISRFINHLCDPNIIPV 1090 1100 1110 1120 1130 1140 1130 1140 1150 1160 1170 1180 pF1KE9 RVFMLHQDLRFPRIAFFSSRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 RVFMLHQDLRFPRIAFFSSRDIRTGEELGFDYGDRFWDIKSKYFTCQCGSEKCKHSAEAI 1150 1160 1170 1180 1190 1200 1190 1200 1210 pF1KE9 ALEQSRLARLDPHPELLPELGSLPPVNT :::::::::::::::::::::::::::: CCDS75 ALEQSRLARLDPHPELLPELGSLPPVNT 1210 1220 1230 >>CCDS7050.2 EHMT1 gene_id:79813|Hs108|chr9 (1298 aa) initn: 4044 init1: 2862 opt: 3764 Z-score: 1906.0 bits: 364.8 E(32554): 7.6e-100 Smith-Waterman score: 3794; 50.6% identity (74.0% similar) in 1160 aa overlap (108-1204:147-1291) 80 90 100 110 120 130 pF1KE9 GADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSPSKGGSCPSR------AK : :::.:..:.. .:: . :: : CCDS70 TSVIGSNGYILNKPALQAQPLRTTSTLASSLPGHAAKTLPGGAGKGRT-PSAFPQTPAAP 120 130 140 150 160 170 140 150 160 170 180 pF1KE9 MSMTGAG-------KSP-PSVQSLAMRLL-SMP-GAQGAAAAGSEPPPATTSPEGQPKVH . : : : : :... . : .:: .. : ::...: . . . . . CCDS70 PATLGEGSADTEDRKLPAPGADVKVHRARKTMPKSVVGLHAASKDPREVREARDHKEPKE 180 190 200 210 220 230 190 200 210 220 230 pF1KE9 RARKTMSKPGNGQ--PPVP--EKRPPEIQHFRMSDDVHS--LGKVTSDLAKRRKLNSGGG . :..: : : :: : .. :. : . . .. : : . ..:.: : CCDS70 EINKNISDFGRQQLLPPFPSLHQSLPQNQCYMATTKSQTACLPFVLAAAVSRKKKRRMGT 240 250 260 270 280 290 240 250 260 270 280 pF1KE9 LS------EELGSARRSGEV--TLTKGDPGSLEEWET------VVGDDFSLYYDSYSVDE : .. . : :. ..:.. :: : . : :... . : . .: CCDS70 YSLVPKKKTKVLKQRTVIEMFKSITHSTVGSKGEKDLGASSLHVNGESLEMDSDEDDSEE 300 310 320 330 340 350 290 300 310 320 330 pF1KE9 RVDSDSKSEVEAL---TE--QLSEEEEEEEEEEEEEEEEEEEEEEE----EDEESGNQSD ..:... .: :: . :.: : .. .. . : :::.: :.::.:..:: CCDS70 LEEDDGHGAEQAAAFPTEDSRTSKESMSEADRAQKMDGESEEEQESVDTGEEEEGGDESD 360 370 380 390 400 410 340 350 360 370 380 pF1KE9 RSGSSGRRKA--KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGV----GSSGPSE--- :. :. .: :.: . ::::.::.::::.: :.: :. : .:.: .: CCDS70 LSSESSIKKKFLKRKGKTDSPWIKPARKRRRRS---RKKPSGALGSESYKSSAGSAEQTA 420 430 440 450 460 470 390 400 410 420 430 pF1KE9 ------YMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDR :::: : ::.: .: :: . :..: . :::. :..:.::::::::.:: . CCDS70 PGDSTGYMEVSLDSLDLRVKGILSSQAEGLANGPDVLETD-GLQEVPLCSCRMETPKSRE 480 490 500 510 520 530 440 450 460 470 480 490 pF1KE9 ISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVLCETHRARMVKHHCCPGC :. :...:::::::: ::. :. ...: : ::::... :.:::: ::.:::::.::::: CCDS70 ITTLANNQCMATESVDHELGRCTNSVVKYELMRPSNKAPLLVLCEDHRGRMVKHQCCPGC 540 550 560 570 580 590 500 510 520 530 540 550 pF1KE9 GYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPP :::::::.:.::.:. ..::::: :.:..:. .::::::..:.:.:::: ..: .. CCDS70 GYFCTAGNFMECQPESSISHRFHKDCASRVNNASYCPHCGEESSKAKEVTIAKADTTS-- 600 610 620 630 640 560 570 580 590 600 610 pF1KE9 AGTAAPAP-PPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLADTIDS--SGPSLTLPN :..:.: .. . :::::. :: : : : : . . : . : : CCDS70 --TVTPVPGQEKGSALEGRADTTTGSAA----GPPLSED-DKLQGAASHVPEGFDPTGPA 650 660 670 680 690 700 620 630 640 650 660 670 pF1KE9 GGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQGELQKVILMLLDNL : . :: :::.:.::.::. .::. :::::::.:::.:..:::::::.:::.:.. CCDS70 GLGRPTPGLSQGPGKETLESALIALDSEKPKKLRFHPKQLYFSARQGELQKVLLMLVDGI 710 720 730 740 750 760 680 690 700 710 720 730 pF1KE9 DPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRTPLMEAVVNNHLEVA ::::. ..:.::.::::::. : :.:::.:.::::::.. ...::::::::. :::::.. CCDS70 DPNFKMEHQNKRSPLHAAAEAGHVDICHMLVQAGANIDTCSEDQRTPLMEAAENNHLEAV 770 780 790 800 810 820 740 750 760 770 780 790 pF1KE9 RYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAE .:... :. : :. .:::::: ::: :. :.:. :::.::.::: ::.:::::.:::.: CCDS70 KYLIKAGALVDPKDAEGSTCLHLAAKKGHYEVVQYLLSNGQMDVNCQDDGGWTPMIWATE 830 840 850 860 870 880 800 810 820 830 840 850 pF1KE9 HKHIEVIRMLLTRGADVTLTDNEENICLHWASFTGSAAIAEVLLNARCDLHAVNYHGDTP .::......::..:.:... :::::::::::.:.: . :::.:: :.::::::: :::.: CCDS70 YKHVDLVKLLLSKGSDINIRDNEENICLHWAAFSGCVDIAEILLAAKCDLHAVNIHGDSP 890 900 910 920 930 940 860 870 880 890 900 910 pF1KE9 LHIAARESYHDCVLLFLSRGANPELRNKEGDTAWDLTPERSDVWFALQLNRKLRLGVGNR :::::::. .:::.::::: .. :.::::.: . . :.:: :::... :. .. .: CCDS70 LHIAARENRYDCVVLFLSRDSDVTLKNKEGETPLQCASLNSQVWSALQMSKALQDSAPDR 950 960 970 980 990 1000 920 930 940 950 960 970 pF1KE9 AIRTEKIICRDVARGYENVPIPCVNGVDGEPCPEDYKYISENCETSTMNIDRNITHLQHC .:.:. ::.::::: .::::::.::.:::: .:::.:.:: :: :::::::::::.: CCDS70 PSPVERIVSRDIARGYERIPIPCVNAVDSEPCPSNYKYVSQNCVTSPMNIDRNITHLQYC 1010 1020 1030 1040 1050 1060 980 990 1000 1010 1020 1030 pF1KE9 TCVDDCSSSNCLCGQLSIRCWYDKDGRLLQEFNKIEPPLIFECNQACSCWRNCKNRVVQS .:.::::::::.:::::.::::::::::: ::: :::::::::.::::::::.:::::. CCDS70 VCIDDCSSSNCMCGQLSMRCWYDKDGRLLPEFNMAEPPLIFECNHACSCWRNCRNRVVQN 1070 1080 1090 1100 1110 1120 1040 1050 1060 1070 1080 1090 pF1KE9 GIKVRLQLYRTAKMGWGVRALQTIPQGTFICEYVGELISDAEADVREDDSYLFDLDNKDG :...::::::: ::::::.:: :: :::.::::::::::.::::::.:::::::::::: CCDS70 GLRARLQLYRTRDMGWGVRSLQDIPPGTFVCEYVGELISDSEADVREEDSYLFDLDNKDG 1130 1140 1150 1160 1170 1180 1100 1110 1120 1130 1140 1150 pF1KE9 EVYCIDARYYGNISRFINHLCDPNIIPVRVFMLHQDLRFPRIAFFSSRDIRTGEELGFDY ::::::::.:::.:::::: :.::..:::::: :::::::::::::.: :..::.::::: CCDS70 EVYCIDARFYGNVSRFINHHCEPNLVPVRVFMAHQDLRFPRIAFFSTRLIEAGEQLGFDY 1190 1200 1210 1220 1230 1240 1160 1170 1180 1190 1200 1210 pF1KE9 GDRFWDIKSKYFTCQCGSEKCKHSAEAIALEQSRLARLDPHPELLPELGSLPPVNT :.::::::.: :.:.::: ::.::. :.: .:. :. . . . ::. .: CCDS70 GERFWDIKGKLFSCRCGSPKCRHSSAALAQRQASAAQ-EAQEDGLPDTSSAAAADPL 1250 1260 1270 1280 1290 >>CCDS56595.1 EHMT1 gene_id:79813|Hs108|chr9 (808 aa) initn: 1269 init1: 627 opt: 1207 Z-score: 625.1 bits: 127.1 E(32554): 1.7e-28 Smith-Waterman score: 1318; 38.8% identity (63.4% similar) in 662 aa overlap (108-706:147-794) 80 90 100 110 120 130 pF1KE9 GADTPVGATPLIGDESENLEGDGDLRGGRILLGHATKSFPSSPSKGGSCPSR------AK : :::.:..:.. .:: . :: : CCDS56 TSVIGSNGYILNKPALQAQPLRTTSTLASSLPGHAAKTLPGGAGKGRT-PSAFPQTPAAP 120 130 140 150 160 170 140 150 160 170 180 pF1KE9 MSMTGAG-------KSP-PSVQSLAMRLL-SMP-GAQGAAAAGSEPPPATTSPEGQPKVH . : : : : :... . : .:: .. : ::...: . . . . . CCDS56 PATLGEGSADTEDRKLPAPGADVKVHRARKTMPKSVVGLHAASKDPREVREARDHKEPKE 180 190 200 210 220 230 190 200 210 220 230 pF1KE9 RARKTMSKPGNGQ--PPVP--EKRPPEIQHFRMSDDVHS--LGKVTSDLAKRRKLNSGGG . :..: : : :: : .. :. : . . .. : : . ..:.: : CCDS56 EINKNISDFGRQQLLPPFPSLHQSLPQNQCYMATTKSQTACLPFVLAAAVSRKKKRRMGT 240 250 260 270 280 290 240 250 260 270 280 pF1KE9 LS------EELGSARRSGEV--TLTKGDPGSLEEWET------VVGDDFSLYYDSYSVDE : .. . : :. ..:.. :: : . : :... . : . .: CCDS56 YSLVPKKKTKVLKQRTVIEMFKSITHSTVGSKGEKDLGASSLHVNGESLEMDSDEDDSEE 300 310 320 330 340 350 290 300 310 320 330 pF1KE9 RVDSDSKSEVEAL---TE--QLSEEEEEEEEEEEEEEEEEEEEEEE----EDEESGNQSD ..:... .: :: . :.: : .. .. . : :::.: :.::.:..:: CCDS56 LEEDDGHGAEQAAAFPTEDSRTSKESMSEADRAQKMDGESEEEQESVDTGEEEEGGDESD 360 370 380 390 400 410 340 350 360 370 380 pF1KE9 RSGSSGRRKA--KKKWRKDSPWVKPSRKRRKREPPRAKEPRGVNGV----GSSGPSE--- :. :. .: :.: . ::::.::.::::.: :.: :. : .:.: .: CCDS56 LSSESSIKKKFLKRKGKTDSPWIKPARKRRRRS---RKKPSGALGSESYKSSAGSAEQTA 420 430 440 450 460 470 390 400 410 420 430 pF1KE9 ------YMEVPLGSLELPSEGTLSPNHAGVSNDTSSLETERGFEELPLCSCRMEAPKIDR :::: : ::.: .: :: . :..: . :::. :..:.::::::::.:: . CCDS56 PGDSTGYMEVSLDSLDLRVKGILSSQAEGLANGPDVLETD-GLQEVPLCSCRMETPKSRE 480 490 500 510 520 530 440 450 460 470 480 490 pF1KE9 ISERAGHKCMATESVDGELSGCNAAILKRETMRPSSRVALMVLCETHRARMVKHHCCPGC :. :...:::::::: ::. :. ...: : ::::... :.:::: ::.:::::.::::: CCDS56 ITTLANNQCMATESVDHELGRCTNSVVKYELMRPSNKAPLLVLCEDHRGRMVKHQCCPGC 540 550 560 570 580 590 500 510 520 530 540 550 pF1KE9 GYFCTAGTFLECHPDFRVAHRFHKACVSQLNGMVFCPHCGEDASEAQEVTIPRGDGVTPP :::::::.:.::.:. ..::::: :.:..:. .::::::..:.:.:::: ..: .. CCDS56 GYFCTAGNFMECQPESSISHRFHKDCASRVNNASYCPHCGEESSKAKEVTIAKADTTS-- 600 610 620 630 640 560 570 580 590 600 610 pF1KE9 AGTAAPAP-PPLSQDVPGRADTSQPSARMRGHGEPRRPPCDPLADTIDS--SGPSLTLPN :..:.: .. . :::::. :: : : : : . . : . : : CCDS56 --TVTPVPGQEKGSALEGRADTTTGSAA----GPPLSED-DKLQGAASHVPEGFDPTGPA 650 660 670 680 690 700 620 630 640 650 660 670 pF1KE9 GGCLSAVGLPLGPGREALEKALVIQESERRKKLRFHPRQLYLSVKQGELQKVILMLLDNL : . :: :::.:.::.::. .::. :::::::.:::.:..:::::::.:::.:.. CCDS56 GLGRPTPGLSQGPGKETLESALIALDSEKPKKLRFHPKQLYFSARQGELQKVLLMLVDGI 710 720 730 740 750 760 680 690 700 710 720 730 pF1KE9 DPNFQSDQQSKRTPLHAAAQKGSVEICHVLLQAGANINAVDKQQRTPLMEAVVNNHLEVA ::::. ..:.::.::::::. : :.:::.:.: CCDS56 DPNFKMEHQNKRSPLHAAAEAGHVDICHMLVQFCRLGSPRSRGCLW 770 780 790 800 740 750 760 770 780 790 pF1KE9 RYMVQRGGCVYSKEEDGSTCLHHAAKIGNLEMVSLLLSTGQVDVNAQDSGGWTPIIWAAE 1210 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 22:22:12 2016 done: Sat Nov 5 22:22:13 2016 Total Scan time: 6.350 Total Display time: 0.260 Function used was FASTA [36.3.4 Apr, 2011]