FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2632, 2073 aa 1>>>pF1KE2632 2073 - 2073 aa - 2073 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.6669+/-0.00115; mu= -5.9443+/- 0.070 mean_var=441.9461+/-90.772, 0's: 0 Z-trim(114.6): 60 B-trim: 196 in 1/54 Lambda= 0.061008 statistics sampled from 15081 (15134) to 15081 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.739), E-opt: 0.2 (0.465), width: 16 Scan time: 4.210 The best scores are: opt bits E(32554) CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073) 13959 1244.6 0 CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781) 9491 851.3 0 CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890) 9460 848.6 0 CCDS6124.1 KAT6A gene_id:7994|Hs108|chr8 (2004) 1776 172.3 1.9e-41 CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 ( 815) 1703 165.6 7.9e-40 CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 ( 611) 1232 124.0 1.9e-27 CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 ( 442) 1209 121.9 6.1e-27 CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 ( 472) 1203 121.4 9.2e-27 CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 ( 501) 1203 121.4 9.6e-27 CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 ( 581) 1203 121.4 1.1e-26 CCDS10706.1 KAT8 gene_id:84148|Hs108|chr16 ( 458) 970 100.9 1.3e-20 CCDS31610.1 KAT5 gene_id:10524|Hs108|chr11 ( 513) 952 99.3 4.4e-20 CCDS8110.1 KAT5 gene_id:10524|Hs108|chr11 ( 546) 952 99.3 4.6e-20 CCDS8109.1 KAT5 gene_id:10524|Hs108|chr11 ( 461) 947 98.8 5.5e-20 CCDS45468.1 KAT8 gene_id:84148|Hs108|chr16 ( 467) 947 98.8 5.5e-20 CCDS55771.1 KAT5 gene_id:10524|Hs108|chr11 ( 494) 947 98.9 5.8e-20 >>CCDS7345.1 KAT6B gene_id:23522|Hs108|chr10 (2073 aa) initn: 13959 init1: 13959 opt: 13959 Z-score: 6652.8 bits: 1244.6 E(32554): 0 Smith-Waterman score: 13959; 100.0% identity (100.0% similar) in 2073 aa overlap (1-2073:1-2073) 10 20 30 40 50 60 pF1KE2 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 GSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTSTYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTSTYI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 SASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSHVLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSHVLA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 TGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTNSQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 TGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTNSQL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 KALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRFISH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRFISH 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 SSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGRIKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGRIKP 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 DQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE2 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE2 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE2 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE2 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE2 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE2 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE2 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE2 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE2 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE2 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE2 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE2 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE2 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE2 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE2 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE2 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE2 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE2 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE2 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE2 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE2 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE2 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS73 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT 1990 2000 2010 2020 2030 2040 2050 2060 2070 pF1KE2 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR ::::::::::::::::::::::::::::::::: CCDS73 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR 2050 2060 2070 >>CCDS58084.1 KAT6B gene_id:23522|Hs108|chr10 (1781 aa) initn: 9460 init1: 9460 opt: 9491 Z-score: 4528.4 bits: 851.3 E(32554): 0 Smith-Waterman score: 11450; 85.9% identity (85.9% similar) in 2073 aa overlap (1-2073:1-1781) 10 20 30 40 50 60 pF1KE2 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 GSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTSTYI :::::::::::: CCDS58 GSMNAFTGRGSP------------------------------------------------ 370 430 440 450 460 470 480 pF1KE2 SASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSHVLA CCDS58 ------------------------------------------------------------ 490 500 510 520 530 540 pF1KE2 TGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTNSQL CCDS58 ------------------------------------------------------------ 550 560 570 580 590 600 pF1KE2 KALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRFISH CCDS58 ------------------------------------------------------------ 610 620 630 640 650 660 pF1KE2 SSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGRIKP CCDS58 ------------------------------------------------------------ 670 680 690 700 710 720 pF1KE2 DQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ----DTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP 380 390 400 410 420 730 740 750 760 770 780 pF1KE2 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE 430 440 450 460 470 480 790 800 810 820 830 840 pF1KE2 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV 490 500 510 520 530 540 850 860 870 880 890 900 pF1KE2 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL 550 560 570 580 590 600 910 920 930 940 950 960 pF1KE2 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR 610 620 630 640 650 660 970 980 990 1000 1010 1020 pF1KE2 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK 670 680 690 700 710 720 1030 1040 1050 1060 1070 1080 pF1KE2 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE 730 740 750 760 770 780 1090 1100 1110 1120 1130 1140 pF1KE2 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI 790 800 810 820 830 840 1150 1160 1170 1180 1190 1200 pF1KE2 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK 850 860 870 880 890 900 1210 1220 1230 1240 1250 1260 pF1KE2 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR 910 920 930 940 950 960 1270 1280 1290 1300 1310 1320 pF1KE2 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP 970 980 990 1000 1010 1020 1330 1340 1350 1360 1370 1380 pF1KE2 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK 1030 1040 1050 1060 1070 1080 1390 1400 1410 1420 1430 1440 pF1KE2 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE 1090 1100 1110 1120 1130 1140 1450 1460 1470 1480 1490 1500 pF1KE2 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP 1150 1160 1170 1180 1190 1200 1510 1520 1530 1540 1550 1560 pF1KE2 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ 1210 1220 1230 1240 1250 1260 1570 1580 1590 1600 1610 1620 pF1KE2 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP 1270 1280 1290 1300 1310 1320 1630 1640 1650 1660 1670 1680 pF1KE2 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY 1330 1340 1350 1360 1370 1380 1690 1700 1710 1720 1730 1740 pF1KE2 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI 1390 1400 1410 1420 1430 1440 1750 1760 1770 1780 1790 1800 pF1KE2 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ 1450 1460 1470 1480 1490 1500 1810 1820 1830 1840 1850 1860 pF1KE2 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ 1510 1520 1530 1540 1550 1560 1870 1880 1890 1900 1910 1920 pF1KE2 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK 1570 1580 1590 1600 1610 1620 1930 1940 1950 1960 1970 1980 pF1KE2 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN 1630 1640 1650 1660 1670 1680 1990 2000 2010 2020 2030 2040 pF1KE2 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT 1690 1700 1710 1720 1730 1740 2050 2060 2070 pF1KE2 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR ::::::::::::::::::::::::::::::::: CCDS58 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR 1750 1760 1770 1780 >>CCDS58085.1 KAT6B gene_id:23522|Hs108|chr10 (1890 aa) initn: 9460 init1: 9460 opt: 9460 Z-score: 4513.3 bits: 848.6 E(32554): 0 Smith-Waterman score: 12369; 91.2% identity (91.2% similar) in 2073 aa overlap (1-2073:1-1890) 10 20 30 40 50 60 pF1KE2 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PNGSSLKNIEKYLRSQSDLTSTTNNPAFQQRLRLGAKRAVNNGRLLKDGPQYRVNYGSLD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSCADC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHMECC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVTSDE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 GSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTSTYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTSTYI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 SASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSHVLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSHVLA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 TGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTNSQL : CCDS58 T----------------------------------------------------------- 550 560 570 580 590 600 pF1KE2 KALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRFISH CCDS58 ------------------------------------------------------------ 610 620 630 640 650 660 pF1KE2 SSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGRIKP CCDS58 ------------------------------------------------------------ 670 680 690 700 710 720 pF1KE2 DQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ----DTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCGRYP 490 500 510 520 530 730 740 750 760 770 780 pF1KE2 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE 540 550 560 570 580 590 790 800 810 820 830 840 pF1KE2 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV 600 610 620 630 640 650 850 860 870 880 890 900 pF1KE2 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL 660 670 680 690 700 710 910 920 930 940 950 960 pF1KE2 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR 720 730 740 750 760 770 970 980 990 1000 1010 1020 pF1KE2 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWEK 780 790 800 810 820 830 1030 1040 1050 1060 1070 1080 pF1KE2 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEEDEEE 840 850 860 870 880 890 1090 1100 1110 1120 1130 1140 pF1KE2 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EEEEEEEEEDEEEEEEEEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRI 900 910 920 930 940 950 1150 1160 1170 1180 1190 1200 pF1KE2 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NSSVTTETISETTEVLNEPFDNSDEERPMPQLEPTCEIEVEEDGRKPVLRKAFQHQPGKK 960 970 980 990 1000 1010 1210 1220 1230 1240 1250 1260 pF1KE2 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RQTEEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGLSKWR 1020 1030 1040 1050 1060 1070 1270 1280 1290 1300 1310 1320 pF1KE2 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QNKERKTGFKLNLYTPPETPMEPDEQVTVEEQKETSEGKTSPSPIRIEEEVKETGEALLP 1080 1090 1100 1110 1120 1130 1330 1340 1350 1360 1370 1380 pF1KE2 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 QEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEEEEEEGEEEEGGGNVEK 1140 1150 1160 1170 1180 1190 1390 1400 1410 1420 1430 1440 pF1KE2 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDHDADDEDDSHMESAEVE 1200 1210 1220 1230 1240 1250 1450 1460 1470 1480 1490 1500 pF1KE2 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KEELPRESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLTASCNSEPKELAGDPEAVP 1260 1270 1280 1290 1300 1310 1510 1520 1530 1540 1550 1560 pF1KE2 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATMEIDSETVQAVQSLTQESSEQDDTFQ 1320 1330 1340 1350 1360 1370 1570 1580 1590 1600 1610 1620 pF1KE2 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 DCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPVSSVHSHPGQSVRSVNSPSVP 1380 1390 1400 1410 1420 1430 1630 1640 1650 1660 1670 1680 pF1KE2 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQQVVDSGFSDLGSIESTTENY 1440 1450 1460 1470 1480 1490 1690 1700 1710 1720 1730 1740 pF1KE2 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSSLTQSSCAVTQQMSNISGSCSMLQQTSI 1500 1510 1520 1530 1540 1550 1750 1760 1770 1780 1790 1800 pF1KE2 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SSPPTCSVKSPQGCVVERPPSSSQQLAQCSMAANFTPPMQLAEIPETSNANIGLYERMGQ 1560 1570 1580 1590 1600 1610 1810 1820 1830 1840 1850 1860 pF1KE2 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SDFGAGHYPQPSATFSLAKLQQLTNTLIDHSLPYSHSAAVTSYANSASLSTPLSNTGLVQ 1620 1630 1640 1650 1660 1670 1870 1880 1890 1900 1910 1920 pF1KE2 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNIGISHSQRLQTQIASK 1680 1690 1700 1710 1720 1730 1930 1940 1950 1960 1970 1980 pF1KE2 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GHISMRTKSASLSPAAATHQSQIYGRSQTVAMQGPARTLTMQRGMNMSVNLMPAPAYNVN 1740 1750 1760 1770 1780 1790 1990 2000 2010 2020 2030 2040 pF1KE2 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQMGMMGTQPYAQQPMQT 1800 1810 1820 1830 1840 1850 2050 2060 2070 pF1KE2 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR ::::::::::::::::::::::::::::::::: CCDS58 PPHGNMMYTAPGHHGYMNTGMSKQSLNGSYMRR 1860 1870 1880 1890 >>CCDS6124.1 KAT6A gene_id:7994|Hs108|chr8 (2004 aa) initn: 5243 init1: 1670 opt: 1776 Z-score: 857.8 bits: 172.3 E(32554): 1.9e-41 Smith-Waterman score: 5715; 48.3% identity (65.5% similar) in 2158 aa overlap (1-1962:1-1894) 10 20 30 40 50 60 pF1KE2 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV :::::::::::::::::.:.:::::::::::::.:::.:::::.::: :::::::.::.. CCDS61 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE :::.:::: ::::::::::.. :: ..:. .. .:::::::..::.::: : CCDS61 LKVSNKGLNSYKDPDNPGRIALPKPR--------NHGKLDNKQNVDWNKLIKRAVEGLAE 70 80 90 100 110 130 140 150 160 170 pF1KE2 PNGSSLKNIEKYLRSQSDLTSTTNNPA---FQQRLRLGAKRAVNNGRLLKDGPQYRVNYG .::.::.::..:..:.:... .. : :.:.:::. :::...:::::::: ::.: CCDS61 SGGSTLKSIERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 SLDGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSC . . : . : : ::::::::::::.: :.:::::::::::::.:::::::::.:: CCDS61 ATNVDGKESCESL--SCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 ADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHM ::::.::::::::: ::::. :::::::::::::::.:: ::.::::::::::::::::: CCDS61 ADCGNSGHPSCLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 ECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVT :::::::.::::::::::.:::.:::::::..:::::::::..:::::::.::.. : CCDS61 ECCDPPLTRMPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQ---NT 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 SDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTS ..: .. : .::::.: :. . .:. ..: . :. : : CCDS61 VSKGPFSKV--RTGPGRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRD---------- 350 360 370 380 390 420 430 440 450 460 470 pF1KE2 TYISASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSH : .:: ::::::::::::::::::::::..:::..:.:..:: ::. CCDS61 ---SNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEVVDYSEQYRIRKR---------- 400 410 420 430 440 480 490 500 510 520 530 pF1KE2 VLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTN ...:::: :. :. CCDS61 ----------------------------GNRKSST-------------------SDWPTD 450 540 550 560 570 580 590 pF1KE2 SQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRF .: :: CCDS61 NQ-----DG--------------------------------------------------- 600 610 620 630 640 650 pF1KE2 ISHSSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGR : :: CCDS61 --------W------------------------------------------------DG- 460 660 670 680 690 700 710 pF1KE2 IKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCG :::. . ..:.....::.:...:.. :: . .:. . . CCDS61 ---------------KQENEE-RLFGSQEIMTEKDMELFRDIQEQALQKVGVTGPPDPQV 470 480 490 500 720 730 740 750 760 770 pF1KE2 RYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPP : :::::::::::.:::::::::::.:::::::::::::::::..:: .: ::::::::: CCDS61 RCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPP 510 520 530 540 550 560 780 790 800 810 820 830 pF1KE2 ANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGC ::::::....::::::::.: ::::::::::::::::::::::::::::::::.:: ::: CCDS61 ANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGC 570 580 590 600 610 620 840 850 860 870 880 890 pF1KE2 HLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDL :::::::::: ::::::::::::.::.::.:.::::::::::::.::::::::::::::: CCDS61 HLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDL 630 640 650 660 670 680 900 910 920 930 940 950 pF1KE2 GRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVI :::::.::::::::: :::.....:::: .:. ::.::.::..::.::.:.: :. .::: CCDS61 GRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVI 690 700 710 720 730 740 960 970 980 990 1000 1010 pF1KE2 IRREKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASC ::::::: .:: ::. : ..::. :::::...::..:::::.: .:.: :. .: CCDS61 IRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGEN--EEPQC 750 760 770 780 790 800 1020 1030 1040 1050 pF1KE2 WEKE--------------EQEILSTRANSR---QSPAKVQSKNKYLHSPESRPVTGE--- :.: ::. :...... ..:.. .: . .: :.... CCDS61 QERELEISVGKSVSHENKEQDSYSVESEKKPEVMAPVSSTRLSKQVLPHDSLPANSQPSR 810 820 830 840 850 860 1060 1070 1080 1090 pF1KE2 RGQ-------------------LLELSKESSEEEEEEEDEEEEEEEEEEEEDEEE----E ::. ::: .. . .:. : :. : .:. :.::. : CCDS61 RGRWGRKNRKTQERFGDKDSKLLLEETSSAPQEQYGECGEKSEATQEQYTESEEQLVASE 870 880 890 900 910 920 pF1KE2 EE---------------------------------------------------------- :. CCDS61 EQPSQDGKPDLPKRRLSEGVEPWRGQLKKSPEALKCRLTEGSERLPRRYSEGDRAVLRGF 930 940 950 960 970 980 1100 1110 1120 1130 1140 1150 pF1KE2 ----EEEEEEEENIQSSPPRLTKPQSVAIKRKRPFVLKKKRGRKRRRINSSVTTETISET ::::: : .:::: :::: ..:::.::. ...: :::.. ::::.::::::: CCDS61 SESSEEEEEPESPRSSSPPILTKP---TLKRKKPFLHRRRRVRKRKHHNSSVVTETISET 990 1000 1010 1020 1030 1040 1160 1170 1180 1190 1200 pF1KE2 TEVLNEPFDNSDEERPMPQLEPTCEI---EVEEDGRKPVLRKAFQH---------QPGKK ::::.:::..:: :::::.:::: :: : ::: . :. :.. : ..: CCDS61 TEVLDEPFEDSDSERPMPRLEPTFEIDEEEEEEDENELFPREYFRRLSSQDVLRCQSSSK 1050 1060 1070 1080 1090 1100 1210 1220 1230 1240 1250 pF1KE2 RQT----EEEEGKDNHCFKNADPCRNNMNDDSSNLKEGSKDNPEPLKCKQVWPKGTKRGL :.. :.::. : : . : .: . :. ::: :. :::: .: CCDS61 RKSKDEEEDEESDDADDTPILKPVSLLRKRDVKN-SPLEPDTSTPLKKKKGWPKGKSRKP 1110 1120 1130 1140 1150 1160 1260 1270 1280 1290 1300 pF1KE2 SKWRQNKERKTGFKLNLYTPPETP----MEP-------DEQVTVEEQKETSEGKTS-PSP .:.. :: ::::. : . .:: .. ..:..:: : : . : : CCDS61 IHWKKRPGRKPGFKLSREIMPVSTQACVIEPIVSIPKAGRKPKIQESEETVEPKEDMPLP 1170 1180 1190 1200 1210 1220 1310 1320 1330 1340 1350 1360 pF1KE2 IRIEEEVKETGEALLPQEENRREETCAPVSPNTSPGEKPEDDLIKPEEEEEEEEEEEEEE :: :: : :: .. : .: .. :. .: :. .:: : .: : ::::: CCDS61 ----EERKEEEEMQAEAEEAEEGEEEDAASSEV-PAASPADSSNSPETETKEPEVEEEEE 1230 1240 1250 1260 1270 1370 1380 1390 1400 1410 1420 pF1KE2 EEEEGEEEEGGGNVEKDPDGAKSQEKEEPEISTEKEDSARLDDHEEEEEEDEEPSHNEDH . . .::.. . :.. .:: :::: ::::. : ..:.:: CCDS61 KPRVSEEQRQS---EEE-----QQELEEPE-------------PEEEEDAAAETAQNDDH 1280 1290 1300 1310 1430 1440 1450 1460 1470 1480 pF1KE2 DADDEDDSHMESAEV-EKEELP-RESFKEVLENQETFLDLNVQPGHSNPEVLMDCGVDLT :::::::.:.::.. : :: : ::. :: ::.::: :.: .. : . : CCDS61 DADDEDDGHLESTKKKELEEQPTREDVKEEPGVQESFLDANMQKSR---EKIKD---KEE 1320 1330 1340 1350 1360 1490 1500 1510 1520 1530 1540 pF1KE2 ASCNSEPKELAGDPEAVPESDEEPPPGEQAQKQDQKNSKEVDTEFKEGNPATM-EIDSET . .:: .. . : .: :. : . ........:: :.:: . :.: :: CCDS61 TELDSEEEQPSHDTSVVSEQ----MAGSEDDHEEDSHTKEELIELKEEEEIPHSELDLET 1370 1380 1390 1400 1410 1420 1550 1560 1570 1580 1590 1600 pF1KE2 VQAVQSLTQE-SSEQDDTFQDCAETQEACRSLQNYTRADQSPQIATTLDDCQQSDHSSPV :::::::::: :::.. ..::: :: ::..::.::.::..::. . ..::. :.:.::. CCDS61 VQAVQSLTQEESSEHEGAYQDCEETLAACQTLQSYTQADEDPQM-SMVEDCHASEHNSPI 1430 1440 1450 1460 1470 1480 1610 1620 1630 1640 1650 1660 pF1KE2 SSVHSHPGQSVRSVNSPSVPALENSYAQISPDQSAISVPSLQNMETSPMMDVPSVSDHSQ :::.:::.::::::.::.:::::..:.::::.:...:.::.::::::::::::::::::: CCDS61 SSVQSHPSQSVRSVSSPNVPALESGYTQISPEQGSLSAPSMQNMETSPMMDVPSVSDHSQ 1490 1500 1510 1520 1530 1540 1670 1680 1690 1700 1710 pF1KE2 QVVDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNGSSQNSCSYSNLTSSS-LTQSSC :::::::::::::::::::::::::::::::::::::.:::.::::..:.::: :::::: CCDS61 QVVDSGFSDLGSIESTTENYENPSSYDSTMGGSICGNSSSQSSCSYGGLSSSSSLTQSSC 1550 1560 1570 1580 1590 1600 1720 1730 1740 1750 1760 pF1KE2 AVTQQMSNISGSCSMLQQTSISSPPTCSVKSPQGCVVERPPSSSQQ-------------- .:::::.....::::.::.:.. .::.::::.::::::::..:: CCDS61 VVTQQMASMGSSCSMMQQSSVQPAANCSIKSPQSCVVERPPSNQQQQPPPPPPQQPQPPP 1610 1620 1630 1640 1650 1660 1770 1780 pF1KE2 --------------------------------------LAQCSMAANFTPPMQLAEIPET :.:::: .::: .. ::::. CCDS61 PQPQPAPQPPPPQQQPQQQPQPQPQQPPPPPPPQQQPPLSQCSMNNSFTPAPMIMEIPES 1670 1680 1690 1700 1710 1720 1790 1800 1810 1820 1830 1840 pF1KE2 -SNANIGLYERMGQSDFGAGHYPQPSATFSLAKLQQLTNTLID-HSLPYSHSAAVTSYAN :..::..:::. .::::: : :::::::::::::::::..: :..::::: ::::::. CCDS61 GSTGNISIYERI-PGDFGAGSYSQPSATFSLAKLQQLTNTIMDPHAMPYSHSPAVTSYAT 1730 1740 1750 1760 1770 1780 1850 1860 1870 1880 1890 1900 pF1KE2 SASLSTPLSNTGLVQLSQSPHSVPGGPQAQATMTPPPNLTPPPMNLPPPLLQRNMAASNI :.::: ::::.::. : : . : :::::::::::::. ::: :::: ::.:.:: CCDS61 SVSLS----NTGLAQLAPS-HPLAGTPQAQATMTPPPNLASTTMNLTSPLLQCNMSATNI 1790 1800 1810 1820 1830 1910 1920 1930 1940 1950 1960 pF1KE2 GISHSQRLQTQIASKGHISMRTKSASLSPAAATHQSQIYGRSQT-VAMQGPARTLTMQRG :: :.:::: :. :::::.:.::: : :.::.::.:.:::: . ::::. :.:..: CCDS61 GIPHTQRLQGQMPVKGHISIRSKSAPL-PSAAAHQQQLYGRSPSAVAMQAGPRALAVQRG 1840 1850 1860 1870 1880 1890 1970 1980 1990 2000 2010 2020 pF1KE2 MNMSVNLMPAPAYNVNSVNMNMNTLNAMNGYSMSQPMMNSGYHSNHGYMNQTPQYPMQMQ CCDS61 MNMGVNLMPTPAYNVNSMNMNTLNAMNSYRMTQPMMNSSYHSNPAYMNQTAQYPMQMQMG 1900 1910 1920 1930 1940 1950 >>CCDS83290.1 KAT6A gene_id:7994|Hs108|chr8 (815 aa) initn: 3748 init1: 1649 opt: 1703 Z-score: 828.5 bits: 165.6 E(32554): 7.9e-40 Smith-Waterman score: 3392; 53.7% identity (69.4% similar) in 1033 aa overlap (1-1030:1-815) 10 20 30 40 50 60 pF1KE2 MVKLANPLYTEWILEAIQKIKKQKQRPSEERICHAVSTSHGLDKKTVSEQLELSVQDGSV :::::::::::::::::.:.:::::::::::::.:::.:::::.::: :::::::.::.. CCDS83 MVKLANPLYTEWILEAIKKVKKQKQRPSEERICNAVSSSHGLDRKTVLEQLELSVKDGTI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LKVTNKGLASYKDPDNPGRFSSVKPGTFPKSAKGSRGSCNDLRNVDWNKLLRRAIEGLEE :::.:::: ::::::::::.. :: ..:. .. .:::::::..::.::: : CCDS83 LKVSNKGLNSYKDPDNPGRIALPKPR--------NHGKLDNKQNVDWNKLIKRAVEGLAE 70 80 90 100 110 130 140 150 160 170 pF1KE2 PNGSSLKNIEKYLRSQSDLTSTTNNPA---FQQRLRLGAKRAVNNGRLLKDGPQYRVNYG .::.::.::..:..:.:... .. : :.:.:::. :::...:::::::: ::.: CCDS83 SGGSTLKSIERFLKGQKDVSALFGGSAASGFHQQLRLAIKRAIGHGRLLKDGPLYRLNTK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 SLDGKGAPQYPSAFPSSLPPVSLLPHEKDQPRADPIPICSFCLGTKESNREKKPEELLSC . . : . : : ::::::::::::.: :.:::::::::::::.:::::::::.:: CCDS83 ATNVDGKESCESL--SCLPPVSLLPHEKDKPVAEPIPICSFCLGTKEQNREKKPEELISC 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 ADCGSSGHPSCLKFCPELTTNVKALRWQCIECKTCSACRVQGRNADNMLFCDSCDRGFHM ::::.::::::::: ::::. :::::::::::::::.:: ::.::::::::::::::::: CCDS83 ADCGNSGHPSCLKFSPELTVRVKALRWQCIECKTCSSCRDQGKNADNMLFCDSCDRGFHM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 ECCDPPLSRMPKGMWICQVCRPKKKGRKLLHEKAAQIKRRYAKPIGRPKNKLKQRLLSVT :::::::.::::::::::.:::.:::::::..:::::::::..:::::::.::.. : CCDS83 ECCDPPLTRMPKGMWICQICRPRKKGRKLLQKKAAQIKRRYTNPIGRPKNRLKKQ---NT 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 SDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKITTTS ..: .. : .::::.: :. . .:. ..: . :. : : CCDS83 VSKGPFSKV--RTGPGRGRKRKITLSSQSASSSSEEGYLERIDGLDFCRD---------- 350 360 370 380 390 420 430 440 450 460 470 pF1KE2 TYISASTLKVNKKTKGLIDGLTKFFTPSPDGRRSRGEIIDFSKHYRPRKKVSQKQSCTSH : .:: ::::::::::::::::::::::..:::..:.:..:: ::. CCDS83 ---SNVSLKFNKKTKGLIDGLTKFFTPSPDGRKARGEVVDYSEQYRIRKR---------- 400 410 420 430 440 480 490 500 510 520 530 pF1KE2 VLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVPSLSSLTTN ...:::: :. :. CCDS83 ----------------------------GNRKSST-------------------SDWPTD 450 540 550 560 570 580 590 pF1KE2 SQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIRSRF .: :: CCDS83 NQ-----DG--------------------------------------------------- 600 610 620 630 640 650 pF1KE2 ISHSSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGR : :: CCDS83 --------W------------------------------------------------DG- 460 660 670 680 690 700 710 pF1KE2 IKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELSWEKIECESGVEDCG :::. . ..:.....::.:...:.. :: . .:. . . CCDS83 ---------------KQENEE-RLFGSQEIMTEKDMELFRDIQEQALQKVGVTGPPDPQV 470 480 490 500 720 730 740 750 760 770 pF1KE2 RYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPP : :::::::::::.:::::::::::.:::::::::::::::::..:: .: ::::::::: CCDS83 RCPSVIEFGKYEIHTWYSSPYPQEYSRLPKLYLCEFCLKYMKSRTILQQHMKKCGWFHPP 510 520 530 540 550 560 780 790 800 810 820 830 pF1KE2 ANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGC ::::::....::::::::.: ::::::::::::::::::::::::::::::::.:: ::: CCDS83 ANEIYRKNNISVFEVDGNVSTIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTQNDVKGC 570 580 590 600 610 620 840 850 860 870 880 890 pF1KE2 HLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDL :::::::::: ::::::::::::.::.::.:.::::::::::::.::::::::::::::: CCDS83 HLVGYFSKEKHCQQKYNVSCIMILPQYQRKGYGRFLIDFSYLLSKREGQAGSPEKPLSDL 630 640 650 660 670 680 900 910 920 930 940 950 pF1KE2 GRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVI :::::.::::::::: :::.....:::: .:. ::.::.::..::.::.:.: :. .::: CCDS83 GRLSYMAYWKSVILECLYHQNDKQISIKKLSKLTGICPQDITSTLHHLRMLDFRSDQFVI 690 700 710 720 730 740 960 970 980 990 1000 1010 pF1KE2 IRREKLILSHMEKLKTCSRANELDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASC ::::::: .:: ::. : ..::. :::::...::..:::::.: .:.: :. .: CCDS83 IRREKLIQDHMAKLQLNLRPVDVDPECLRWTPVIVSNSVVSEEEEEEAEEGEN--EEPQC 750 760 770 780 790 800 1020 1030 1040 1050 1060 1070 pF1KE2 WEKEEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSEEEEEEED :.: . .:.:: CCDS83 QERELE--ISVRA 810 >>CCDS11554.1 KAT7 gene_id:11143|Hs108|chr17 (611 aa) initn: 1199 init1: 1119 opt: 1232 Z-score: 606.2 bits: 124.0 E(32554): 1.9e-27 Smith-Waterman score: 1259; 38.1% identity (64.5% similar) in 622 aa overlap (385-989:10-607) 360 370 380 390 400 410 pF1KE2 SVTSDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKIT ::. .. .: :. : :: .. .:.. . CCDS11 MPRRKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRS 10 20 30 420 430 440 450 460 pF1KE2 TTSTYISASTLKVNKKTKGLIDGLTKFFTPSP--DGRR---SRGEIIDFSKHYRPRKKVS . : :.. :. ... .. . .: .: : : . :: :. . . . : ... CCDS11 ARVTR-SSARLSQSSQDSSPVRNLQSFGTEEPAYSTRRVTRSQQQPTPVTPKKYPLRQTR 40 50 60 70 80 90 470 480 490 500 510 520 pF1KE2 QKQSCTSHVLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVP .. : : .:. . . . . :: .:..:::. :. :::. : CCDS11 SSGSETEQVVDFSDRETKNTADHDESPPRTPTGNAPSSE-SDIDISSPN---------VS 100 110 120 130 140 530 540 550 560 570 580 pF1KE2 SLSSLTTNSQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFG :.. . .:: . ::: .:.. : :: :. : .: .:. : CCDS11 HDESIAKDMSLKDSGSDLSH-----RPKRRRFHESYNF--NMKCPTP---GCNSLGHLTG 150 160 170 180 190 590 600 610 620 630 640 pF1KE2 KRDIRSRFISHSSSSSWGMARGSIFKAIAHFKRTTFLKK---HRMLGRLKYKVTPQMGTP :.. : .: :. . .. :. :. . . .. ::. .. . : : CCDS11 KHE---RHFSISGCPLYHNLSADECKVRAQSRDKQIEERMLSHRQDDNNRHATRHQAPTE 200 210 220 230 240 250 650 660 670 680 690 700 pF1KE2 SP--GKGSLTDGRIKPDQDDDTEIK---INIKQESADVNVIGNKDVVTEEDLDVFKQAQE : .... : : .. . : : .. .: ... .....: :::.:..:: CCDS11 RQLRYKEKVAELRKKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQA 260 270 280 290 300 310 710 720 730 740 750 pF1KE2 LS---WEKIECESGVEDCGRYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYM . ::.. .. . . . . ..: ::.::..::: ::::.::::: .::.:::::::: CCDS11 RASEDLEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYM 320 330 340 350 360 370 760 770 780 790 800 810 pF1KE2 KSKNILLRHSKKCGWFHPPANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLY ::..:: :: :: : :::..::::. ..:::::::. .::::::::::::::::::::: CCDS11 KSQTILRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLY 380 390 400 410 420 430 820 830 840 850 860 870 pF1KE2 YDVEPFLFYVLTKNDEKGCHLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSY ::::::::::.:. :. ::::.::::::: .::::::. :::..:::.:..:::::: CCDS11 YDVEPFLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSY 440 450 460 470 480 490 880 890 900 910 920 930 pF1KE2 LLSRREGQAGSPEKPLSDLGRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDI :::. : ..::::.:::::: .:: .::: :.:.::.. . ..:::: ::. :.. : :: CCDS11 LLSKVEEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDI 500 510 520 530 540 550 940 950 960 970 980 990 pF1KE2 ATTLQHLHMIDKRDGRFVIIRREKLILSHMEKLKTCSRANE-LDPDSLRWTPILISNAAV ..::: :.:. :. ....:. :: . : : .:. .::. :.::: CCDS11 VSTLQALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 560 570 580 590 600 610 1000 1010 1020 1030 1040 1050 pF1KE2 SEEEREAEKEAERLMEQASCWEKEEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGE >>CCDS56038.1 KAT7 gene_id:11143|Hs108|chr17 (442 aa) initn: 1165 init1: 1119 opt: 1209 Z-score: 597.2 bits: 121.9 E(32554): 6.1e-27 Smith-Waterman score: 1209; 46.2% identity (71.4% similar) in 420 aa overlap (575-989:22-438) 550 560 570 580 590 600 pF1KE2 DGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFGKRDIR-SRFISHSSS :.: : .:.. ..:. : .: .. :. CCDS56 MPRRKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRSARVTRSSARLSQ 10 20 30 40 50 610 620 630 640 650 660 pF1KE2 SSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPGKGSLTDGRIKPDQD :: : : : ::. . : . . : .. . . : : . . CCDS56 SSQGHLTG---KHERHFSISGCPLYHNLSADECKAPTERQLRYKEKVAELRKKRNSGLSK 60 70 80 90 100 670 680 690 700 710 720 pF1KE2 DDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELS---WEKIECESGVEDCGRYP .. : .. .: ... .....: :::.:..:: . ::.. .. . . . . CCDS56 EQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASEDLEKLRLQGQITEGSNMI 110 120 130 140 150 160 730 740 750 760 770 780 pF1KE2 SVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKCGWFHPPANE ..: ::.::..::: ::::.::::: .::.::::::::::..:: :: :: : :::..: CCDS56 KTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKCVWKHPPGDE 170 180 190 200 210 220 790 800 810 820 830 840 pF1KE2 IYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTKNDEKGCHLV :::. ..:::::::. .:::::::::::::::::::::::::::::::.:. :. ::::. CCDS56 IYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTEADNTGCHLI 230 240 250 260 270 280 850 860 870 880 890 900 pF1KE2 GYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPEKPLSDLGRL ::::::: .::::::. :::..:::.:..:::::::::. : ..::::.:::::: . CCDS56 GYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPERPLSDLGLI 290 300 310 320 330 340 910 920 930 940 950 960 pF1KE2 SYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKRDGRFVIIRR :: .::: :.:.::.. . ..:::: ::. :.. : ::..::: :.:. :. ....: CCDS56 SYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYWKGKHLVLKR 350 360 370 380 390 400 970 980 990 1000 1010 pF1KE2 EKLILSHMEKLKTCSRANE-LDPDSLRWTPILISNAAVSEEEREAEKEAERLMEQASCWE . :: . : : .:. .::. :.::: CCDS56 QDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 410 420 430 440 >>CCDS56037.1 KAT7 gene_id:11143|Hs108|chr17 (472 aa) initn: 1165 init1: 1119 opt: 1203 Z-score: 593.9 bits: 121.4 E(32554): 9.2e-27 Smith-Waterman score: 1203; 56.0% identity (80.9% similar) in 309 aa overlap (685-989:160-468) 660 670 680 690 700 710 pF1KE2 DGRIKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELS---WEKIECES .....: :::.:..:: . ::.. .. CCDS56 KKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASEDLEKLRLQG 130 140 150 160 170 180 720 730 740 750 760 770 pF1KE2 GVEDCGRYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLRHSKKC . . . . ..: ::.::..::: ::::.::::: .::.::::::::::..:: :: :: CCDS56 QITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRRHMAKC 190 200 210 220 230 240 780 790 800 810 820 830 pF1KE2 GWFHPPANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVLTK : :::..::::. ..:::::::. .:::::::::::::::::::::::::::::::.:. CCDS56 VWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLFYVMTE 250 260 270 280 290 300 840 850 860 870 880 890 pF1KE2 NDEKGCHLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQAGSPE :. ::::.::::::: .::::::. :::..:::.:..:::::::::. : ..:::: CCDS56 ADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEKVGSPE 310 320 330 340 350 360 900 910 920 930 940 950 pF1KE2 KPLSDLGRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLHMIDKR .:::::: .:: .::: :.:.::.. . ..:::: ::. :.. : ::..::: :.:. CCDS56 RPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQMLKYW 370 380 390 400 410 420 960 970 980 990 1000 1010 pF1KE2 DGRFVIIRREKLILSHMEKLKTCSRANE-LDPDSLRWTPILISNAAVSEEEREAEKEAER :. ....:. :: . : : .:. .::. :.::: CCDS56 KGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 430 440 450 460 470 1020 1030 1040 1050 1060 1070 pF1KE2 LMEQASCWEKEEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELSKESSE >>CCDS56036.1 KAT7 gene_id:11143|Hs108|chr17 (501 aa) initn: 1165 init1: 1119 opt: 1203 Z-score: 593.6 bits: 121.4 E(32554): 9.6e-27 Smith-Waterman score: 1220; 42.2% identity (68.3% similar) in 498 aa overlap (498-989:27-497) 470 480 490 500 510 520 pF1KE2 VSQKQSCTSHVLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCS : : .. .:..:. .: : . :.::: : CCDS56 MPRRKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRSARVTRSSARLSQSSQDS 10 20 30 40 50 530 540 550 560 570 580 pF1KE2 VPSLSSLTTNSQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKR--MRRKTELSSTAKSKA : . . ... : :.:. .:.. .:. . ::. .:. .: ... . CCDS56 SPVRNLQSFGTEEPA--------YSTRRVTRSQQQPTPVTPKKYPLRQTRSSGSETEQVV 60 70 80 90 100 590 600 610 620 630 640 pF1KE2 HFFGKRDIRSRFISHSSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGT : . . .. : : :. . .. . . : : .:.: : : :: CCDS56 DFSDRGHLTGKHERHFSISGCPLYHNL---SADECKAPT----ERQL-RYKEKV------ 110 120 130 140 150 650 660 670 680 690 700 pF1KE2 PSPGKGSLTDGRIKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELS-- . : : . . .. : .. .: ... .....: :::.:..:: . CCDS56 -----AELRKKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASE 160 170 180 190 200 710 720 730 740 750 760 pF1KE2 -WEKIECESGVEDCGRYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKN ::.. .. . . . . ..: ::.::..::: ::::.::::: .::.::::::::::.. CCDS56 DLEKLRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQT 210 220 230 240 250 260 770 780 790 800 810 820 pF1KE2 ILLRHSKKCGWFHPPANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVE :: :: :: : :::..::::. ..:::::::. .::::::::::::::::::::::::: CCDS56 ILRRHMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVE 270 280 290 300 310 320 830 840 850 860 870 880 pF1KE2 PFLFYVLTKNDEKGCHLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSR ::::::.:. :. ::::.::::::: .::::::. :::..:::.:..:::::::::. CCDS56 PFLFYVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSK 330 340 350 360 370 380 890 900 910 920 930 940 pF1KE2 REGQAGSPEKPLSDLGRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTL : ..::::.:::::: .:: .::: :.:.::.. . ..:::: ::. :.. : ::..:: CCDS56 VEEKVGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTL 390 400 410 420 430 440 950 960 970 980 990 1000 pF1KE2 QHLHMIDKRDGRFVIIRREKLILSHMEKLKTCSRANE-LDPDSLRWTPILISNAAVSEEE : :.:. :. ....:. :: . : : .:. .::. :.::: CCDS56 QALQMLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 450 460 470 480 490 500 1010 1020 1030 1040 1050 1060 pF1KE2 REAEKEAERLMEQASCWEKEEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQL >>CCDS56035.1 KAT7 gene_id:11143|Hs108|chr17 (581 aa) initn: 1199 init1: 1119 opt: 1203 Z-score: 592.7 bits: 121.4 E(32554): 1.1e-26 Smith-Waterman score: 1242; 38.6% identity (63.7% similar) in 614 aa overlap (385-989:10-577) 360 370 380 390 400 410 pF1KE2 SVTSDEGSMNAFTGRGSPGRGQKTKVCTTPSSGHAASGKDSSSRLAVTDPTRPGATTKIT ::. .. .: :. : :: .. .:.. . CCDS56 MPRRKRNAGSSSDGTEDSDFSTDLEHTDSSESDGTSRRS 10 20 30 420 430 440 450 460 pF1KE2 TTSTYISASTLKVNKKTKGLIDGLTKFFTPSP--DGRR---SRGEIIDFSKHYRPRKKVS . : :.. :. ... .. . .: .: : : . :: :. . . . : ... CCDS56 ARVTR-SSARLSQSSQDSSPVRNLQSFGTEEPAYSTRRVTRSQQQPTPVTPKKYPLRQTR 40 50 60 70 80 90 470 480 490 500 510 520 pF1KE2 QKQSCTSHVLATGTTQKLKPPPSSLPPPTPISGQSPSSQKSSTATSSPSPQSSSSQCSVP .. : : .:. . . . . :: .:..:::. :. :::. : CCDS56 SSGSETEQVVDFSDRETKNTADHDESPPRTPTGNAPSSE-SDIDISSPN---------VS 100 110 120 130 140 530 540 550 560 570 580 pF1KE2 SLSSLTTNSQLKALFDGLSHIYTTQGQSRKKGHPSYAPPKRMRRKTELSSTAKSKAHFFG :.. . .:: . ::: .:.. : :: :. : .: .:. : CCDS56 HDESIAKDMSLKDSGSDLSH-----RPKRRRFHESYNF--NMKCPTP---GCNSLGHLTG 150 160 170 180 190 590 600 610 620 630 640 pF1KE2 KRDIRSRFISHSSSSSWGMARGSIFKAIAHFKRTTFLKKHRMLGRLKYKVTPQMGTPSPG :.. : .: :. . .. :: .:.: : : ::. CCDS56 KHE---RHFSISGCPLYHNLSADECKA----------PTERQL-RYKEKVAE-------- 200 210 220 230 650 660 670 680 690 700 pF1KE2 KGSLTDGRIKPDQDDDTEIKINIKQESADVNVIGNKDVVTEEDLDVFKQAQELS---WEK : : . . .. : .. .: ... .....: :::.:..:: . :: CCDS56 ---LRKKRNSGLSKEQKEKYMEHRQTYGNTREPLLENLTSEYDLDLFRRAQARASEDLEK 240 250 260 270 280 290 710 720 730 740 750 760 pF1KE2 IECESGVEDCGRYPSVIEFGKYEIQTWYSSPYPQEYARLPKLYLCEFCLKYMKSKNILLR .. .. . . . . ..: ::.::..::: ::::.::::: .::.::::::::::..:: : CCDS56 LRLQGQITEGSNMIKTIAFGRYELDTWYHSPYPEEYARLGRLYMCEFCLKYMKSQTILRR 300 310 320 330 340 350 770 780 790 800 810 820 pF1KE2 HSKKCGWFHPPANEIYRRKDLSVFEVDGNMSKIYCQNLCLLAKLFLDHKTLYYDVEPFLF : :: : :::..::::. ..:::::::. .::::::::::::::::::::::::::::: CCDS56 HMAKCVWKHPPGDEIYRKGSISVFEVDGKKNKIYCQNLCLLAKLFLDHKTLYYDVEPFLF 360 370 380 390 400 410 830 840 850 860 870 880 pF1KE2 YVLTKNDEKGCHLVGYFSKEKLCQQKYNVSCIMIMPQHQRQGFGRFLIDFSYLLSRREGQ ::.:. :. ::::.::::::: .::::::. :::..:::.:..:::::::::. : . CCDS56 YVMTEADNTGCHLIGYFSKEKNSFLNYNVSCILTMPQYMRQGYGKMLIDFSYLLSKVEEK 420 430 440 450 460 470 890 900 910 920 930 940 pF1KE2 AGSPEKPLSDLGRLSYLAYWKSVILEYLYHHHERHISIKAISRATGMCPHDIATTLQHLH .::::.:::::: .:: .::: :.:.::.. . ..:::: ::. :.. : ::..::: :. CCDS56 VGSPERPLSDLGLISYRSYWKEVLLRYLHNFQGKEISIKEISQETAVNPVDIVSTLQALQ 480 490 500 510 520 530 950 960 970 980 990 1000 pF1KE2 MIDKRDGRFVIIRREKLILSHMEKLKTCSRANE-LDPDSLRWTPILISNAAVSEEEREAE :. :. ....:. :: . : : .:. .::. :.::: CCDS56 MLKYWKGKHLVLKRQDLIDEWIAKEAKRSNSNKTMDPSCLKWTPPKGT 540 550 560 570 580 1010 1020 1030 1040 1050 1060 pF1KE2 KEAERLMEQASCWEKEEQEILSTRANSRQSPAKVQSKNKYLHSPESRPVTGERGQLLELS 2073 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:31:11 2016 done: Tue Nov 8 17:31:12 2016 Total Scan time: 4.210 Total Display time: 0.600 Function used was FASTA [36.3.4 Apr, 2011]