FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9679, 2882 aa 1>>>pF1KE9679 2882 - 2882 aa - 2882 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.7413+/-0.00127; mu= 1.9412+/- 0.077 mean_var=289.8177+/-59.613, 0's: 0 Z-trim(109.0): 99 B-trim: 0 in 0/54 Lambda= 0.075338 statistics sampled from 10467 (10557) to 10467 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.324), width: 16 Scan time: 7.170 The best scores are: opt bits E(32554) CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881) 19135 2095.7 0 CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897) 15597 1711.2 0 CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997) 6649 738.6 1.3e-211 CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581) 5829 649.5 7.6e-185 CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302) 5816 648.0 1.8e-184 CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715) 5500 613.7 4.6e-174 CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905) 1602 189.9 1.2e-46 CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912) 1602 189.9 1.2e-46 CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954) 1577 187.2 8e-46 CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966) 1577 187.2 8e-46 CCDS32554.1 CHD3 gene_id:1107|Hs108|chr17 (2000) 1577 187.2 8.1e-46 CCDS32553.2 CHD3 gene_id:1107|Hs108|chr17 (2059) 1577 187.2 8.3e-46 CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054) 1152 140.9 3.9e-32 CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070) 1152 140.9 3.9e-32 CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 1014 126.0 1.8e-27 CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 1014 126.0 1.8e-27 CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 ( 948) 988 123.0 8.3e-27 CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 989 123.3 1.2e-26 CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 989 123.3 1.2e-26 CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 989 123.3 1.2e-26 CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 989 123.3 1.2e-26 CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 985 122.8 1.6e-26 CCDS83338.1 SMARCA2 gene_id:6595|Hs108|chr9 (1514) 779 100.4 8.4e-20 CCDS34204.1 CHD1 gene_id:1105|Hs108|chr5 (1710) 770 99.5 1.8e-19 CCDS7229.1 ERCC6 gene_id:2074|Hs108|chr10 (1493) 722 94.2 6.1e-18 CCDS10374.2 CHD2 gene_id:1106|Hs108|chr15 (1828) 705 92.4 2.6e-17 CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 677 89.2 1.4e-16 CCDS76018.1 SMARCA1 gene_id:6594|Hs108|chrX (1058) 654 86.7 7.7e-16 CCDS73164.1 HELLS gene_id:3070|Hs108|chr10 ( 700) 591 79.8 6.3e-14 CCDS73165.1 HELLS gene_id:3070|Hs108|chr10 ( 714) 591 79.8 6.4e-14 CCDS73163.1 HELLS gene_id:3070|Hs108|chr10 ( 740) 591 79.8 6.6e-14 CCDS7434.1 HELLS gene_id:3070|Hs108|chr10 ( 838) 591 79.8 7.3e-14 CCDS73162.1 HELLS gene_id:3070|Hs108|chr10 ( 884) 591 79.8 7.7e-14 CCDS58022.1 CHD1L gene_id:9557|Hs108|chr1 ( 616) 564 76.8 4.4e-13 CCDS58021.1 CHD1L gene_id:9557|Hs108|chr1 ( 693) 564 76.8 4.8e-13 CCDS72882.1 CHD1L gene_id:9557|Hs108|chr1 ( 797) 564 76.9 5.4e-13 CCDS927.1 CHD1L gene_id:9557|Hs108|chr1 ( 897) 564 76.9 5.9e-13 CCDS532.1 RAD54L gene_id:8438|Hs108|chr1 ( 747) 527 72.8 8.3e-12 CCDS10071.1 INO80 gene_id:54617|Hs108|chr15 (1556) 515 71.7 3.7e-11 CCDS10689.2 SRCAP gene_id:10847|Hs108|chr16 (3230) 511 71.5 9.1e-11 >>CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881 aa) initn: 14767 init1: 14767 opt: 19135 Z-score: 11247.4 bits: 2095.7 E(32554): 0 Smith-Waterman score: 19135; 99.9% identity (99.9% similar) in 2882 aa overlap (1-2882:1-2881) 10 20 30 40 50 60 pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRP ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS45 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRRLDRP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE9 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE9 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE9 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE9 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE9 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE9 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE9 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE9 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE9 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE9 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEES :::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::: CCDS45 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKR-ESTTHMKAYDEES 2170 2180 2190 2200 2210 2230 2240 2250 2260 2270 2280 pF1KE9 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK 2220 2230 2240 2250 2260 2270 2290 2300 2310 2320 2330 2340 pF1KE9 WPSARRSYDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSKEGGL ::::::::::::::::::::::::::::::::.::::::::::::::::::::::::::: CCDS45 WPSARRSYDANTVASFYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKEGGL 2280 2290 2300 2310 2320 2330 2350 2360 2370 2380 2390 2400 pF1KE9 KLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSIPVSGTSIQPTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 KLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSIPVSGTSIQPTL 2340 2350 2360 2370 2380 2390 2410 2420 2430 2440 2450 2460 pF1KE9 GANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 GANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYT 2400 2410 2420 2430 2440 2450 2470 2480 2490 2500 2510 2520 pF1KE9 QPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 QPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEG 2460 2470 2480 2490 2500 2510 2530 2540 2550 2560 2570 2580 pF1KE9 RPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGV 2520 2530 2540 2550 2560 2570 2590 2600 2610 2620 2630 2640 pF1KE9 APEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATAAAAAASATSVSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 APEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATAAAAAASATSVSG 2580 2590 2600 2610 2620 2630 2650 2660 2670 2680 2690 2700 pF1KE9 NPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGEAKNMAAMFPMLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 NPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGEAKNMAAMFPMLL 2640 2650 2660 2670 2680 2690 2710 2720 2730 2740 2750 2760 pF1KE9 SGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPS 2700 2710 2720 2730 2740 2750 2770 2780 2790 2800 2810 2820 pF1KE9 ASSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTLSQSNTFDVQNKNSDLG .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TSSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTLSQSNTFDVQNKNSDLG 2760 2770 2780 2790 2800 2810 2830 2840 2850 2860 2870 2880 pF1KE9 SSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSSEDSDSSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSSEDSDSSN 2820 2830 2840 2850 2860 2870 pF1KE9 ED :: CCDS45 ED 2880 >>CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897 aa) initn: 14767 init1: 14767 opt: 15597 Z-score: 9169.1 bits: 1711.2 E(32554): 0 Smith-Waterman score: 19093; 99.3% identity (99.4% similar) in 2898 aa overlap (1-2882:1-2897) 10 20 30 40 50 60 pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE9 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE9 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE9 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE9 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE9 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE9 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRP ::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::: CCDS76 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRRLDRP 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE9 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE9 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE9 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE9 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE9 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE9 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE9 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE9 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA 1270 1280 1290 1300 1310 1320 1330 1340 1350 1360 1370 1380 pF1KE9 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID 1330 1340 1350 1360 1370 1380 1390 1400 1410 1420 1430 1440 pF1KE9 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR 1390 1400 1410 1420 1430 1440 1450 1460 1470 1480 1490 1500 pF1KE9 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK 1450 1460 1470 1480 1490 1500 1510 1520 1530 1540 1550 1560 pF1KE9 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 pF1KE9 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI 1570 1580 1590 1600 1610 1620 1630 1640 1650 1660 1670 1680 pF1KE9 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD 1630 1640 1650 1660 1670 1680 1690 1700 1710 1720 1730 1740 pF1KE9 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA 1690 1700 1710 1720 1730 1740 1750 1760 1770 1780 1790 1800 pF1KE9 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ 1750 1760 1770 1780 1790 1800 1810 1820 1830 1840 1850 1860 pF1KE9 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910 1920 pF1KE9 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER 1870 1880 1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020 2030 2040 pF1KE9 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI 1990 2000 2010 2020 2030 2040 2050 2060 2070 2080 2090 2100 pF1KE9 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET 2050 2060 2070 2080 2090 2100 2110 2120 2130 2140 2150 2160 pF1KE9 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR 2110 2120 2130 2140 2150 2160 2170 2180 2190 2200 2210 2220 pF1KE9 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEES :::::::::::::::::::::::::::::::::::::::::::::: ::::::::::::: CCDS76 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKR-ESTTHMKAYDEES 2170 2180 2190 2200 2210 2230 2240 2250 2260 2270 2280 pF1KE9 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK 2220 2230 2240 2250 2260 2270 2290 2300 2310 2320 2330 pF1KE9 WPSARRSYDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSK---- ::::::::::::::::::::::::::::::::.::::::::::::::::::::::: CCDS76 WPSARRSYDANTVASFYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKVKKH 2280 2290 2300 2310 2320 2330 2340 2350 2360 2370 2380 pF1KE9 ------------EGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVN :::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VREKEFTVKIKDEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVN 2340 2350 2360 2370 2380 2390 2390 2400 2410 2420 2430 2440 pF1KE9 FPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 FPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGL 2400 2410 2420 2430 2440 2450 2450 2460 2470 2480 2490 2500 pF1KE9 TSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGY 2460 2470 2480 2490 2500 2510 2510 2520 2530 2540 2550 2560 pF1KE9 VEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 VEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPP 2520 2530 2540 2550 2560 2570 2570 2580 2590 2600 2610 2620 pF1KE9 LKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 LKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIA 2580 2590 2600 2610 2620 2630 2630 2640 2650 2660 2670 2680 pF1KE9 KATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 KATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLP 2640 2650 2660 2670 2680 2690 2690 2700 2710 2720 2730 2740 pF1KE9 SGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 SGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTES 2700 2710 2720 2730 2740 2750 2750 2760 2770 2780 2790 2800 pF1KE9 QSSENGGENSVSSSPSASSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTL ::::::::::::::::.::::::::::::::::::::::::::::::::::::::::::: CCDS76 QSSENGGENSVSSSPSTSSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTL 2760 2770 2780 2790 2800 2810 2810 2820 2830 2840 2850 2860 pF1KE9 SQSNTFDVQNKNSDLGSSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 SQSNTFDVQNKNSDLGSSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASS 2820 2830 2840 2850 2860 2870 2870 2880 pF1KE9 GSDSTSSSSEDSDSSNED :::::::::::::::::: CCDS76 GSDSTSSSSEDSDSSNED 2880 2890 >>CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997 aa) initn: 7465 init1: 3895 opt: 6649 Z-score: 3912.8 bits: 738.6 E(32554): 1.3e-211 Smith-Waterman score: 8818; 50.0% identity (71.2% similar) in 3042 aa overlap (78-2875:79-2996) 50 60 70 80 90 100 pF1KE9 LHIDSLNHVQGTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCS :.: ..: ..:.. . :::::.. CCDS47 SLQPSLHHPSTNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTP 50 60 70 80 90 100 110 120 130 140 pF1KE9 PIHPQ-------NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ--- :. :: . :..: .. :.: ::: . :. . .: .:..:: CCDS47 PV-PQVPHGGSGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQ 110 120 130 140 150 160 150 160 170 180 190 pF1KE9 --------------GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQ :: . :.: :..:. ::.. .:. : :: .... :: CCDS47 PQPPQPAPSGPPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQ 170 180 190 200 210 200 210 220 230 240 pF1KE9 NSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH-- ..:.:.. :. .::: ...: ::.. . . :.::: . .::. .: : .: CCDS47 EGLNQGNPFIATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSP 220 230 240 250 260 270 250 260 270 280 290 pF1KE9 -------QEG-------NFNGPSPNMTSCSVSNSQQFSSH-YSFSSNHISPNSLLQSSAV :.: ::.. : .. : ...:: :.: . :: .. . :. .... CCDS47 RFSPNPPQQGAVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLG 280 290 300 310 320 330 300 310 320 330 340 350 pF1KE9 LASNHT-NQTLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-S :..: ::.. . .. .: . : . :. ..:. :::. : : .: :.:::.: : CCDS47 LTNNTPMNQSVPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYAS 340 350 360 370 380 390 360 370 380 390 pF1KE9 NSKLSPVH-MNFPD--------------PVDSGT--QMGHFNDHVETNGFSSL-EENLLH .::.. :. : :.. :. .: : . . : .. ..:. CCDS47 PPPMSPMKAMSNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGP 400 410 420 430 440 450 400 410 420 430 pF1KE9 QVESQTEPFTGLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHI . .:..:: :.. :..: .:: :.: .. ::. : . CCDS47 RNMQQSRPFIGMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQ 460 470 480 490 500 510 440 450 460 470 480 pF1KE9 LDHDLDRQF---TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSS : : : . : : : . .. . : :. .. :.. :. CCDS47 LPTCPPLQPHPGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDM 520 530 540 550 560 570 490 500 510 520 530 540 pF1KE9 KKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRV . .: .. .. . . .. :.:: :..: :.:..: .:. :. ..: CCDS47 TQVSGPNAQLVKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGG 580 590 600 610 620 550 560 570 580 pF1KE9 MSPENFPTASVEGKEEKKGRRMKSK----------------------------PKDKDSK .. ... :..:..:.: .. .:: ::. : CCDS47 VDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEK 630 640 650 660 670 680 590 600 610 620 630 pF1KE9 KTKTC------SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAEQMPQHT---LKDQDS :.:: :: . . : . .: :: .. . ..: :: .. : . .:.: CCDS47 KAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDP 690 700 710 720 730 740 640 650 660 670 680 pF1KE9 --QKRRSNRQIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDA :::::.::.:::.:.::.: : :.::. . ..: : : : .. . .. CCDS47 GVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEG 750 760 770 780 790 690 700 710 720 730 740 pF1KE9 AIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRF .:.::.:::.:::. : .. :::.:::::.:::::.::. :.: :::::::::::: CCDS47 PVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRF 800 810 820 830 840 850 750 760 770 780 790 800 pF1KE9 KLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDST : .:.: .:....:.: ::::::::::... . : : :::: .:::::::::::::: CCDS47 KAKQGQN-KFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDST 860 870 880 890 900 910 810 820 830 840 850 860 pF1KE9 WELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLN :: ..:.: :::::::.:.. .:.:. ..:::.. ::: ..::.:::.:.::::::::.: CCDS47 WERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVN 920 930 940 950 960 970 870 880 890 900 910 920 pF1KE9 WLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRT :::::::: :::::::::::::::::::::::: : ::.::::.::::::: :::::::: CCDS47 WLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRT 980 990 1000 1010 1020 1030 930 940 950 960 970 980 pF1KE9 WTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAI ::..:::::::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: : CCDS47 WTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNI 1040 1050 1060 1070 1080 1090 990 1000 1010 1020 1030 1040 pF1KE9 EWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFP ::::.:::::::::.:::::::::.:.:::::::::::::::::::::::::::: ::: CCDS47 PWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFP 1100 1110 1120 1130 1140 1150 1050 1060 1070 1080 1090 1100 pF1KE9 SESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKY ::.::::::::::::::::::::::::::::::::::::.:::::::::::::::::::: CCDS47 SETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKY 1160 1170 1180 1190 1200 1210 1110 1120 1130 1140 1150 1160 pF1KE9 YRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAA :::::::::.:::::.::.:::::.::::::::::::::::.::::::: ::..:.: . CCDS47 YRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAES 1220 1230 1240 1250 1260 1270 1170 1180 1190 1200 1210 1220 pF1KE9 SDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERID ::.::::::.:::::::::::::.:::::.:::::::::::::::::::..:: ::::: CCDS47 PDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERID 1280 1290 1300 1310 1320 1330 1230 1240 1250 1260 1270 1280 pF1KE9 GRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQ 1340 1350 1360 1370 1380 1390 1290 1300 1310 1320 1330 1340 pF1KE9 ARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSK ::::::::.:.::.:::.:::::::::::.:::::::::::::::::::. ..:.::::: CCDS47 ARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSK 1400 1410 1420 1430 1440 1450 1350 1360 1370 1380 1390 1400 pF1KE9 KEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVAS ::::::::.:::::.:.:::::::::::::::::::::.::::::::.:::::::::::: CCDS47 KEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVAS 1460 1470 1480 1490 1500 1510 1410 1420 1430 1440 1450 1460 pF1KE9 GNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELS ::::::::::::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.: CCDS47 GNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFS 1520 1530 1540 1550 1560 1570 1470 1480 1490 1500 1510 1520 pF1KE9 EAESEGDEKP--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEH . ::...::: : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:. CCDS47 DLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQ 1580 1590 1600 1610 1620 1630 1530 1540 1550 1560 1570 1580 pF1KE9 DVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKK ::: :::..:.::: ::.:::.::.::::::::: ::::: : :: :::::::::::::: CCDS47 DVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKK 1640 1650 1660 1670 1680 1690 1590 1600 1610 1620 1630 1640 pF1KE9 VKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNEC ::.:... .: :.:: . ::. :.:...::::.:::::::::::::::::.:::::.. CCDS47 VKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQA 1700 1710 1720 1730 1740 1750 1650 1660 1670 1680 1690 1700 pF1KE9 QKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCF .:...:.:.:. :::.::: :.::::.::: .::::::::::::::::::..:::::::: CCDS47 DKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCF 1760 1770 1780 1790 1800 1810 1710 1720 1730 1740 1750 pF1KE9 LERVGKPDEKAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD ::::: :: ::.:::::..:.. :: . :::::::. . :::.:.. ..::.. CCDS47 LERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSE 1820 1830 1840 1850 1860 1870 1760 1770 1780 1790 1800 pF1KE9 ----LVIADGDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFS . . :. :.. ..:::. :.::::::::::::::. : .:..: . .. CCDS47 DKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMK 1880 1890 1900 1910 1920 1930 1810 1820 1830 1840 1850 1860 pF1KE9 VPTSVMQPIYEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTK . .: : .:. . : : :..:.::::::::::::::::::.::: . ::::.. CCDS47 TDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQ 1940 1950 1960 1970 1980 1990 1870 1880 1890 1900 1910 1920 pF1KE9 FRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLY :::.::: ::.:.:::::. :..:::::::.: : . :.. .:.:::::::::::: CCDS47 FRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLY 2000 2010 2020 2030 2040 2050 1930 1940 1950 1960 1970 1980 pF1KE9 RIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHI :::::::.:::.:.:::: ::::::.:. ::: ::::: ::::::.:::::::::::::: CCDS47 RIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHI 2060 2070 2080 2090 2100 2110 1990 2000 2010 2020 2030 2040 pF1KE9 LRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMK : ::::::. :..:..:.. : . .: .:: : :.. CCDS47 LNDPELSFLDAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPV 2120 2130 2140 2150 2050 2060 2070 2080 2090 2100 pF1KE9 VKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVA ..: ....: :: :: : : : CCDS47 ISSAHIQDER---------------------------VLEQAEG------KVE------- 2160 2170 2110 2120 2130 2140 2150 2160 pF1KE9 ARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSS :: :::.:. . .:.: ..:.....:. .. .:: .. . . :... CCDS47 ---EP--ENPAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADT- 2180 2190 2200 2210 2220 2170 2180 2190 2200 2210 2220 pF1KE9 SSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEESVASLST .:.: : ..: . . :..:..:: .: .: .... : .:::: ::.:: CCDS47 ---------GSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMST 2230 2240 2250 2260 2270 2230 2240 2250 2260 2270 2280 pF1KE9 TQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARR ..:::.:.: :..: : : .:. .: :.::::::::::::.::..::::::: :: CCDS47 ARDETRDGFYMEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRR 2280 2290 2300 2310 2320 2330 2290 2300 2310 2320 2330 2340 pF1KE9 S-YDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQ . .: . . :: .::: ..: :. . . .:. : :.::: .:.:. CCDS47 QMFDFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVP 2340 2350 2360 2370 2380 2390 2350 2360 2370 2380 pF1KE9 KQGLAQKRPFDGEDGALGQQQYL----TRLRELQSASE-----------------TSLVN .: ..: .. : .... : ..::: : .:: .: : CCDS47 RQRRRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSN 2400 2410 2420 2430 2440 2450 2390 2400 2410 2420 pF1KE9 F---------PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRK : :. : ::: : : :: :: ..:..: .:.:::::: CCDS47 FSSLSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRK 2460 2470 2480 2490 2500 2510 2430 2440 2450 2460 2470 pF1KE9 NVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVIN ::::.:..:..... .::. ..... ... . ..:: : .. .:::: CCDS47 NVEGLDLLFMSHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVIN 2520 2530 2540 2550 2560 2570 2480 2490 2500 2510 2520 2530 pF1KE9 LKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQ--LHEG--RPKQKRHRCRNP :.:::::.:.:::: ::: .::: :: :. :. ...:. : . .::::::::::: CCDS47 LEDGTRLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNP 2580 2590 2600 2610 2620 2630 2540 2550 2560 2570 2580 2590 pF1KE9 NKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSG ::::.:.::::::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.::::: CCDS47 NKLDINTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSG 2640 2650 2660 2670 2680 2690 2600 2610 2620 2630 2640 2650 pF1KE9 FLPESMYERILTGPVVREE-VSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPG :.::::..:.::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. : CCDS47 FVPESMFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAG 2700 2710 2720 2730 2740 2750 2660 2670 2680 2690 2700 pF1KE9 VDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLP .:::.: ::::::::::. :::::.: :: . ::.::: ::..:..: :::::: CCDS47 MDLTSL----QNLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLP 2760 2770 2780 2790 2800 2710 2720 2730 2740 2750 pF1KE9 NLLGMGGLLTKPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSS :..:.::::..: ..: . ..:. : : .: . : ...:: :: .::.. CCDS47 NVFGLGGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAA 2810 2820 2830 2840 2850 2860 2760 2770 2780 2790 2800 pF1KE9 PSASSTAALNTAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS----- ::..... :: : .::::.::.:::.. .::.:.: :::. : .: . CCDS47 DSANGSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGL 2870 2880 2890 2900 2910 2920 2810 2820 2830 2840 2850 2860 pF1KE9 QSNTFDVQNKNSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADAS :. . . ..: .: . . . : : : ... :: : : : :. .: :. :. CCDS47 QNAVGSSEEKAADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSL 2930 2940 2950 2960 2970 2980 2870 2880 pF1KE9 SGSDSTSSSSEDSDSSNED .:.: .. .: CCDS47 DGGDEIENNENDE 2990 >>CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581 aa) initn: 5800 init1: 4537 opt: 5829 Z-score: 3432.1 bits: 649.5 E(32554): 7.6e-185 Smith-Waterman score: 7678; 49.6% identity (69.8% similar) in 2774 aa overlap (1-2685:1-2482) 10 20 30 40 50 60 pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP :.::.::.::: :::: :..:.::.: : . . :.: : .:::. CCDS53 MADPIMDLFDDPNLFG--LDSLTDDSFNQVTQDPIEEALGL-----PSSLDSLD------ 10 20 30 40 70 80 90 100 110 120 pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD :.:: : :. .. : :. : : . CCDS53 ---------QMNQ-D-----------GGGGDVGNSSASE--------------LVPPPEE 50 60 70 130 140 150 160 170 180 pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ .: : .:... .: .. .. ::.. :...: :... CCDS53 TAP-------TELSKESTAPAPES------------ITLHDYTTQPASQEQPAQPVLQTS 80 90 100 110 190 200 210 220 230 pF1KE9 QNRNNL---NPGQNSLSQSKNFMNVSGPHRVNVN---HPPQMTNASNSQQSISMQQFSQT ..: . .:. :::.. ::.::. . . .::: .. . . .. .. CCDS53 TPTSGLLQVSKSQEILSQGNPFMGVSATAVSSSSAGGQPPQ-----SAPKIVILKAPPSS 120 130 140 150 160 240 250 260 270 280 290 pF1KE9 SNPSAHFHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPN-SLLQSSAVL : .:: . .. .: . .: ... . ... :.. .... . :. :......:: CCDS53 SVTGAHVAQIQA--QGITSTAQPLVAGTANGGKVTFTK--VLTGTPLRPGVSIVSGNTVL 170 180 190 200 210 220 300 310 320 330 340 pF1KE9 ASN-HTNQTLSDFTGSNSFSPHRGIKQESTQHIL------NPNTSLNSNNFQILHSSHP- :.. ::. . .: : .:: : . ::... . . .: : CCDS53 AAKVPGNQAAVQ----RIVQPSRPVKQLVLQPVKGSAPAGNPGATGPPLKPAVTLTSTPT 230 240 250 260 270 280 350 360 370 380 390 pF1KE9 QGNYSNSKLSPVHMNFPDPVDSGTQMGHFNDHVETNGFSS---LEENLLHQV----ESQT :: .:: . . . .: ..: : :: :: ... . :. : : . ..: CCDS53 QG---ESKR--ITLVLQQPQSGGPQ-GH--RHVVLGSLPGKIVLQGNQLAALTQAKNAQG 290 300 310 320 330 400 410 420 430 440 450 pF1KE9 EPFTGLDPEDLLQEGLLPHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQS .: . . .:. :. . : ::. .: : :.: ....: CCDS53 QPAKVVTIQLQVQQ---PQQKIQIVPQPPSSQ----PQPQQPPS---TQPVTLSSVQ--- 340 350 360 370 460 470 480 490 500 510 pF1KE9 QARSWHSSFSNHQHLHDRNHLCLQRQPPSSK-KSDGSGTYTKLQNTQVRVMSEK------ ::. . : :.: .. :: : ::. :.: .. :. ..: ..: CCDS53 QAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSAPH 380 390 400 410 420 430 520 530 540 550 560 pF1KE9 -------KQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEE .. ...: ..::::::::..::::.:. :::.:::::.. ...:.. : . : CCDS53 SGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDELPSVRPEEEGE 440 450 460 470 480 490 570 580 590 600 610 pF1KE9 KKGRRMKS---KPKDKDSKKTKTC--SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAE :: :: :: . :.. ::.:: :: : :.:.. . ..:::.:: : :::. ::.: CCDS53 KK-RRKKSAGERLKEEKPKKSKTSGASKTKGKSKLNTITPVVGKKRKR-NTSSDN-SDVE 500 510 520 530 540 550 620 630 640 650 660 670 pF1KE9 QMP-QHTLKDQDS--QKRRSNRQIKRKKYAEDIEGK----QSEEEVKGSMKIKKNSA-PL :: : .:..: ::::::::.:::::.::.. : . :::: . :: . : CCDS53 VMPAQSPREDEESSIQKRRSNRQVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPE 560 570 580 590 600 610 680 690 700 710 720 pF1KE9 PGEQP-------LQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYS : ..: .:.:::::::::::::::.:: : ::::. : . ..::::::::::: CCDS53 PVQEPDGETLPSMQFFVENPSEEDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYS 620 630 640 650 660 670 730 740 750 760 770 780 pF1KE9 YLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFC :::::::: :: :::::.::.:::: ..:: ::: . .:::::::::::::.:. : CCDS53 YLHCEWATISQLEKDKRIHQKLKRFKTKMAQMRHFFHE-DEEPFNPDYVEVDRILDESHS 680 690 700 710 720 730 790 800 810 820 830 840 pF1KE9 EDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNI :::.:::::::::::::::::::::::::::: .::.::...:. .:. . ..:: .. CCDS53 IDKDNGEPVIYYLVKWCSLPYEDSTWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASA 740 750 760 770 780 790 850 860 870 880 890 900 pF1KE9 WKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILL :::.. :..::: ::::::::::.::::::::::.:::::::::::::::::.:: :. CCDS53 WKKLELSHEYKNRNQLREYQLEGVNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYN 800 810 820 830 840 850 910 920 930 940 950 960 pF1KE9 TGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIR .::.::::.:::::::.:::::: :::..:..:::::: ::::::::::: .::.::.: CCDS53 VGIHGPFLVIAPLSTITNWEREFNTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIP 860 870 880 890 900 910 970 980 990 1000 1010 1020 pF1KE9 GAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLL :::.:.:.::::::::. : :: ::::::::::::::::.:::::..:: :.::::::: CCDS53 GAYKFDALITTFEMILSDCPELREIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLL 920 930 940 950 960 970 1030 1040 1050 1060 1070 1080 pF1KE9 TGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKE ::::::::::::::::::::: .::::: :...::::::::::::::::::::::::::: CCDS53 TGTPLQNTVEELFSLLHFLEPSQFPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKE 980 990 1000 1010 1020 1030 1090 1100 1110 1120 1130 1140 pF1KE9 DVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCC ::::.::::.::::::::::::::::::::::::::::::::.::.:::.:::::::::: CCDS53 DVEKNLAPKQETIIEVELTNIQKKYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCC 1040 1050 1060 1070 1080 1090 1150 1160 1170 1180 1190 1200 pF1KE9 NHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIF ::::::.::::::: :::.. . :::::::..::::::::::::::.:::::::::: CCDS53 NHPYLINGAEEKILTEFREACHIIPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIF 1100 1110 1120 1130 1140 1150 1210 1220 1230 1240 1250 1260 pF1KE9 SQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLG :::::::::::::::..::::::::::::::::::::::::::::::::::::::::::: CCDS53 SQMVRCLDILEDYLIQRRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLG 1160 1170 1180 1190 1200 1210 1270 1280 1290 1300 1310 1320 pF1KE9 INLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKL :::::::::::::::::::::::::::::::::.::::::::.:::::::::::.::::: CCDS53 INLTAADTCIIFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKL 1220 1230 1240 1250 1260 1270 1330 1340 1350 1360 1370 1380 pF1KE9 GLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILL :::::::::::::..:. ::::.::::::::::.:::.:::::.:::::::::::::::: CCDS53 GLDKAVLQSMSGRDGNITGIQQFSKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILL 1280 1290 1300 1310 1320 1330 1390 1400 1410 1420 1430 1440 pF1KE9 RRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLV ::: ::::::::.:::::::::::: ::::::::::::::::::::..:.. ....:.:: CCDS53 RRTTTITIESEGKGSTFAKASFVASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLV 1340 1350 1360 1370 1380 1390 1450 1460 1470 1480 1490 1500 pF1KE9 IDTPRIRKQTRPFSATKDE-LAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEKNLL :::::.::::: ::. ::. :.:.:. ::: ::.:. :: :: ..::::.::::::.:: CCDS53 IDTPRVRKQTRHFSTLKDDDLVEFSDLESEDDERPRSRRH-DRHHAYGRTDCFRVEKHLL 1400 1410 1420 1430 1440 1450 1510 1520 1530 1540 1550 1560 pF1KE9 VYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDG ::::::::.:::::::::...:.::: ::::.:.:::.::::::.:::::::::.:.:.: CCDS53 VYGWGRWRDILSHGRFKRRMTERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENG 1460 1470 1480 1490 1500 1510 1570 1580 1590 1600 1610 1620 pF1KE9 QTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHH .:.::::: ::: ::::::::::::.: :.:::.::.:.:::::. :.:::.::::.::. CCDS53 KTKELQNHSGLSIPVPRGRKGKKVKSQ-STFDIHKADWIRKYNPDTLFQDESYKKHLKHQ 1520 1530 1540 1550 1560 1570 1630 1640 1650 1660 1670 1680 pF1KE9 CNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSL ::::::::::::::.:::::.. .::. :. ::.::.: : :. :::. ::: .::::: CCDS53 CNKVLLRVRMLYYLRQEVIGDQAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSL 1580 1590 1600 1610 1620 1630 1690 1700 1710 1720 1730 pF1KE9 LIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRA----NDYMDG-----DVED ::::::::::::::.::::::::::..:.::.::.:::.:. .: ..: : :: CCDS53 LIGVFKHGYEKYNTMRADPALCFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCED 1640 1650 1660 1670 1680 1690 1740 1750 1760 1770 1780 pF1KE9 PEYKPAPAIFKDDIEDDVSSPGDLVIADGDGQLMEGDK---------VYWPTQSALTTRL ::::: . :: .:: ..: :.. : . ....::. ..:: ::::.:: CCDS53 PEYKPLQGPPKD--QDDEGDP--LMMMDEEISVIDGDEAQVTQQPGHLFWPPGSALTARL 1700 1710 1720 1730 1740 1790 1800 1810 1820 1830 1840 pF1KE9 RRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEAD :::.:::::. : .:.. :. .. . . ::... : :. :.::::::::..: CCDS53 RRLVTAYQRSYKREQMK-IE---AAERGDRRRRRCEAAFKLKEIARREKQQRWTRREQTD 1750 1760 1770 1780 1790 1800 1850 1860 1870 1880 1890 1900 pF1KE9 FYRVVSTFGVVFDPDRGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLP--SK :::::::::: .::: :: : .::..::: ::::.:: ::...:..:::.::::: . CCDS53 FYRVVSTFGVEYDPDTMQFHWDRFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAG 1810 1820 1830 1840 1850 1860 1910 1920 1930 1940 1950 1960 pF1KE9 EELVDPNIFIQPITEERASRTLYRIELLRKVREQALRHPQLFERLKLCHP-NPDLPVWWE .: :::.::.::::::::::::::::::..:::.: :: : .:: ::.: .:.:: ::: CCDS53 DEPPDPNLFIEPITEERASRTLYRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWE 1870 1880 1890 1900 1910 1920 1970 1980 1990 2000 2010 pF1KE9 CGPHDRDLLIGAAKHGVSRTDYHILRDPELSFMAAQRNYSQSKMAH------SRTSTPLL :: .:: :::.::::.:: .:..::..::.::. :: :...: :: ::::: CCDS53 PVRHDGELLRGAARHGVSQTDCNIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLL 1930 1940 1950 1960 1970 1980 2020 2030 2040 2050 2060 2070 pF1KE9 QQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSE .: .. .:::: : :: ... :. . . . :.:. :: . CCDS53 HQQYTSRTASPLPLRP---DAP-------------VEKSPEETATQ-VPSLESLTLKLEH 1990 2000 2010 2020 2080 2090 2100 2110 2120 2130 pF1KE9 PVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDS : .. :: . . :. . : ::. . . : :. :. .:::: CCDS53 EVVARSRPTPQ-----------DYEMRVSPSDTTPLV---SRSVPPVKL---EDEDDSDS 2030 2040 2050 2060 2070 2140 2150 2160 2170 2180 2190 pF1KE9 DSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEES . . :. : :::.::::::::::..:: CCDS53 ELDLSKLSP---------------------------------SSSSSSSSSSSSSSTDES 2080 2090 2200 2210 2220 2230 2240 2250 pF1KE9 DSDEEEAQKRAESTTHMKAYDEESVASLSTTQD--ETQDSFQMNNGTPESAYILQGGYML ....:: . . .. : :::::. ::. .:: ..:. :: ::: .:: CCDS53 EDEKEE---KLTDQSRSKLYDEESLLSLTMSQDGFPNEDGEQM---TPE-LLLLQ--ERQ 2100 2110 2120 2130 2140 2260 2270 2280 2290 2300 2310 pF1KE9 AASYWPKDRVMINRLDSICQTVLKGKWPSARRSYDANTVASFYT-TKLLDSPGAAT-EYS :: ::::::.:::.: .::.::.:::::.::: . : . . ..:::::. . ::. CCDS53 RASEWPKDRVLINRIDLVCQAVLSGKWPSSRRSQEMVTGGILGPGNHLLDSPSLTPGEYG 2150 2160 2170 2180 2190 2200 2320 2330 2340 2350 2360 2370 pF1KE9 EPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLR . :::: .... .. .. . .. ..: ..:. .: .. .... CCDS53 DSPVPTPRSSSAASMAEEEASAVSTAAAQFTKLRRGMDEK-------------EFTVQIK 2210 2220 2230 2240 2250 2380 2390 2400 2410 2420 2430 pF1KE9 ELQSASETSLVNFPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFN . .. . : : : : ::::. :..:. .:..: ::.. ... .. CCDS53 DEEGLKLT----FQKH----------KLMANGVMGDGHPLFHKKKGNRKKLVELEVECME 2260 2270 2280 2290 2300 2440 2450 2460 2470 2480 2490 pF1KE9 RNKPPNHVSLGLTSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRK . :::... : :. .:::: ::: :.:.:::.: CCDS53 E---PNHLDV------------------------DLETRIPVINKVDGTLLVGEDAPRRA 2310 2320 2330 2500 2510 2520 2530 2540 2550 pF1KE9 DLEKWLKEHPGYVEDLGAFIPR-MQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINR .:: ::. :: .. : :: . : : ::: .::.. :: ..: : : : :: : CCDS53 ELEMWLQGHPEFAVD-----PRFLAYMEDRRKQKWQRCKKNNKAELNCL-GMEPVQTANS 2340 2350 2360 2370 2380 2560 2570 2580 2590 2600 2610 pF1KE9 RNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREE ::..: : :....:.: ::.. : CCDS53 RNGKK-----------------------------------GHHTETVFNRVLPGPIAPES 2390 2400 2410 2620 2630 2640 2650 2660 2670 pF1KE9 VSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQ ..:.:: . ..: : ..:. :.: . . .. . : ....: .. . :: CCDS53 SKKRARRMRPDLSKMMALMQGGSTGSLSLHNTFQHS---SSGLQSVSSLGHSSATSASLP 2420 2430 2440 2450 2460 2470 2680 2690 2700 2710 2720 2730 pF1KE9 VTAGLMGMPTGLPSGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSD .:: : :: CCDS53 FMPFVMG---GAPSSPHVDSSTMLHHHHHHPHPHHHHHHHPGLRAPGYPSSPVTTASGTT 2480 2490 2500 2510 2520 >>CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302 aa) initn: 5800 init1: 4537 opt: 5816 Z-score: 3425.1 bits: 648.0 E(32554): 1.8e-184 Smith-Waterman score: 7618; 55.4% identity (74.3% similar) in 2307 aa overlap (446-2685:91-2203) 420 430 440 450 460 470 pF1KE9 PHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHD :.: ....: ::. . : :.: CCDS45 IQLQVQQPQQKIQIVPQPPSSQPQPQQPPSTQPVTLSSVQ---QAQIMGPGQSPGQRLSV 70 80 90 100 110 480 490 500 510 520 pF1KE9 RNHLCLQRQPPSSK-KSDGSGTYTKLQNTQVRVMSEK-------------KQRKKVESES .. :: : ::. :.: .. :. ..: ..: .. ...: .. CCDS45 PVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSAPHSGGKTGMEENRRLEHQK 120 130 140 150 160 170 530 540 550 560 570 pF1KE9 KQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEEKKGRRMKS---KPKDKD ::::::::..::::.:. :::.:::::.. ...:.. : . ::: :: :: . :.. CCDS45 KQEKANRIVAEAIARARARGEQNIPRVLNEDELPSVRPEEEGEKK-RRKKSAGERLKEEK 180 190 200 210 220 230 580 590 600 610 620 630 pF1KE9 SKKTKTC--SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAEQMP-QHTLKDQDS--QK ::.:: :: : :.:.. . ..:::.:: : :::. ::.: :: : .:..: :: CCDS45 PKKSKTSGASKTKGKSKLNTITPVVGKKRKR-NTSSDN-SDVEVMPAQSPREDEESSIQK 240 250 260 270 280 290 640 650 660 670 680 pF1KE9 RRSNRQIKRKKYAEDIEGK----QSEEEVKGSMKIKKNSA-PLPGEQP-------LQLFV ::::::.:::::.::.. : . :::: . :: . : : ..: .:.:: CCDS45 RRSNRQVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFV 300 310 320 330 340 350 690 700 710 720 730 740 pF1KE9 ENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKR :::::::::::::.:: : ::::. : . ..::::::::::::::::::: :: :::: CCDS45 ENPSEEDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKR 360 370 380 390 400 410 750 760 770 780 790 800 pF1KE9 IQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWC :.::.:::: ..:: ::: . .:::::::::::::.:. : :::.:::::::::::: CCDS45 IHQKLKRFKTKMAQMRHFFHE-DEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWC 420 430 440 450 460 470 810 820 830 840 850 860 pF1KE9 SLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDYKNGNQLR :::::::::::::::: .::.::...:. .:. . ..:: .. :::.. :..::: :::: CCDS45 SLPYEDSTWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLR 480 490 500 510 520 530 870 880 890 900 910 920 pF1KE9 EYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIA ::::::.::::::::::.:::::::::::::::::.:: :. .::.::::.:::::::. CCDS45 EYQLEGVNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTIT 540 550 560 570 580 590 930 940 950 960 970 980 pF1KE9 NWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILG :::::: :::..:..:::::: ::::::::::: .::.::.: :::.:.:.::::::::. CCDS45 NWEREFNTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILS 600 610 620 630 640 650 990 1000 1010 1020 1030 1040 pF1KE9 GCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLH : :: ::::::::::::::::.:::::..:: :.:::::::::::::::::::::::: CCDS45 DCPELREIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLH 660 670 680 690 700 710 1050 1060 1070 1080 1090 1100 pF1KE9 FLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVE :::: .::::: :...:::::::::::::::::::::::::::::::.::::.::::::: CCDS45 FLEPSQFPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVE 720 730 740 750 760 770 1110 1120 1130 1140 1150 1160 pF1KE9 LTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEF :::::::::::::::::::::::::.::.:::.::::::::::::::::.::::::: :: CCDS45 LTNIQKKYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEF 780 790 800 810 820 830 1170 1180 1190 1200 1210 1220 pF1KE9 RDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHK :.. . :::::::..::::::::::::::.:::::::::::::::::::::::::.. CCDS45 REACHIIPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQR 840 850 860 870 880 890 1230 1240 1250 1260 1270 1280 pF1KE9 RYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 RYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWN 900 910 920 930 940 950 1290 1300 1310 1320 1330 1340 pF1KE9 PQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNV ::::::::::::::::.::::::::.:::::::::::.::::::::::::::::::..:. CCDS45 PQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNI 960 970 980 990 1000 1010 1350 1360 1370 1380 1390 1400 pF1KE9 GGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTF ::::.::::::::::.:::.:::::.::::::::::::::::::: ::::::::.:::: CCDS45 TGIQQFSKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTF 1020 1030 1040 1050 1060 1070 1410 1420 1430 1440 1450 1460 pF1KE9 AKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK :::::::: ::::::::::::::::::::..:.. ....:.:::::::.::::: ::. : CCDS45 AKASFVASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLK 1080 1090 1100 1110 1120 1130 1470 1480 1490 1500 1510 1520 pF1KE9 DE-LAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFK :. :.:.:. ::: ::.:. :: :: ..::::.::::::.::::::::::.:::::::: CCDS45 DDDLVEFSDLESEDDERPRSRRH-DRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFK 1140 1150 1160 1170 1180 1190 1530 1540 1550 1560 1570 1580 pF1KE9 RQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPR :...:.::: ::::.:.:::.::::::.:::::::::.:.:.:.:.::::: ::: :::: CCDS45 RRMTERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPR 1200 1210 1220 1230 1240 1250 1590 1600 1610 1620 1630 1640 pF1KE9 GRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQE ::::::::.: :.:::.::.:.:::::. :.:::.::::.::.::::::::::::::.:: CCDS45 GRKGKKVKSQ-STFDIHKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQE 1260 1270 1280 1290 1300 1310 1650 1660 1670 1680 1690 1700 pF1KE9 VIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRA :::.. .::. :. ::.::.: : :. :::. ::: .:::::::::::::::::::.:: CCDS45 VIGDQAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRA 1320 1330 1340 1350 1360 1370 1710 1720 1730 1740 1750 pF1KE9 DPALCFLERVGKPDEKAVAAEQRA----NDYMDG-----DVEDPEYKPAPAIFKDDIEDD ::::::::..:.::.::.:::.:. .: ..: : ::::::: . :: .:: CCDS45 DPALCFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKD--QDD 1380 1390 1400 1410 1420 1760 1770 1780 1790 1800 pF1KE9 VSSPGDLVIADGDGQLMEGDK---------VYWPTQSALTTRLRRLITAYQRTNKNRQIQ ..: :.. : . ....::. ..:: ::::.:::::.:::::. : .:.. CCDS45 EGDP--LMMMDEEISVIDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMK 1430 1440 1450 1460 1470 1480 1810 1820 1830 1840 1850 1860 pF1KE9 QIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPDRG :. .. . . ::... : :. :.::::::::..::::::::::: .::: CCDS45 -IE---AAERGDRRRRRCEAAFKLKEIARREKQQRWTRREQTDFYRVVSTFGVEYDPDTM 1490 1500 1510 1520 1530 1540 1870 1880 1890 1900 1910 1920 pF1KE9 QFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLP--SKEELVDPNIFIQPITEER :: : .::..::: ::::.:: ::...:..:::.::::: . .: :::.::.:::::: CCDS45 QFHWDRFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEER 1550 1560 1570 1580 1590 1600 1930 1940 1950 1960 1970 pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHP-NPDLPVWWECGPHDRDLLIGAAKHGV ::::::::::::..:::.: :: : .:: ::.: .:.:: ::: :: .:: :::.::: CCDS45 ASRTLYRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGV 1610 1620 1630 1640 1650 1660 1980 1990 2000 2010 2020 2030 pF1KE9 SRTDYHILRDPELSFMAAQRNYSQSKMAH------SRTSTPLLQQYQVALSASPLTSLPR :.:: .:..::..::.::. :: :...: :: :::::.: .. .:::: : CCDS45 SQTDCNIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRP- 1670 1680 1690 1700 1710 1720 2040 2050 2060 2070 2080 2090 pF1KE9 LLDAKGIILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQK :: ... :. . . . :.:. :: . : .. :: CCDS45 --DAP-------------VEKSPEETATQ-VPSLESLTLKLEHEVVARSRPTPQ------ 1730 1740 1750 1760 2100 2110 2120 2130 2140 2150 pF1KE9 SGGKCETDRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSS . . :. . : ::. . . : :. :. .::::. . :. : CCDS45 -----DYEMRVSPSDTTPLV---SRSVPPVKL---EDEDDSDSELDLSKLSP-------- 1770 1780 1790 1800 2160 2170 2180 2190 2200 2210 pF1KE9 SSCSHSRSGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHM :::.::::::::::..::....:: . . .. CCDS45 -------------------------SSSSSSSSSSSSSSTDESEDEKEE---KLTDQSRS 1810 1820 1830 2220 2230 2240 2250 2260 2270 pF1KE9 KAYDEESVASLSTTQD--ETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDS : :::::. ::. .:: ..:. :: ::: .:: :: ::::::.:::.: CCDS45 KLYDEESLLSLTMSQDGFPNEDGEQM---TPE-LLLLQ--ERQRASEWPKDRVLINRIDL 1840 1850 1860 1870 1880 2280 2290 2300 2310 2320 pF1KE9 ICQTVLKGKWPSARRSYDANTVASFYT-TKLLDSPGAAT-EYSEPSVPTPPGAGVKEEHD .::.::.:::::.::: . : . . ..:::::. . ::.. :::: .... . CCDS45 VCQAVLSGKWPSSRRSQEMVTGGILGPGNHLLDSPSLTPGEYGDSPVPTPRSSSAASMAE 1890 1900 1910 1920 1930 1940 2330 2340 2350 2360 2370 2380 pF1KE9 QSTQMSKEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSI . .. . .. ..: ..:. .: .. ..... .. . : : : CCDS45 EEASAVSTAAAQFTKLRRGMDEK-------------EFTVQIKDEEGLKLT----FQKH- 1950 1960 1970 1980 2390 2400 2410 2420 2430 2440 pF1KE9 PVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQI : ::::. :..:. .:..: ::.. ... . . :::... CCDS45 ---------KLMANGVMGDGHPLFHKKKGNRKKLVELEVECM---EEPNHLDV------- 1990 2000 2010 2020 2030 2450 2460 2470 2480 2490 2500 pF1KE9 STGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLG : :. .:::: ::: :.:.:::.: .:: ::. :: .. : CCDS45 -----------------DLETRIPVINKVDGTLLVGEDAPRRAELEMWLQGHPEFAVD-- 2040 2050 2060 2070 2510 2520 2530 2540 2550 2560 pF1KE9 AFIPR-MQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDL :: . : : ::: .::.. :: ..: : : : :: : ::..: CCDS45 ---PRFLAYMEDRRKQKWQRCKKNNKAELNCL-GMEPVQTANSRNGKK------------ 2080 2090 2100 2110 2570 2580 2590 2600 2610 2620 pF1KE9 CRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATA : :....:.: ::.. : ..:.:: . ..: : CCDS45 -----------------------GHHTETVFNRVLPGPIAPESSKKRARRMRPDLSKMMA 2120 2130 2140 2150 2630 2640 2650 2660 2670 2680 pF1KE9 AAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGE ..:. :.: . . .. . : ....: .. . :: .:: : :: CCDS45 LMQGGSTGSLSLHNTFQHS---SSGLQSVSSLGHSSATSASLPFMPFVMG---GAPSSPH 2160 2170 2180 2190 2200 2690 2700 2710 2720 2730 2740 pF1KE9 AKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSE CCDS45 VDSSTMLHHHHHHPHPHHHHHHHPGLRAPGYPSSPVTTASGTTLRLPPLQPEEDDDEDEE 2210 2220 2230 2240 2250 2260 >>CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715 aa) initn: 3873 init1: 2850 opt: 5500 Z-score: 3238.5 bits: 613.7 E(32554): 4.6e-174 Smith-Waterman score: 6721; 46.7% identity (67.0% similar) in 2585 aa overlap (437-2691:9-2513) 410 420 430 440 450 460 pF1KE9 EDLLQEGLLPHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARS---W ..:... : : :...... . .: . CCDS13 MKMKIQKKEKQLSNLKVLNHSPMSDASVNFDYKSPSPF 10 20 30 470 480 490 500 510 pF1KE9 HSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYTKLQNTQVRVMSE-------KKQRKK : .......: :: .. . . ... . . .... . . ::.::: CCDS13 DCSTDQEEKIEDVASHCLPQKDLYTAEEEAATLFPRKMTSHNGMEDSGGGGTGVKKKRKK 40 50 60 70 80 90 520 530 540 550 560 570 pF1KE9 VESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEEKK--GRRMKSKP : . :: : . .. : :.. : . :. . : . : :: :. : . :: CCDS13 KEP-GDQEGAAKGSKDREPKPKRKREPKEPKEPRKAKEPKKAKEHKEPKQKDGAKKARKP 100 110 120 130 140 150 580 590 600 610 620 pF1KE9 KD----KDSKKTKTCSKLKEKTKI-------GKLIITLGKKQKRKNESSDEISDAEQ--- .. :..:. ..:. .:: : . :: :::.:.. : . .: CCDS13 REASGTKEAKEKRSCTDSAARTKSRKASKEQGPTPVEKKKKGKRKSETTVESLELDQGLT 160 170 180 190 200 210 630 640 650 660 670 pF1KE9 -----MPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQ :... .. :::::::.::.::.:: ::.. : ... . . . . . . CCDS13 NPSLRSPEESTESTDSQKRRSGRQVKRRKYNEDLDFKVVDDDGETIAVLGAGRTSALSAS 220 230 240 250 260 270 680 690 700 710 720 730 pF1KE9 PLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVM-IDTEEFFVKYKNYSYLHCEWATEE : .:.: :.:: :..:::.:.::. :. :: .: : :.:::.:.:::::.::: : CCDS13 TLAWQAEEPPEDDANIIEKILASKTVQ-EVHPGEPPFDLELFYVKYRNFSYLHCKWATME 280 290 300 310 320 330 740 750 760 770 780 790 pF1KE9 QLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVI .: :: :: ::::::. .::: :.:.. .:. ::::::::::.:::. .: .::: : CCDS13 ELEKDPRIAQKIKRFRNKQAQMKHIFTEPDEDLFNPDYVEVDRILEVAHTKDAETGEEVT 340 350 360 370 380 390 800 810 820 830 840 850 pF1KE9 YYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDY .:::::::::::.:::::.:::: ::..:::.::. :. . ..:: :. :.:...::.: CCDS13 HYLVKWCSLPYEESTWELEEDVDPAKVKEFESLQVL-PEIKHVERPASDSWQKLEKSREY 400 410 420 430 440 450 860 870 880 890 900 910 pF1KE9 KNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLII ::.::::::::::.::::::::::.:::::::::::::::::::: ::.: ::.:::::: CCDS13 KNSNQLREYQLEGMNWLLFNWYNRKNCILADEMGLGKTIQSITFLSEIFLRGIHGPFLII 460 470 480 490 500 510 920 930 940 950 960 970 pF1KE9 APLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIIT ::::::.::::::::::..:..::::: ::::::::::: .::.:: . :...:...:: CCDS13 APLSTITNWEREFRTWTEMNAIVYHGSQISRQMIQQYEMVYRDAQGNPLSGVFKFHVVIT 520 530 540 550 560 570 980 990 1000 1010 1020 1030 pF1KE9 TFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVE ::::::. : ::. :.: ::::::::::::.::::::::::: ::::::::::::::.:: CCDS13 TFEMILADCPELKKIHWSCVIIDEAHRLKNRNCKLLEGLKLMALEHKVLLTGTPLQNSVE 580 590 600 610 620 630 1040 1050 1060 1070 1080 1090 pF1KE9 ELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKE ::::::.:::: .::::..:..:::::::::::.:::.:::::::::::.::::.::::. CCDS13 ELFSLLNFLEPSQFPSETAFLEEFGDLKTEEQVKKLQSILKPMMLRRLKDDVEKNLAPKQ 640 650 660 670 680 690 1100 1110 1120 1130 1140 1150 pF1KE9 ETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAE :::::::::::::::::::::::::::.:::.: :.:::.::::::::::::::::.::: CCDS13 ETIIEVELTNIQKKYYRAILEKNFSFLTKGANQHNMPNLINTMMELRKCCNHPYLINGAE 700 710 720 730 740 750 1160 1170 1180 1190 1200 1210 pF1KE9 EKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDIL :::: .:: :..: : ::.::::::.:::::::::::::. ::::::::::::::::::: CCDS13 EKILEDFRKTHSPDAPDFQLQAMIQAAGKLVLIDKLLPKLIAGGHKVLIFSQMVRCLDIL 760 770 780 790 800 810 1220 1230 1240 1250 1260 1270 pF1KE9 EDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCI :::::..:: :::::::::::::::::::: ::::::::::::::::::::::::::::: CCDS13 EDYLIQRRYTYERIDGRVRGNLRQAAIDRFCKPDSDRFVFLLCTRAGGLGINLTAADTCI 820 830 840 850 860 870 1280 1290 1300 1310 1320 1330 pF1KE9 IFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSM :::::::::::::::::::::::.::::::::.:::::::::::.:::::::::::::.. CCDS13 IFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQDI 880 890 900 910 920 930 1340 1350 1360 1370 1380 1390 pF1KE9 SGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIES . :.....:.::::: :.:::::.:::::.:.::::::::::::::::: :::.::::.: CCDS13 N-RKGGTNGVQQLSKMEVEDLLRKGAYGALMDEEDEGSKFCEEDIDQILQRRTHTITIQS 940 950 960 970 980 990 1400 1410 1420 1430 1440 1450 pF1KE9 EGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQT ::.::::::::::::::::::::::::::::::: ::.: :: . ..::::: ::.:::: CCDS13 EGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKIAELDTEAKNEKESLVIDRPRVRKQT 1000 1010 1020 1030 1040 1050 1460 1470 1480 1490 1500 1510 pF1KE9 RPFSA-TKDELAELSEAESEGDEKP-KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWRE . ... .::: :.:: .:..::.: . :: :.. : :.::::::::::..:::::.. CCDS13 KHYNSFEEDELMEFSELDSDSDERPTRSRRLNDKARRYLRAECFRVEKNLLIFGWGRWKD 1060 1070 1080 1090 1100 1110 1520 1530 1540 1550 1560 1570 pF1KE9 ILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHL ::.::::: .:::.:.:.::::::.::. ::.::::::.:::.:::::.:::.. :::: CCDS13 ILTHGRFKWHLNEKDMEMICRALLVYCVKHYKGDEKIKSFIWELITPTKDGQAQTLQNHS 1120 1130 1140 1150 1160 1170 1580 1590 1600 1610 1620 1630 pF1KE9 GLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVR ::::::::::::::.:.: ... :.:: ::: .:.:.:::::.:.:::::::::: CCDS13 GLSAPVPRGRKGKKTKNQLLIPELKDADWLATCNPEVVLHDDGYKKHLKQHCNKVLLRVR 1180 1190 1200 1210 1220 1230 1640 1650 1660 1670 1680 1690 pF1KE9 MLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGY :::::: :..:. .:.:.: : ..:: .:. :. :.:..::: .:::::::::::::: CCDS13 MLYYLKAEILGEAAEKAFEGSPARELDVPLPDIDYMEIPVDWWDAEADKSLLIGVFKHGY 1240 1250 1260 1270 1280 1290 1700 1710 1720 1730 1740 1750 pF1KE9 EKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPAPAIFKDDIEDDV :.::..::::::::::.:: ::::...::: ..: : . :: . .:. :: : CCDS13 ERYNAMRADPALCFLEKVGMPDEKSLSAEQGVTD---GTSDIPERGNTDK--EDNAEDKV 1300 1310 1320 1330 1340 1760 1770 1780 1790 pF1KE9 ----------SSPGDLVIA---DGDGQLMEG---DKVYWPTQSALTTRLRRLITAYQRTN :. :: :.. : . ..: :: ::..::::.:::::.:.::: : CCDS13 DGLQKQTESSSDGGDGVFSEKKDDSRAAQDGSDPDKSPWPVSSALTARLRRLVTVYQRCN 1350 1360 1370 1380 1390 1400 1800 1810 1820 1830 1840 1850 pF1KE9 KNRQIQQIQPTFSVPTSVMQPIYEEA---TLNPKMAAKIERQQRWTRREEADFYRVVSTF .. . .: . : . . :: : . . : : :.::::::.:::::.::.: CCDS13 RK---ELCRPEILGPGNQGYWVQEEMFRRTSEMDLINK-EAQKRWTRREQADFYRTVSSF 1410 1420 1430 1440 1450 1460 1860 1870 1880 1890 1900 1910 pF1KE9 GVVFDPDRGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPN--I :::.: .. ::::.:: ..:: ::.:.:::.:.:.:..::: :::::. .. :. : CCDS13 GVVYDQEKKTFDWTQFRIISRLDKKSDESLEQYFYSFVAMCRNVCRLPTWKDGGPPDTTI 1470 1480 1490 1500 1510 1520 1920 1930 1940 1950 1960 1970 pF1KE9 FIQPITEERASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLL ...:::::::.:::::::::::::::.:. ::: :::.::.:. :::::::: :::::: CCDS13 YVEPITEERAARTLYRIELLRKVREQVLKCPQLHERLQLCRPSLYLPVWWECGKHDRDLL 1530 1540 1550 1560 1570 1580 1980 1990 2000 2010 2020 pF1KE9 IGAAKHGVSRTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQV------ALSA ::.::::..::: .:. ::.:::. : :::.: : . ... : ::. .:. CCDS13 IGTAKHGLNRTDCYIMNDPQLSFLDAYRNYAQHKRSGTQAPGNLCCLYQTNSKLYESLTY 1590 1600 1610 1620 1630 1640 2030 2040 pF1KE9 SPLT-----------------------SLP---------RLLDAKGII---------LEE : .. ::: .. :. .: :: CCDS13 SQMSRTSESLENEPENLVRVESRDDHLSLPDVTCENFISKVQDVISINHDESLLPESLES 1650 1660 1670 1680 1690 1700 2050 2060 2070 2080 2090 pF1KE9 MKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVS---------PKNGVL--PQATGDQK : .. :..::.: .: ...:.: . . .: :. . : :. . CCDS13 MMYGKKVLSQEPSSFQESPSTNTESRKDVITISISKDGNCQSGGPEAEIASGPTFMGSLE 1710 1720 1730 1740 1750 1760 2100 2110 2120 2130 pF1KE9 SGGKCETDRR------MVAARTEPLTPNPASKKP----RVHKR---------GSESS--- .:: ... . : .. : . :...: ... . :.::. CCDS13 AGGVAQANIKNGKHLLMSISKEGELCCSEAGQRPENIGQLEAKCLASPSLNPGNESGFVD 1770 1780 1790 1800 1810 1820 2140 2150 pF1KE9 --SDSDSDSERSSCS---------SRSSSSSSSSSCSHS--------------------- : : ::.:. : ..: :. : .:: CCDS13 MCSLSVCDSKRNLSSDQQLIDLLENKSLESKLILSQNHSDEEEEEEENEEENLAMAVGMG 1830 1840 1850 1860 1870 1880 2160 2170 pF1KE9 ---------------------------RSGS--------------SSSSSSSC------- ..:: . .. .: CCDS13 ERPEVLHLTEPTTNISREKNQGFQDETKKGSLEVANQTPGLQRAFPAPAACQCHCKHMER 1890 1900 1910 1920 1930 1940 2180 pF1KE9 ------------------------SSASSSSSSSTSSSSSS------------------- :.... . . .. : CCDS13 WMHGLENDEFEIEKPKAYIPDLFKSKTNTIAMEGEPTAIPSQPFKVKHELLKEPWKESAE 1950 1960 1970 1980 1990 2000 2190 2200 2210 2220 2230 pF1KE9 ------------SSSSSEESDSDEEEAQKRAESTTHMKAY-----DEESVASLSTTQDET : .::. : .... : ... : . : .::: .: : . CCDS13 GQNVFPTYPLEGSELKSEDMDFENKDDYDR-DGNCHSQDYPGKYSEEESKSSTSGITGDI 2010 2020 2030 2040 2050 2060 2240 2250 2260 2270 2280 2290 pF1KE9 QDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRSYDAN : .: . .: : .:: . . : ::::::.:::::.::..::::::::... .. CCDS13 GDELQ-EARAPTIAQLLQEKTLYSFSEWPKDRVIINRLDNICHVVLKGKWPSSQQYEPSG 2070 2080 2090 2100 2110 2120 2300 2310 2320 2330 2340 pF1KE9 TVASFYTTKLLDSPGAATEYSEPSVPTPP---GAGVKEEHDQSTQMSKEGGLKLTFQKQG :. : : .: :. : ::: . ::.. ..:. ::. : .: :. CCDS13 TLP---TPVLTSSAGSRTSLSEPEAAEHSFSNGAAL------AAQIHKESFLAPVFTKDE 2130 2140 2150 2160 2170 2350 2360 2370 2380 pF1KE9 LAQKRPFDGE---DG-ALGQQQYLTR---------------LRELQSASETS---LVNFP ..::.. : :. : : .:. . .:. .:: : :: CCDS13 QKHRRPYEFEVERDAKARGLEQFSATHGHTPIILNGWHGESAMDLSCSSEGSPGATSPFP 2180 2190 2200 2210 2220 2230 2390 2400 2410 2420 pF1KE9 --KSIPVSG--TSIQPTLG-------------------ANGVILDNQPIVKKRRGRRKNV : : : .:.: .:: .:: . .. ...::::::.: CCDS13 VSASTPKIGAISSLQGALGMDLSGILQAGLIHPVTGQIVNGSLRRDDAATRRRRGRRKHV 2240 2250 2260 2270 2280 2290 2430 2440 2450 2460 2470 2480 pF1KE9 EG-VDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGI-PDTESPVPVINLKDGT :: .:..:.... .. :. . . : . .:: :.:.: : : .: :. .. CCDS13 EGGMDLIFLKEQT----LQAGILEVHEDPG-QATLSTTHPEGPGPATSAPEPATA---AS 2300 2310 2320 2330 2340 2490 2500 2510 2520 2530 2540 pF1KE9 RLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLT : . :. :.: ::... : .. .: .. .:::.: ::..:.::::.::. CCDS13 SQAEKSIPS-KSLLDWLRQQADYSLEVPGFGANFS---DKPKQRRPRCKEPGKLDVSSLS 2350 2360 2370 2380 2390 2400 2550 2560 2570 2580 2590 2600 pF1KE9 GEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYER ::::: : .. : :. :::::. ... CCDS13 GEERVPAIPKE----------PGLR-------------------------GFLPENKFNH 2410 2420 2610 2620 2630 2640 2650 pF1KE9 ILTGPVVREE-VSRRGRRPKSGIAKATAAAAAASATSVSG-NPLLANGLLPGVDLTTLQA :. :..:. ::::::.: . :: . .: : :: .::. :::. :.::. :: CCDS13 TLAEPILRDTGPRRRGRRPRSELLKAPSIVA----DSPSGMGPLFMNGLIAGMDLVGLQ- 2430 2440 2450 2460 2470 2480 2660 2670 2680 2690 2700 2710 pF1KE9 LQQNLQNLQSLQVTAGLMGMPTG---LPSGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLL :..:. .. .: ::.:.:.: .:.: :.:. CCDS13 ---NMRNMPGIPLT-GLVGFPAGFATMPTGEEVKSTLSMLPMMLPGMAAVPQMFGVGGLL 2490 2500 2510 2520 2530 2720 2730 2740 2750 2760 2770 pF1KE9 TKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPSASSTAALNTAAAANPL CCDS13 SPPMATTCTSTAPASLSSTTKSGTAVTEKTAEDKPSSHDVKTDTLAEDKPGPGPFSDQSE 2540 2550 2560 2570 2580 2590 >>CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905 aa) initn: 1635 init1: 630 opt: 1602 Z-score: 951.0 bits: 189.9 E(32554): 1.2e-46 Smith-Waterman score: 1770; 37.2% identity (62.6% similar) in 958 aa overlap (715-1563:535-1467) 690 700 710 720 730 740 pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKDKRIQ .::::....:: :: :..: :: :. . . CCDS76 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF 510 520 530 540 550 560 750 760 770 780 pF1KE9 QKIKR-----------F-----KLRQAQ-RAHFFADMEEEPF----NPDYVEVDRVLEVS .. .: : : :. . . ::.:::. . .:... . :.:. : CCDS76 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILNHS 570 580 590 600 610 620 790 800 810 820 830 pF1KE9 FCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL----------QASRP :: :. ..::.:: .:::....:: .:::.. . :.: . .:: CCDS76 V--DKK-GH--VHYLIKWRDLPYDQASWE-SEDVEIQDYDLFKQSYWNHRELMRGEEGRP 630 640 650 660 670 840 850 860 870 pF1KE9 DT-------RCLDRPPSNIWKKIDQSRDYK--------NGNQLREYQLEGLNWLLFNWYN : :.::: . .: . :. .:. :. ::.:::::: :.: . CCDS76 GKKLKKVKLRKLERPPET--PTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQ 680 690 700 710 720 730 880 890 900 910 920 930 pF1KE9 RRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWT-DINV . :::::::::::.:. .::: . : .::::. :::::: ::::::. :. :. : CCDS76 GTDTILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYV 740 750 760 770 780 790 940 950 960 970 980 pF1KE9 VVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGCGELN :.: :. :: .:.. :. :.:. : . : : :....:..:.: . :. CCDS76 VTYVGDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILG 800 810 820 830 840 850 990 1000 1010 1020 1030 1040 pF1KE9 AIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLR .:.: :.:.::::::::.. :... :. ..:.::.:::::::::..:::: ::.:: : : CCDS76 SIDWACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPER 860 870 880 890 900 910 1050 1060 1070 1080 1090 1100 pF1KE9 FPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQK : . :..::.:. :.:..::. .: : :::::: :: :.. : : :..:::. .:: CCDS76 FHNLEGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQK 920 930 940 950 960 970 1110 1120 1130 1140 1150 1160 pF1KE9 KYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNP :::. :: .:: :. .: ..: .:.:..:.:.::::::::. : . :. CCDS76 KYYKYILTRNFEALNARGGGNQV-SLLNVVMDLKKCCNHPYLFPVAAMEAPKMPNGMYDG 980 990 1000 1010 1020 1030 1170 1180 1190 1200 1210 1220 pF1KE9 AASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYER .: .:...:::.:..:.: ..: :::.:::::::.. ::.:::.: :. : ::: CCDS76 SA-------LIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYER 1040 1050 1060 1070 1080 1230 1240 1250 1260 1270 1280 pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ ::: . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.: CCDS76 IDGGITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQ 1090 1100 1110 1120 1130 1140 1290 1300 1310 1320 1330 1340 pF1KE9 AQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQL : .: ::::::: : .::.::: : :... . :. :. : . :.. : :..:. . CCDS76 AFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLG--SKTGS---M 1150 1160 1170 1180 1190 1200 1350 1360 1370 1380 1390 pF1KE9 SKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID-----------QILLRRTKTITIESEG ::.:..:.:. :. . .: .:. .: : . :: :.. : ..: CCDS76 SKQELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTEL 1210 1220 1230 1240 1250 1260 1400 1410 1420 1430 pF1KE9 RG-----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAEIDIEAISG .: :.: :..:. :.. .. . ::..:.: .. . . . CCDS76 QGMNEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLA 1270 1280 1290 1300 1310 1320 1440 1450 1460 1470 1480 pF1KE9 RNSLVIDTPRIRKQTRPFSATK----------DELAELSEAESEGDE-----KPKLRRPC :: . :::::. .... :. .. : : :::: . ::: CCDS76 RN--LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPS 1330 1340 1350 1360 1370 1380 1490 1500 1510 1520 1530 pF1KE9 DRSNGYGRTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRAL .. . . . :: :. : :.. : :. . .. .. . .:. . . : : CCDS76 RKGLRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDL 1390 1400 1410 1420 1430 1440 1540 1550 1560 1570 1580 1590 pF1KE9 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD . .... .. :. : : :: CCDS76 RGKSEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKV 1450 1460 1470 1480 1490 >>CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912 aa) initn: 1635 init1: 630 opt: 1602 Z-score: 951.0 bits: 189.9 E(32554): 1.2e-46 Smith-Waterman score: 1770; 37.2% identity (62.6% similar) in 958 aa overlap (715-1563:542-1474) 690 700 710 720 730 740 pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKDKRIQ .::::....:: :: :..: :: :. . . CCDS85 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF 520 530 540 550 560 570 750 760 770 780 pF1KE9 QKIKR-----------F-----KLRQAQ-RAHFFADMEEEPF----NPDYVEVDRVLEVS .. .: : : :. . . ::.:::. . .:... . :.:. : CCDS85 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILNHS 580 590 600 610 620 630 790 800 810 820 830 pF1KE9 FCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL----------QASRP :: :. ..::.:: .:::....:: .:::.. . :.: . .:: CCDS85 V--DKK-GH--VHYLIKWRDLPYDQASWE-SEDVEIQDYDLFKQSYWNHRELMRGEEGRP 640 650 660 670 680 840 850 860 870 pF1KE9 DT-------RCLDRPPSNIWKKIDQSRDYK--------NGNQLREYQLEGLNWLLFNWYN : :.::: . .: . :. .:. :. ::.:::::: :.: . CCDS85 GKKLKKVKLRKLERPPET--PTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQ 690 700 710 720 730 740 880 890 900 910 920 930 pF1KE9 RRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWT-DINV . :::::::::::.:. .::: . : .::::. :::::: ::::::. :. :. : CCDS85 GTDTILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYV 750 760 770 780 790 800 940 950 960 970 980 pF1KE9 VVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGCGELN :.: :. :: .:.. :. :.:. : . : : :....:..:.: . :. CCDS85 VTYVGDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILG 810 820 830 840 850 860 990 1000 1010 1020 1030 1040 pF1KE9 AIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLR .:.: :.:.::::::::.. :... :. ..:.::.:::::::::..:::: ::.:: : : CCDS85 SIDWACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPER 870 880 890 900 910 920 1050 1060 1070 1080 1090 1100 pF1KE9 FPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQK : . :..::.:. :.:..::. .: : :::::: :: :.. : : :..:::. .:: CCDS85 FHNLEGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQK 930 940 950 960 970 980 1110 1120 1130 1140 1150 1160 pF1KE9 KYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNP :::. :: .:: :. .: ..: .:.:..:.:.::::::::. : . :. CCDS85 KYYKYILTRNFEALNARGGGNQV-SLLNVVMDLKKCCNHPYLFPVAAMEAPKMPNGMYDG 990 1000 1010 1020 1030 1040 1170 1180 1190 1200 1210 1220 pF1KE9 AASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYER .: .:...:::.:..:.: ..: :::.:::::::.. ::.:::.: :. : ::: CCDS85 SA-------LIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYER 1050 1060 1070 1080 1090 1230 1240 1250 1260 1270 1280 pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ ::: . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.: CCDS85 IDGGITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQ 1100 1110 1120 1130 1140 1150 1290 1300 1310 1320 1330 1340 pF1KE9 AQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQL : .: ::::::: : .::.::: : :... . :. :. : . :.. : :..:. . CCDS85 AFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLG--SKTGS---M 1160 1170 1180 1190 1200 1210 1350 1360 1370 1380 1390 pF1KE9 SKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID-----------QILLRRTKTITIESEG ::.:..:.:. :. . .: .:. .: : . :: :.. : ..: CCDS85 SKQELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTEL 1220 1230 1240 1250 1260 1270 1400 1410 1420 1430 pF1KE9 RG-----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAEIDIEAISG .: :.: :..:. :.. .. . ::..:.: .. . . . CCDS85 QGMNEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLA 1280 1290 1300 1310 1320 1330 1440 1450 1460 1470 1480 pF1KE9 RNSLVIDTPRIRKQTRPFSATK----------DELAELSEAESEGDE-----KPKLRRPC :: . :::::. .... :. .. : : :::: . ::: CCDS85 RN--LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPS 1340 1350 1360 1370 1380 1490 1500 1510 1520 1530 pF1KE9 DRSNGYGRTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRAL .. . . . :: :. : :.. : :. . .. .. . .:. . . : : CCDS85 RKGLRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDL 1390 1400 1410 1420 1430 1440 1540 1550 1560 1570 1580 1590 pF1KE9 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD . .... .. :. : : :: CCDS85 RGKSEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKV 1450 1460 1470 1480 1490 1500 >>CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954 aa) initn: 1550 init1: 609 opt: 1577 Z-score: 936.2 bits: 187.2 E(32554): 8e-46 Smith-Waterman score: 1716; 41.9% identity (68.6% similar) in 725 aa overlap (711-1371:506-1207) 690 700 710 720 730 pF1KE9 VENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKD : .:::::. . :: :: :. : :: : CCDS57 RWTEPPAPFMVGLPGPDVEPSLPPPKPLEGIPEREFFVKWAGLSYWHCSWVKELQLELYH 480 490 500 510 520 530 740 750 760 770 pF1KE9 KRIQQKIKR---------FKL----------RQAQRAHFFADMEEEPF----NPDYVEVD . .. .: : .. .. ..: :::. . .:... . CCDS57 TVMYRNYQRKNDMDEPPPFDYGSGDEDGKSEKRKNKDPLYAKMEERFYRYGIKPEWMMIH 540 550 560 570 580 590 780 790 800 810 820 pF1KE9 RVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL--------- :.:. :: :: :. ..::.:: .:::.. :::. .:.:. ....: CCDS57 RILNHSF--DKK-GD--VHYLIKWKDLPYDQCTWEI-DDIDIPYYDNLKQAYWGHRELML 600 610 620 630 640 830 840 850 860 pF1KE9 -QASRPDTRCL-----------DRPPS----NIWKKIDQSRDY--KNGNQLREYQLEGLN . .: : : ..::. . :.:.. : ..:. :. ::::::: CCDS57 GEDTRLPKRLLKKGKKLRDDKQEKPPDTPIVDPTVKFDKQPWYIDSTGGTLHPYQLEGLN 650 660 670 680 690 700 870 880 890 900 910 920 pF1KE9 WLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFR :: :.: . . :::::::::::.:.:.::: . : .::.:. :::::: ::::::. CCDS57 WLRFSWAQGTDTILADEMGLGKTVQTIVFLYSLYKEGHSKGPYLVSAPLSTIINWEREFE 710 720 730 740 750 760 930 940 950 960 970 pF1KE9 TWT-DINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMI :. :. ::.: :. ::..:.. :. :.:. : . ..: :....:..:.: CCDS57 MWAPDFYVVTYTGDKESRSVIRENEFSFEDNAIRSGKKVFRMKKEVQIKFHVLLTSYELI 770 780 790 800 810 820 980 990 1000 1010 1020 1030 pF1KE9 LGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSL . :..::: :...::::::::.. :... :. .....:.:::::::::..:::: : CCDS57 TIDQAILGSIEWACLVVDEAHRLKNNQSKFFRVLNSYKIDYKLLLTGTPLQNNLEELFHL 830 840 850 860 870 880 1040 1050 1060 1070 1080 1090 pF1KE9 LHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIE :.:: : :: . :..::.:.. :.:..::. .: : :::::: :: :.. : : :.. CCDS57 LNFLTPERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVR 890 900 910 920 930 940 1100 1110 1120 1130 1140 1150 pF1KE9 VELTNIQKKYYRAILEKNFSFL-SKGAGQTNVPNLVNTMMELRKCCNHPYL--IKGAEEK :::...:::::. :: .:: : :::.: : .:.: ::.:.:::::::: . ..: CCDS57 VELSQMQKKYYKFILTRNFEALNSKGGG--NQVSLLNIMMDLKKCCNHPYLFPVAAVEAP 950 960 970 980 990 1000 1160 1170 1180 1190 1200 1210 pF1KE9 ILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILED .: : .: . .....:.:::.:..:.: :.. ::.:::::::.. ::.::: CCDS57 VL--------PNGS-YDGSSLVKSSGKLMLLQKMLKKLRDEGHRVLIFSQMTKMLDLLED 1010 1020 1030 1040 1050 1220 1230 1240 1250 1260 1270 pF1KE9 YLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIF .: .. : :::::: . :.::: :::::. : ...: ::: ::::::::::..::: ::. CCDS57 FLEYEGYKYERIDGGITGGLRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIY 1060 1070 1080 1090 1100 1110 1280 1290 1300 1310 1320 1330 pF1KE9 DSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSG ::::::.::.:: .: ::::::: : .::.::: : :... . :. :. : . :.. : CCDS57 DSDWNPHNDIQAFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRPGLG 1120 1130 1140 1150 1160 1170 1340 1350 1360 1370 1380 1390 pF1KE9 RESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEG .:. ...:.:..:.:. :. ..... :: CCDS57 SKSG-----SMTKQELDDILKFGTE-ELFKDDVEGMMSQGQRPVTPIPDVQSSKGGNLAA 1180 1190 1200 1210 1220 1230 1400 1410 1420 1430 1440 1450 pF1KE9 RGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRP CCDS57 SAKKKHGSTPPGDNKDVEDSSVIHYDDAAISKLLDRNQDATDDTELQNMNEYLSSFKVAQ 1240 1250 1260 1270 1280 1290 >>CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966 aa) initn: 1557 init1: 604 opt: 1577 Z-score: 936.1 bits: 187.2 E(32554): 8e-46 Smith-Waterman score: 1744; 37.1% identity (62.7% similar) in 993 aa overlap (715-1601:549-1512) 690 700 710 720 730 pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-----LKD :::::. . :: :: :: : :: . CCDS32 EPPVAVPAPQQADGNPDVPPPRPLQGRSEREFFVKWVGLSYWHCSWAKELQLEIFHLVMY 520 530 540 550 560 570 740 750 760 770 pF1KE9 KRIQQKIK----------------RFKLRQAQRAHFFADMEEEPF----NPDYVEVDRVL . :.: . :... :. :.:::. . .:... : :.. CCDS32 RNYQRKNDMDEPPPLDYGSGEDDGKSDKRKVKDPHY-AEMEEKYYRFGIKPEWMTVHRII 580 590 600 610 620 630 780 790 800 810 820 830 pF1KE9 EVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQ--------LQASR . : :: :. .::::: .:::..:::: ...... . :: .: ... CCDS32 NHSV--DKK-GN--YHYLVKWRDLPYDQSTWE-EDEMNIPEYEEHKQSYWRHRELIMGED 640 650 660 670 680 690 840 850 860 870 pF1KE9 P--------DTRCL--DRPPSNIWKKIDQSRDYKN--------GNQLREYQLEGLNWLLF : . : : :::. : . :.. :. :. ::::::::: : CCDS32 PAQPRKYKKKKKELQGDGPPSS--PTNDPTVKYETQPRFITATGGTLHMYQLEGLNWLRF 700 710 720 730 740 880 890 900 910 920 930 pF1KE9 NWYNRRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWTD .: . . :::::::::::::.:.::: . : .::::. :::::: ::::::. :. CCDS32 SWAQGTDTILADEMGLGKTIQTIVFLYSLYKEGHTKGPFLVSAPLSTIINWEREFQMWAP 750 760 770 780 790 800 940 950 960 970 980 pF1KE9 -INVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGC . ::.: :. :: .:.. :. :.:. . . :.. :....:..:.: CCDS32 KFYVVTYTGDKDSRAIIRENEFSFEDNAIKGGKKAFKMKREAQVKFHVLLTSYELITIDQ 810 820 830 840 850 860 990 1000 1010 1020 1030 1040 pF1KE9 GELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFL . :..:.: :...::::::::.. :... :. ....::.:::::::::..:::: ::.:: CCDS32 AALGSIRWACLVVDEAHRLKNNQSKFFRVLNGYKIDHKLLLTGTPLQNNLEELFHLLNFL 870 880 890 900 910 920 1050 1060 1070 1080 1090 1100 pF1KE9 EPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELT : :: . :..::.:.. :.:..::. .: : :::::: :: :.. : : :..:::. CCDS32 TPERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVRVELS 930 940 950 960 970 980 1110 1120 1130 1140 1150 1160 pF1KE9 NIQKKYYRAILEKNFSFL-SKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFR .:::::. :: .:: : :.:.: : .:.: ::.:.::::::::. .. .. CCDS32 PMQKKYYKYILTRNFEALNSRGGG--NQVSLLNIMMDLKKCCNHPYLFP------VAAME 990 1000 1010 1020 1030 1040 1170 1180 1190 1200 1210 1220 pF1KE9 DTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKR . :... .. :.:.:.:::.:..:.: :.: ::.:::::::.. ::.:::.: .. CCDS32 SPKLPSGA-YEGGALIKSSGKLMLLQKMLRKLKEQGHRVLIFSQMTKMLDLLEDFLDYEG 1050 1060 1070 1080 1090 1100 1230 1240 1250 1260 1270 1280 pF1KE9 YLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNP : :::::: . : ::: :::::. : ...: ::: ::::::::::..::: ::::::::: CCDS32 YKYERIDGGITGALRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIFDSDWNP 1110 1120 1130 1140 1150 1160 1290 1300 1310 1320 1330 1340 pF1KE9 QNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVG .::.:: .: ::::: . : .::.::: : :... . :. :. : . :.. : :..: CCDS32 HNDIQAFSRAHRIGQANKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRP--GLGSKAG 1170 1180 1190 1200 1210 1350 1360 1370 1380 1390 pF1KE9 GIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQI---------LLRRTKTITIE . .::.:..:.:. :. ....:.:: . ::: . : :: :.. : . CCDS32 S---MSKQELDDILKFGTE-ELFKDENEGEN-KEEDSSVIHYDNEAIARLLDRNQDATED 1220 1230 1240 1250 1260 1270 1400 1410 1420 1430 pF1KE9 SEGRG-----STFAKASFVASGN-------RTDISLD---DPNFWQKWAKKAEIDIEAIS .. .. :.: :..:. . : :. . ::..:.: .. . . CCDS32 TDVQNMNEYLSSFKVAQYVVREEDKIEEIEREIIKQEENVDPDYWEKLLRHHYEQQQEDL 1280 1290 1300 1310 1320 1330 1440 1450 1460 1470 1480 1490 pF1KE9 GRNSLVIDTPRIRKQTRPFSATK---DELAELS---EAESEG-DEKPKLRRPCDRSNGYG .:: . :.:::. .:.. :. .: : : :.: ::.:. :: :. CCDS32 ARN--LGKGKRVRKQVNYNDAAQEDQDNQSEYSVGSEEEDEDFDERPEGRRQSKRQLRNE 1340 1350 1360 1370 1380 1390 1500 1510 1520 1530 1540 pF1KE9 RTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRALLAYCLVH . . . :: :. : :.. : :. . .. .. . .:. . . : : . . CCDS32 KDKPLPPLLARVGGNIEVLGFNTRQRKAFLNAVMRWGMPPQDAFTTQWLVRDLRGKTEKE 1400 1410 1420 1430 1440 1450 1550 1560 1570 1580 1590 pF1KE9 YRGDEKIKGFIWDLITPTEDGQTRELQN--HLGLSAPVPRGRKG--KKVKTQTSSFDIQK ... .. :. : : ::. .. . ::: : : . :: ... :. . CCDS32 FKA--YVSLFMRHLCEPGADGSETFADGVPREGLSRQQVLTRIGVMSLVKKKVQEFEHIN 1460 1470 1480 1490 1500 1600 1610 1620 1630 1640 1650 pF1KE9 AEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDI ..: CCDS32 GRWSMPELMPDPSADSKRSSRASSPTKTSPTTPEASATNSPCTSKPATPAPSEKGEGIRT 1510 1520 1530 1540 1550 1560 2882 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:28:07 2016 done: Mon Nov 7 19:28:08 2016 Total Scan time: 7.170 Total Display time: 2.770 Function used was FASTA [36.3.4 Apr, 2011]