FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9679, 2882 aa
1>>>pF1KE9679 2882 - 2882 aa - 2882 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.7413+/-0.00127; mu= 1.9412+/- 0.077
mean_var=289.8177+/-59.613, 0's: 0 Z-trim(109.0): 99 B-trim: 0 in 0/54
Lambda= 0.075338
statistics sampled from 10467 (10557) to 10467 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.636), E-opt: 0.2 (0.324), width: 16
Scan time: 7.170
The best scores are: opt bits E(32554)
CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881) 19135 2095.7 0
CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897) 15597 1711.2 0
CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997) 6649 738.6 1.3e-211
CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581) 5829 649.5 7.6e-185
CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302) 5816 648.0 1.8e-184
CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715) 5500 613.7 4.6e-174
CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905) 1602 189.9 1.2e-46
CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912) 1602 189.9 1.2e-46
CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954) 1577 187.2 8e-46
CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966) 1577 187.2 8e-46
CCDS32554.1 CHD3 gene_id:1107|Hs108|chr17 (2000) 1577 187.2 8.1e-46
CCDS32553.2 CHD3 gene_id:1107|Hs108|chr17 (2059) 1577 187.2 8.3e-46
CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054) 1152 140.9 3.9e-32
CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070) 1152 140.9 3.9e-32
CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 1014 126.0 1.8e-27
CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 1014 126.0 1.8e-27
CCDS83299.1 CHD7 gene_id:55636|Hs108|chr8 ( 948) 988 123.0 8.3e-27
CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 989 123.3 1.2e-26
CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 989 123.3 1.2e-26
CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 989 123.3 1.2e-26
CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 989 123.3 1.2e-26
CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 985 122.8 1.6e-26
CCDS83338.1 SMARCA2 gene_id:6595|Hs108|chr9 (1514) 779 100.4 8.4e-20
CCDS34204.1 CHD1 gene_id:1105|Hs108|chr5 (1710) 770 99.5 1.8e-19
CCDS7229.1 ERCC6 gene_id:2074|Hs108|chr10 (1493) 722 94.2 6.1e-18
CCDS10374.2 CHD2 gene_id:1106|Hs108|chr15 (1828) 705 92.4 2.6e-17
CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 677 89.2 1.4e-16
CCDS76018.1 SMARCA1 gene_id:6594|Hs108|chrX (1058) 654 86.7 7.7e-16
CCDS73164.1 HELLS gene_id:3070|Hs108|chr10 ( 700) 591 79.8 6.3e-14
CCDS73165.1 HELLS gene_id:3070|Hs108|chr10 ( 714) 591 79.8 6.4e-14
CCDS73163.1 HELLS gene_id:3070|Hs108|chr10 ( 740) 591 79.8 6.6e-14
CCDS7434.1 HELLS gene_id:3070|Hs108|chr10 ( 838) 591 79.8 7.3e-14
CCDS73162.1 HELLS gene_id:3070|Hs108|chr10 ( 884) 591 79.8 7.7e-14
CCDS58022.1 CHD1L gene_id:9557|Hs108|chr1 ( 616) 564 76.8 4.4e-13
CCDS58021.1 CHD1L gene_id:9557|Hs108|chr1 ( 693) 564 76.8 4.8e-13
CCDS72882.1 CHD1L gene_id:9557|Hs108|chr1 ( 797) 564 76.9 5.4e-13
CCDS927.1 CHD1L gene_id:9557|Hs108|chr1 ( 897) 564 76.9 5.9e-13
CCDS532.1 RAD54L gene_id:8438|Hs108|chr1 ( 747) 527 72.8 8.3e-12
CCDS10071.1 INO80 gene_id:54617|Hs108|chr15 (1556) 515 71.7 3.7e-11
CCDS10689.2 SRCAP gene_id:10847|Hs108|chr16 (3230) 511 71.5 9.1e-11
>>CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881 aa)
initn: 14767 init1: 14767 opt: 19135 Z-score: 11247.4 bits: 2095.7 E(32554): 0
Smith-Waterman score: 19135; 99.9% identity (99.9% similar) in 2882 aa overlap (1-2882:1-2881)
10 20 30 40 50 60
pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::
CCDS45 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRRLDRP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE9 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE9 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE9 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE9 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE9 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE9 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE9 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE9 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE9 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE9 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE9 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE9 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE9 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE9 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE9 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE9 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEES
:::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::
CCDS45 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKR-ESTTHMKAYDEES
2170 2180 2190 2200 2210
2230 2240 2250 2260 2270 2280
pF1KE9 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK
2220 2230 2240 2250 2260 2270
2290 2300 2310 2320 2330 2340
pF1KE9 WPSARRSYDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSKEGGL
::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::
CCDS45 WPSARRSYDANTVASFYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKEGGL
2280 2290 2300 2310 2320 2330
2350 2360 2370 2380 2390 2400
pF1KE9 KLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSIPVSGTSIQPTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 KLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSIPVSGTSIQPTL
2340 2350 2360 2370 2380 2390
2410 2420 2430 2440 2450 2460
pF1KE9 GANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYT
2400 2410 2420 2430 2440 2450
2470 2480 2490 2500 2510 2520
pF1KE9 QPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 QPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEG
2460 2470 2480 2490 2500 2510
2530 2540 2550 2560 2570 2580
pF1KE9 RPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGV
2520 2530 2540 2550 2560 2570
2590 2600 2610 2620 2630 2640
pF1KE9 APEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATAAAAAASATSVSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 APEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATAAAAAASATSVSG
2580 2590 2600 2610 2620 2630
2650 2660 2670 2680 2690 2700
pF1KE9 NPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGEAKNMAAMFPMLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGEAKNMAAMFPMLL
2640 2650 2660 2670 2680 2690
2710 2720 2730 2740 2750 2760
pF1KE9 SGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPS
2700 2710 2720 2730 2740 2750
2770 2780 2790 2800 2810 2820
pF1KE9 ASSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTLSQSNTFDVQNKNSDLG
.:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 TSSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTLSQSNTFDVQNKNSDLG
2760 2770 2780 2790 2800 2810
2830 2840 2850 2860 2870 2880
pF1KE9 SSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSSEDSDSSN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 SSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASSGSDSTSSSSEDSDSSN
2820 2830 2840 2850 2860 2870
pF1KE9 ED
::
CCDS45 ED
2880
>>CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897 aa)
initn: 14767 init1: 14767 opt: 15597 Z-score: 9169.1 bits: 1711.2 E(32554): 0
Smith-Waterman score: 19093; 99.3% identity (99.4% similar) in 2898 aa overlap (1-2882:1-2897)
10 20 30 40 50 60
pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 QNRNNLNPGQNSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 FHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPNSLLQSSAVLASNHTNQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 TLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNYSNSKLSPVHMN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 FPDPVDSGTQMGHFNDHVETNGFSSLEENLLHQVESQTEPFTGLDPEDLLQEGLLPHFDE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 STFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLC
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LQRQPPSSKKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKER
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GERNIPRVMSPENFPTASVEGKEEKKGRRMKSKPKDKDSKKTKTCSKLKEKTKIGKLIIT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LGKKQKRKNESSDEISDAEQMPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 SMKIKKNSAPLPGEQPLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 KNYSYLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::
CCDS76 VSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRRLDRP
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 PSNIWKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLY
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 EILLTGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQG
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RIIRGAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEH
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 KVLLTGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RLKEDVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMEL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RKCCNHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHK
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE9 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VLIFSQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRA
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE9 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GGLGINLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRA
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE9 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 SLKLGLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE9 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 QILLRRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGR
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE9 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 NSLVIDTPRIRKQTRPFSATKDELAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEK
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE9 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 NLLVYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPT
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE9 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 EDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHI
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE9 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 KHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDAD
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE9 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 KSLLIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPA
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE9 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 PAIFKDDIEDDVSSPGDLVIADGDGQLMEGDKVYWPTQSALTTRLRRLITAYQRTNKNRQ
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE9 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 IQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPD
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE9 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNIFIQPITEER
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVS
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE9 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGI
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE9 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCET
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE9 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 DRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSR
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE9 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEES
:::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::
CCDS76 SGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKR-ESTTHMKAYDEES
2170 2180 2190 2200 2210
2230 2240 2250 2260 2270 2280
pF1KE9 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VASLSTTQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGK
2220 2230 2240 2250 2260 2270
2290 2300 2310 2320 2330
pF1KE9 WPSARRSYDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSK----
::::::::::::::::::::::::::::::::.:::::::::::::::::::::::
CCDS76 WPSARRSYDANTVASFYTTKLLDSPGAATEYSDPSVPTPPGAGVKEEHDQSTQMSKVKKH
2280 2290 2300 2310 2320 2330
2340 2350 2360 2370 2380
pF1KE9 ------------EGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVN
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VREKEFTVKIKDEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVN
2340 2350 2360 2370 2380 2390
2390 2400 2410 2420 2430 2440
pF1KE9 FPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 FPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGL
2400 2410 2420 2430 2440 2450
2450 2460 2470 2480 2490 2500
pF1KE9 TSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 TSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGY
2460 2470 2480 2490 2500 2510
2510 2520 2530 2540 2550 2560
pF1KE9 VEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPP
2520 2530 2540 2550 2560 2570
2570 2580 2590 2600 2610 2620
pF1KE9 LKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIA
2580 2590 2600 2610 2620 2630
2630 2640 2650 2660 2670 2680
pF1KE9 KATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 KATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLP
2640 2650 2660 2670 2680 2690
2690 2700 2710 2720 2730 2740
pF1KE9 SGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 SGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTES
2700 2710 2720 2730 2740 2750
2750 2760 2770 2780 2790 2800
pF1KE9 QSSENGGENSVSSSPSASSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTL
::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::
CCDS76 QSSENGGENSVSSSPSTSSTAALNTAAAANPLALNPLLLSNILYPGMLLTPGLNLHIPTL
2760 2770 2780 2790 2800 2810
2810 2820 2830 2840 2850 2860
pF1KE9 SQSNTFDVQNKNSDLGSSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 SQSNTFDVQNKNSDLGSSKSVEVKEEDSRIKDQEDKGGTEPSPLNENSTDEGSEKADASS
2820 2830 2840 2850 2860 2870
2870 2880
pF1KE9 GSDSTSSSSEDSDSSNED
::::::::::::::::::
CCDS76 GSDSTSSSSEDSDSSNED
2880 2890
>>CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997 aa)
initn: 7465 init1: 3895 opt: 6649 Z-score: 3912.8 bits: 738.6 E(32554): 1.3e-211
Smith-Waterman score: 8818; 50.0% identity (71.2% similar) in 3042 aa overlap (78-2875:79-2996)
50 60 70 80 90 100
pF1KE9 LHIDSLNHVQGTPTHQKMTDFEQLNQFDSIKFHHVNQS----FGSPAEHVLSPHSQFNCS
:.: ..: ..:.. . :::::..
CCDS47 SLQPSLHHPSTNQNQTKLTHFDHYNQYEQQKMHLMDQPNRMMSNTPGNGLASPHSQYHTP
50 60 70 80 90 100
110 120 130 140
pF1KE9 PIHPQ-------NQPNGLFPDVS---------DGSPMWGHQTATTISNQNGSPFHQQ---
:. :: . :..: .. :.: ::: . :. . .: .:..::
CCDS47 PV-PQVPHGGSGGGQMGVYPGMQNERHGQSFVDSSSMWGPR-AVQVPDQIRAPYQQQQPQ
110 120 130 140 150 160
150 160 170 180 190
pF1KE9 --------------GHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQQNRNNLNPGQ
:: . :.: :..:. ::.. .:. : :: .... ::
CCDS47 PQPPQPAPSGPPAQGHPQHMQQMGSYMARGDFSM----QQHGQ-----PQQRMSQFSQGQ
170 180 190 200 210
200 210 220 230 240
pF1KE9 NSLSQSKNFMNVSGPHRVNVNHPPQMTNASNSQQSISMQQFSQTSNPSAHFHKCS-SH--
..:.:.. :. .::: ...: ::.. . . :.::: . .::. .: : .:
CCDS47 EGLNQGNPFIATSGPG--HLSHVPQQSPSMAPSLRHSVQQFHH--HPSTALHGESVAHSP
220 230 240 250 260 270
250 260 270 280 290
pF1KE9 -------QEG-------NFNGPSPNMTSCSVSNSQQFSSH-YSFSSNHISPNSLLQSSAV
:.: ::.. : .. : ...:: :.: . :: .. . :. ....
CCDS47 RFSPNPPQQGAVRPQTLNFSSRSQTVPSPTINNSGQYSRYPYSNLNQGLVNNTGMNQNLG
280 290 300 310 320 330
300 310 320 330 340 350
pF1KE9 LASNHT-NQTLSDFTGSNSFSPHRGIKQESTQHILNPNTSLNSNNFQILHSSHPQGNY-S
:..: ::.. . .. .: . : . :. ..:. :::. : : .: :.:::.: :
CCDS47 LTNNTPMNQSVPRYPNAVGFPSNSG-QGLMHQQPIHPSGSLNQMNTQTMHPSQPQGTYAS
340 350 360 370 380 390
360 370 380 390
pF1KE9 NSKLSPVH-MNFPD--------------PVDSGT--QMGHFNDHVETNGFSSL-EENLLH
.::.. :. : :.. :. .: : . . : .. ..:.
CCDS47 PPPMSPMKAMSNPAGTPPPQVRPGSAGIPMEVGSYPNMPHPQPSHQPPGAMGIGQRNMGP
400 410 420 430 440 450
400 410 420 430
pF1KE9 QVESQTEPFTGLD--PEDL-------------------LQEGLLPHFDESTFGQDNSSHI
. .:..:: :.. :..: .:: :.: .. ::. : .
CCDS47 RNMQQSRPFIGMSSAPRELTGHMRPNGCPGVGLGDPQAIQERLIP--GQQHPGQQPSFQQ
460 470 480 490 500 510
440 450 460 470 480
pF1KE9 LDHDLDRQF---TSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHDRNHLCLQRQPPSS
: : : . : : : . .. . : :. .. :.. :.
CCDS47 LPTCPPLQPHPGLHHQSSPPHPHHQPWAQLHPSPQNTPQKVPVHQHSPSEPFLEKPVPDM
520 530 540 550 560 570
490 500 510 520 530 540
pF1KE9 KKSDGSGTYTKLQNTQVRVMSEKKQRKKVESESKQEKANRIISEAIAKAKERGERNIPRV
. .: .. .. . . .. :.:: :..: :.:..: .:. :. ..:
CCDS47 TQVSGPNAQLVKSDDYLPSIEQQPQQKK-----KKKKNNHIVAEDPSKG--FGKDDFPGG
580 590 600 610 620
550 560 570 580
pF1KE9 MSPENFPTASVEGKEEKKGRRMKSK----------------------------PKDKDSK
.. ... :..:..:.: .. .:: ::. :
CCDS47 VDNQELNRNSLDGSQEEKKKKKRSKAKKDPKEPKEPKEKKEPKEPKTPKAPKIPKEPKEK
630 640 650 660 670 680
590 600 610 620 630
pF1KE9 KTKTC------SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAEQMPQHT---LKDQDS
:.:: :: . . : . .: :: .. . ..: :: .. : . .:.:
CCDS47 KAKTATPKPKSSKKSSNKKPDSEASALKKKVNKGKTEGSENSDLDKTPPPSPPPEEDEDP
690 700 710 720 730 740
640 650 660 670 680
pF1KE9 --QKRRSNRQIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQPLQLFVENPSEEDA
:::::.::.:::.:.::.: : :.::. . ..: : : : .. . ..
CCDS47 GVQKRRSSRQVKRKRYTEDLEFKISDEEADDADAAGRDS-PSNTSQSEQ---QESVDAEG
750 760 770 780 790
690 700 710 720 730 740
pF1KE9 AIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKRIQQKIKRF
.:.::.:::.:::. : .. :::.:::::.:::::.::. :.: ::::::::::::
CCDS47 PVVEKIMSSRSVKKQKESGEEVEIEEFYVKYKNFSYLHCQWASIEDLEKDKRIQQKIKRF
800 810 820 830 840 850
750 760 770 780 790 800
pF1KE9 KLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDST
: .:.: .:....:.: ::::::::::... . : : :::: .::::::::::::::
CCDS47 KAKQGQN-KFLSEIEDELFNPDYVEVDRIMDFARSTD-DRGEPVTHYLVKWCSLPYEDST
860 870 880 890 900 910
810 820 830 840 850 860
pF1KE9 WELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDYKNGNQLREYQLEGLN
:: ..:.: :::::::.:.. .:.:. ..:::.. ::: ..::.:::.:.::::::::.:
CCDS47 WERRQDIDQAKIEEFEKLMSREPETERVERPPADDWKKSESSREYKNNNKLREYQLEGVN
920 930 940 950 960 970
870 880 890 900 910 920
pF1KE9 WLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIANWEREFRT
:::::::: :::::::::::::::::::::::: : ::.::::.::::::: ::::::::
CCDS47 WLLFNWYNMRNCILADEMGLGKTIQSITFLYEIYLKGIHGPFLVIAPLSTIPNWEREFRT
980 990 1000 1010 1020 1030
930 940 950 960 970 980
pF1KE9 WTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILGGCGELNAI
::..:::::::: ::. :: :::::.: :::.:.:.:.:.:::::::::: : :: :
CCDS47 WTELNVVVYHGSQASRRTIQLYEMYFKDPQGRVIKGSYKFHAIITTFEMILTDCPELRNI
1040 1050 1060 1070 1080 1090
990 1000 1010 1020 1030 1040
pF1KE9 EWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLRFP
::::.:::::::::.:::::::::.:.:::::::::::::::::::::::::::: :::
CCDS47 PWRCVVIDEAHRLKNRNCKLLEGLKMMDLEHKVLLTGTPLQNTVEELFSLLHFLEPSRFP
1100 1110 1120 1130 1140 1150
1050 1060 1070 1080 1090 1100
pF1KE9 SESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQKKY
::.::::::::::::::::::::::::::::::::::::.::::::::::::::::::::
CCDS47 SETTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKEETIIEVELTNIQKKY
1160 1170 1180 1190 1200 1210
1110 1120 1130 1140 1150 1160
pF1KE9 YRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNPAA
:::::::::.:::::.::.:::::.::::::::::::::::.::::::: ::..:.: .
CCDS47 YRAILEKNFTFLSKGGGQANVPNLLNTMMELRKCCNHPYLINGAEEKILEEFKETHNAES
1220 1230 1240 1250 1260 1270
1170 1180 1190 1200 1210 1220
pF1KE9 SDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYERID
::.::::::.:::::::::::::.:::::.:::::::::::::::::::..:: :::::
CCDS47 PDFQLQAMIQAAGKLVLIDKLLPKLKAGGHRVLIFSQMVRCLDILEDYLIQRRYPYERID
1280 1290 1300 1310 1320 1330
1230 1240 1250 1260 1270 1280
pF1KE9 GRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQAQ
1340 1350 1360 1370 1380 1390
1290 1300 1310 1320 1330 1340
pF1KE9 ARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQLSK
::::::::.:.::.:::.:::::::::::.:::::::::::::::::::. ..:.:::::
CCDS47 ARCHRIGQSKSVKIYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRENATNGVQQLSK
1400 1410 1420 1430 1440 1450
1350 1360 1370 1380 1390 1400
pF1KE9 KEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTFAKASFVAS
::::::::.:::::.:.:::::::::::::::::::::.::::::::.::::::::::::
CCDS47 KEIEDLLRKGAYGALMDEEDEGSKFCEEDIDQILLRRTHTITIESEGKGSTFAKASFVAS
1460 1470 1480 1490 1500 1510
1410 1420 1430 1440 1450 1460
pF1KE9 GNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK-DELAELS
::::::::::::::::::::::.::.:..:::.:::::::.::::: .::.: ::: :.:
CCDS47 GNRTDISLDDPNFWQKWAKKAELDIDALNGRNNLVIDTPRVRKQTRLYSAVKEDELMEFS
1520 1530 1540 1550 1560 1570
1470 1480 1490 1500 1510 1520
pF1KE9 EAESEGDEKP--KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFKRQLNEH
. ::...::: : ::: :.:.::.:.::::::::::::::::: .::::::.::::.:.
CCDS47 DLESDSEEKPCAKPRRPQDKSQGYARSECFRVEKNLLVYGWGRWTDILSHGRYKRQLTEQ
1580 1590 1600 1610 1620 1630
1530 1540 1550 1560 1570 1580
pF1KE9 DVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKK
::: :::..:.::: ::.:::.::.::::::::: ::::: : :: ::::::::::::::
CCDS47 DVETICRTILVYCLNHYKGDENIKSFIWDLITPTADGQTRALVNHSGLSAPVPRGRKGKK
1640 1650 1660 1670 1680 1690
1590 1600 1610 1620 1630 1640
pF1KE9 VKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNEC
::.:... .: :.:: . ::. :.:...::::.:::::::::::::::::.:::::..
CCDS47 VKAQSTQPVVQDADWLASCNPDALFQEDSYKKHLKHHCNKVLLRVRMLYYLRQEVIGDQA
1700 1710 1720 1730 1740 1750
1650 1660 1670 1680 1690 1700
pF1KE9 QKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRADPALCF
.:...:.:.:. :::.::: :.::::.::: .::::::::::::::::::..::::::::
CCDS47 DKILEGADSSEADVWIPEPFHAEVPADWWDKEADKSLLIGVFKHGYEKYNSMRADPALCF
1760 1770 1780 1790 1800 1810
1710 1720 1730 1740 1750
pF1KE9 LERVGKPDEKAVAAEQRANDYM-DG--------DVEDPEYKPAPAIFKDDIEDDVSSPGD
::::: :: ::.:::::..:.. :: . :::::::. . :::.:.. ..::..
CCDS47 LERVGMPDAKAIAAEQRGTDMLADGGDGGEFDREDEDPEYKPTRTPFKDEIDEFANSPSE
1820 1830 1840 1850 1860 1870
1760 1770 1780 1790 1800
pF1KE9 ----LVIADGDGQLMEGD----KVYWPTQSALTTRLRRLITAYQRTNKNRQIQQIQPTFS
. . :. :.. ..:::. :.::::::::::::::. : .:..: . ..
CCDS47 DKEESMEIHATGKHSESNAELGQLYWPNTSTLTTRLRRLITAYQRSYKRQQMRQ-EALMK
1880 1890 1900 1910 1920 1930
1810 1820 1830 1840 1850 1860
pF1KE9 VPTSVMQPIYEEATLNPKMAAKI-ERQQRWTRREEADFYRVVSTFGVVFDPDRGQFDWTK
. .: : .:. . : : :..:.::::::::::::::::::.::: . ::::..
CCDS47 TDRRRRRPREEVRALEAEREAIISEKRQKWTRREEADFYRVVSTFGVIFDPVKQQFDWNQ
1940 1950 1960 1970 1980 1990
1870 1880 1890 1900 1910 1920
pF1KE9 FRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPNI--FIQPITEERASRTLY
:::.::: ::.:.:::::. :..:::::::.: : . :.. .:.::::::::::::
CCDS47 FRAFARLDKKSDESLEKYFSCFVAMCRRVCRMPVKPDDEPPDLSSIIEPITEERASRTLY
2000 2010 2020 2030 2040 2050
1930 1940 1950 1960 1970 1980
pF1KE9 RIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLLIGAAKHGVSRTDYHI
:::::::.:::.:.:::: ::::::.:. ::: ::::: ::::::.::::::::::::::
CCDS47 RIELLRKIREQVLHHPQLGERLKLCQPSLDLPEWWECGRHDRDLLVGAAKHGVSRTDYHI
2060 2070 2080 2090 2100 2110
1990 2000 2010 2020 2030 2040
pF1KE9 LRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQVALSASPLTSLPRLLDAKGIILEEMK
: ::::::. :..:..:.. : . .: .:: : :..
CCDS47 LNDPELSFLDAHKNFAQNRGAGNTSSL------------NPL--------AVGFVQTPPV
2120 2130 2140 2150
2050 2060 2070 2080 2090 2100
pF1KE9 VKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQKSGGKCETDRRMVA
..: ....: :: :: : : :
CCDS47 ISSAHIQDER---------------------------VLEQAEG------KVE-------
2160 2170
2110 2120 2130 2140 2150 2160
pF1KE9 ARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSSSSCSHSRSGSSSS
:: :::.:. . .:.: ..:.....:. .. .:: .. . . :...
CCDS47 ---EP--ENPAAKE---KCEGKEEEEETDGSGKESKQECEAEASSVKNELKGVEVGADT-
2180 2190 2200 2210 2220
2170 2180 2190 2200 2210 2220
pF1KE9 SSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHMKAYDEESVASLST
.:.: : ..: . . :..:..:: .: .: .... : .:::: ::.::
CCDS47 ---------GSKSISEKGSEEDEEEKLEDDDKSEESSQPEAGAVSRGKNFDEESNASMST
2230 2240 2250 2260 2270
2230 2240 2250 2260 2270 2280
pF1KE9 TQDETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARR
..:::.:.: :..: : : .:. .: :.::::::::::::.::..::::::: ::
CCDS47 ARDETRDGFYMEDGDPSVAQLLHE-RTFAFSFWPKDRVMINRLDNICEAVLKGKWPVNRR
2280 2290 2300 2310 2320 2330
2290 2300 2310 2320 2330 2340
pF1KE9 S-YDANTVASFYTTKLLDSPGAATEYSEPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQ
. .: . . :: .::: ..: :. . . .:. : :.::: .:.:.
CCDS47 QMFDFQGLIPGYTPTTVDSPLQKRSFAELSMVGQASISGSEDITTSPQLSKEDALNLSVP
2340 2350 2360 2370 2380 2390
2350 2360 2370 2380
pF1KE9 KQGLAQKRPFDGEDGALGQQQYL----TRLRELQSASE-----------------TSLVN
.: ..: .. : .... : ..::: : .:: .: :
CCDS47 RQRRRRRRKIEIEAERAAKRRNLMEMVAQLRESQVVSENGQEKVVDLSKASREATSSTSN
2400 2410 2420 2430 2440 2450
2390 2400 2410 2420
pF1KE9 F---------PK-SIPVS------------GTSIQPTLGA-NGVILDNQPIVKKRRGRRK
: :. : ::: : : :: :: ..:..: .:.::::::
CCDS47 FSSLSSKFILPNVSTPVSDAFKTQMELLQAGLSRTPTRHLLNGSLVDGEPPMKRRRGRRK
2460 2470 2480 2490 2500 2510
2430 2440 2450 2460 2470
pF1KE9 NVEGVDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGIP-----DTESPVPVIN
::::.:..:..... .::. ..... ... . ..:: : .. .::::
CCDS47 NVEGLDLLFMSHKR----TSLSAEDAEVTKAFEEDIETPPTRNIPSPGQLDPDTRIPVIN
2520 2530 2540 2550 2560 2570
2480 2490 2500 2510 2520 2530
pF1KE9 LKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQ--LHEG--RPKQKRHRCRNP
:.:::::.:.:::: ::: .::: :: :. :. ...:. : . .:::::::::::
CCDS47 LEDGTRLVGEDAPKNKDLVEWLKLHPTYTVDMPSYVPKNADVLFSSFQKPKQKRHRCRNP
2580 2590 2600 2610 2620 2630
2540 2550 2560 2570 2580 2590
pF1KE9 NKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSG
::::.:.::::::: ..:.::..:.:::.:::.::: :.:.:: :..:::.: :.:::::
CCDS47 NKLDINTLTGEERVPVVNKRNGKKMGGAMAPPMKDLPRWLEENPEFAVAPDWTDIVKQSG
2640 2650 2660 2670 2680 2690
2600 2610 2620 2630 2640 2650
pF1KE9 FLPESMYERILTGPVVREE-VSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPG
:.::::..:.::::::: : .::::::::: ::.:.:::::...:: . ::::.:.:. :
CCDS47 FVPESMFDRLLTGPVVRGEGASRRGRRPKSEIARAAAAAAAVASTS-GINPLLVNSLFAG
2700 2710 2720 2730 2740 2750
2660 2670 2680 2690 2700
pF1KE9 VDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPS----GGEAKNMAAMFPMLLSGMAGLP
.:::.: ::::::::::. :::::.: :: . ::.::: ::..:..: ::::::
CCDS47 MDLTSL----QNLQNLQSLQL-AGLMGFPPGLATAATAGGDAKNPAAVLPLMLPGMAGLP
2760 2770 2780 2790 2800
2710 2720 2730 2740 2750
pF1KE9 NLLGMGGLLTKPTESGTEDKKGSDSK-ESEGKTERTESQSSENGGEN--------SVSSS
:..:.::::..: ..: . ..:. : : .: . : ...:: :: .::..
CCDS47 NVFGLGGLLNNPLSAATGNTTTASSQGEPEDSTSKGEEKGNENEDENKDSEKSTDAVSAA
2810 2820 2830 2840 2850 2860
2760 2770 2780 2790 2800
pF1KE9 PSASSTAALNTAAA---ANPLALNPLLLSNI----LYPGMLLTPGLN-LHIPTLS-----
::..... :: : .::::.::.:::.. .::.:.: :::. : .: .
CCDS47 DSANGSVGAATAPAGLPSNPLAFNPFLLSTMAPGLFYPSMFLPPGLGGLTLPGFPALAGL
2870 2880 2890 2900 2910 2920
2810 2820 2830 2840 2850 2860
pF1KE9 QSNTFDVQNKNSDLGSSKSVEVKE--EDSRIKDQEDKGGTEPSPLNENSTDEGSEKADAS
:. . . ..: .: . . . : : : ... :: : : : :. .: :. :.
CCDS47 QNAVGSSEEKAADKAEGGPFKDGETLEGSDAEESLDK--TAESSLLEDEIAQG-EELDSL
2930 2940 2950 2960 2970 2980
2870 2880
pF1KE9 SGSDSTSSSSEDSDSSNED
.:.: .. .:
CCDS47 DGGDEIENNENDE
2990
>>CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581 aa)
initn: 5800 init1: 4537 opt: 5829 Z-score: 3432.1 bits: 649.5 E(32554): 7.6e-185
Smith-Waterman score: 7678; 49.6% identity (69.8% similar) in 2774 aa overlap (1-2685:1-2482)
10 20 30 40 50 60
pF1KE9 MTDPMMDFFDDANLFGETLEGLSDDAFVQPGPVSLVDELNLGAEFEPLHIDSLNHVQGTP
:.::.::.::: :::: :..:.::.: : . . :.: : .:::.
CCDS53 MADPIMDLFDDPNLFG--LDSLTDDSFNQVTQDPIEEALGL-----PSSLDSLD------
10 20 30 40
70 80 90 100 110 120
pF1KE9 THQKMTDFEQLNQFDSIKFHHVNQSFGSPAEHVLSPHSQFNCSPIHPQNQPNGLFPDVSD
:.:: : :. .. : :. : : .
CCDS53 ---------QMNQ-D-----------GGGGDVGNSSASE--------------LVPPPEE
50 60 70
130 140 150 160 170 180
pF1KE9 GSPMWGHQTATTISNQNGSPFHQQGHSHSMHQNKSFVAHHDFALFQANEQQTQCTSLRSQ
.: : .:... .: .. .. ::.. :...: :...
CCDS53 TAP-------TELSKESTAPAPES------------ITLHDYTTQPASQEQPAQPVLQTS
80 90 100 110
190 200 210 220 230
pF1KE9 QNRNNL---NPGQNSLSQSKNFMNVSGPHRVNVN---HPPQMTNASNSQQSISMQQFSQT
..: . .:. :::.. ::.::. . . .::: .. . . .. ..
CCDS53 TPTSGLLQVSKSQEILSQGNPFMGVSATAVSSSSAGGQPPQ-----SAPKIVILKAPPSS
120 130 140 150 160
240 250 260 270 280 290
pF1KE9 SNPSAHFHKCSSHQEGNFNGPSPNMTSCSVSNSQQFSSHYSFSSNHISPN-SLLQSSAVL
: .:: . .. .: . .: ... . ... :.. .... . :. :......::
CCDS53 SVTGAHVAQIQA--QGITSTAQPLVAGTANGGKVTFTK--VLTGTPLRPGVSIVSGNTVL
170 180 190 200 210 220
300 310 320 330 340
pF1KE9 ASN-HTNQTLSDFTGSNSFSPHRGIKQESTQHIL------NPNTSLNSNNFQILHSSHP-
:.. ::. . .: : .:: : . ::... . . .: :
CCDS53 AAKVPGNQAAVQ----RIVQPSRPVKQLVLQPVKGSAPAGNPGATGPPLKPAVTLTSTPT
230 240 250 260 270 280
350 360 370 380 390
pF1KE9 QGNYSNSKLSPVHMNFPDPVDSGTQMGHFNDHVETNGFSS---LEENLLHQV----ESQT
:: .:: . . . .: ..: : :: :: ... . :. : : . ..:
CCDS53 QG---ESKR--ITLVLQQPQSGGPQ-GH--RHVVLGSLPGKIVLQGNQLAALTQAKNAQG
290 300 310 320 330
400 410 420 430 440 450
pF1KE9 EPFTGLDPEDLLQEGLLPHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQS
.: . . .:. :. . : ::. .: : :.: ....:
CCDS53 QPAKVVTIQLQVQQ---PQQKIQIVPQPPSSQ----PQPQQPPS---TQPVTLSSVQ---
340 350 360 370
460 470 480 490 500 510
pF1KE9 QARSWHSSFSNHQHLHDRNHLCLQRQPPSSK-KSDGSGTYTKLQNTQVRVMSEK------
::. . : :.: .. :: : ::. :.: .. :. ..: ..:
CCDS53 QAQIMGPGQSPGQRLSVPVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSAPH
380 390 400 410 420 430
520 530 540 550 560
pF1KE9 -------KQRKKVESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEE
.. ...: ..::::::::..::::.:. :::.:::::.. ...:.. : . :
CCDS53 SGGKTGMEENRRLEHQKKQEKANRIVAEAIARARARGEQNIPRVLNEDELPSVRPEEEGE
440 450 460 470 480 490
570 580 590 600 610
pF1KE9 KKGRRMKS---KPKDKDSKKTKTC--SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAE
:: :: :: . :.. ::.:: :: : :.:.. . ..:::.:: : :::. ::.:
CCDS53 KK-RRKKSAGERLKEEKPKKSKTSGASKTKGKSKLNTITPVVGKKRKR-NTSSDN-SDVE
500 510 520 530 540 550
620 630 640 650 660 670
pF1KE9 QMP-QHTLKDQDS--QKRRSNRQIKRKKYAEDIEGK----QSEEEVKGSMKIKKNSA-PL
:: : .:..: ::::::::.:::::.::.. : . :::: . :: . :
CCDS53 VMPAQSPREDEESSIQKRRSNRQVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPE
560 570 580 590 600 610
680 690 700 710 720
pF1KE9 PGEQP-------LQLFVENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYS
: ..: .:.:::::::::::::::.:: : ::::. : . ..:::::::::::
CCDS53 PVQEPDGETLPSMQFFVENPSEEDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYS
620 630 640 650 660 670
730 740 750 760 770 780
pF1KE9 YLHCEWATEEQLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFC
:::::::: :: :::::.::.:::: ..:: ::: . .:::::::::::::.:. :
CCDS53 YLHCEWATISQLEKDKRIHQKLKRFKTKMAQMRHFFHE-DEEPFNPDYVEVDRILDESHS
680 690 700 710 720 730
790 800 810 820 830 840
pF1KE9 EDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNI
:::.:::::::::::::::::::::::::::: .::.::...:. .:. . ..:: ..
CCDS53 IDKDNGEPVIYYLVKWCSLPYEDSTWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASA
740 750 760 770 780 790
850 860 870 880 890 900
pF1KE9 WKKIDQSRDYKNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILL
:::.. :..::: ::::::::::.::::::::::.:::::::::::::::::.:: :.
CCDS53 WKKLELSHEYKNRNQLREYQLEGVNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYN
800 810 820 830 840 850
910 920 930 940 950 960
pF1KE9 TGIRGPFLIIAPLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIR
.::.::::.:::::::.:::::: :::..:..:::::: ::::::::::: .::.::.:
CCDS53 VGIHGPFLVIAPLSTITNWEREFNTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIP
860 870 880 890 900 910
970 980 990 1000 1010 1020
pF1KE9 GAYRFQAIITTFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLL
:::.:.:.::::::::. : :: ::::::::::::::::.:::::..:: :.:::::::
CCDS53 GAYKFDALITTFEMILSDCPELREIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLL
920 930 940 950 960 970
1030 1040 1050 1060 1070 1080
pF1KE9 TGTPLQNTVEELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKE
::::::::::::::::::::: .::::: :...:::::::::::::::::::::::::::
CCDS53 TGTPLQNTVEELFSLLHFLEPSQFPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKE
980 990 1000 1010 1020 1030
1090 1100 1110 1120 1130 1140
pF1KE9 DVEKKLAPKEETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCC
::::.::::.::::::::::::::::::::::::::::::::.::.:::.::::::::::
CCDS53 DVEKNLAPKQETIIEVELTNIQKKYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCC
1040 1050 1060 1070 1080 1090
1150 1160 1170 1180 1190 1200
pF1KE9 NHPYLIKGAEEKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIF
::::::.::::::: :::.. . :::::::..::::::::::::::.::::::::::
CCDS53 NHPYLINGAEEKILTEFREACHIIPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIF
1100 1110 1120 1130 1140 1150
1210 1220 1230 1240 1250 1260
pF1KE9 SQMVRCLDILEDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLG
:::::::::::::::..:::::::::::::::::::::::::::::::::::::::::::
CCDS53 SQMVRCLDILEDYLIQRRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLG
1160 1170 1180 1190 1200 1210
1270 1280 1290 1300 1310 1320
pF1KE9 INLTAADTCIIFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKL
:::::::::::::::::::::::::::::::::.::::::::.:::::::::::.:::::
CCDS53 INLTAADTCIIFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKL
1220 1230 1240 1250 1260 1270
1330 1340 1350 1360 1370 1380
pF1KE9 GLDKAVLQSMSGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILL
:::::::::::::..:. ::::.::::::::::.:::.:::::.::::::::::::::::
CCDS53 GLDKAVLQSMSGRDGNITGIQQFSKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILL
1280 1290 1300 1310 1320 1330
1390 1400 1410 1420 1430 1440
pF1KE9 RRTKTITIESEGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLV
::: ::::::::.:::::::::::: ::::::::::::::::::::..:.. ....:.::
CCDS53 RRTTTITIESEGKGSTFAKASFVASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLV
1340 1350 1360 1370 1380 1390
1450 1460 1470 1480 1490 1500
pF1KE9 IDTPRIRKQTRPFSATKDE-LAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEKNLL
:::::.::::: ::. ::. :.:.:. ::: ::.:. :: :: ..::::.::::::.::
CCDS53 IDTPRVRKQTRHFSTLKDDDLVEFSDLESEDDERPRSRRH-DRHHAYGRTDCFRVEKHLL
1400 1410 1420 1430 1440 1450
1510 1520 1530 1540 1550 1560
pF1KE9 VYGWGRWREILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDG
::::::::.:::::::::...:.::: ::::.:.:::.::::::.:::::::::.:.:.:
CCDS53 VYGWGRWRDILSHGRFKRRMTERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENG
1460 1470 1480 1490 1500 1510
1570 1580 1590 1600 1610 1620
pF1KE9 QTRELQNHLGLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHH
.:.::::: ::: ::::::::::::.: :.:::.::.:.:::::. :.:::.::::.::.
CCDS53 KTKELQNHSGLSIPVPRGRKGKKVKSQ-STFDIHKADWIRKYNPDTLFQDESYKKHLKHQ
1520 1530 1540 1550 1560 1570
1630 1640 1650 1660 1670 1680
pF1KE9 CNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSL
::::::::::::::.:::::.. .::. :. ::.::.: : :. :::. ::: .:::::
CCDS53 CNKVLLRVRMLYYLRQEVIGDQAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSL
1580 1590 1600 1610 1620 1630
1690 1700 1710 1720 1730
pF1KE9 LIGVFKHGYEKYNTIRADPALCFLERVGKPDEKAVAAEQRA----NDYMDG-----DVED
::::::::::::::.::::::::::..:.::.::.:::.:. .: ..: : ::
CCDS53 LIGVFKHGYEKYNTMRADPALCFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCED
1640 1650 1660 1670 1680 1690
1740 1750 1760 1770 1780
pF1KE9 PEYKPAPAIFKDDIEDDVSSPGDLVIADGDGQLMEGDK---------VYWPTQSALTTRL
::::: . :: .:: ..: :.. : . ....::. ..:: ::::.::
CCDS53 PEYKPLQGPPKD--QDDEGDP--LMMMDEEISVIDGDEAQVTQQPGHLFWPPGSALTARL
1700 1710 1720 1730 1740
1790 1800 1810 1820 1830 1840
pF1KE9 RRLITAYQRTNKNRQIQQIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEAD
:::.:::::. : .:.. :. .. . . ::... : :. :.::::::::..:
CCDS53 RRLVTAYQRSYKREQMK-IE---AAERGDRRRRRCEAAFKLKEIARREKQQRWTRREQTD
1750 1760 1770 1780 1790 1800
1850 1860 1870 1880 1890 1900
pF1KE9 FYRVVSTFGVVFDPDRGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLP--SK
:::::::::: .::: :: : .::..::: ::::.:: ::...:..:::.::::: .
CCDS53 FYRVVSTFGVEYDPDTMQFHWDRFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAG
1810 1820 1830 1840 1850 1860
1910 1920 1930 1940 1950 1960
pF1KE9 EELVDPNIFIQPITEERASRTLYRIELLRKVREQALRHPQLFERLKLCHP-NPDLPVWWE
.: :::.::.::::::::::::::::::..:::.: :: : .:: ::.: .:.:: :::
CCDS53 DEPPDPNLFIEPITEERASRTLYRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWE
1870 1880 1890 1900 1910 1920
1970 1980 1990 2000 2010
pF1KE9 CGPHDRDLLIGAAKHGVSRTDYHILRDPELSFMAAQRNYSQSKMAH------SRTSTPLL
:: .:: :::.::::.:: .:..::..::.::. :: :...: :: :::::
CCDS53 PVRHDGELLRGAARHGVSQTDCNIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLL
1930 1940 1950 1960 1970 1980
2020 2030 2040 2050 2060 2070
pF1KE9 QQYQVALSASPLTSLPRLLDAKGIILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSE
.: .. .:::: : :: ... :. . . . :.:. :: .
CCDS53 HQQYTSRTASPLPLRP---DAP-------------VEKSPEETATQ-VPSLESLTLKLEH
1990 2000 2010 2020
2080 2090 2100 2110 2120 2130
pF1KE9 PVSPKNGVLPQATGDQKSGGKCETDRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDS
: .. :: . . :. . : ::. . . : :. :. .::::
CCDS53 EVVARSRPTPQ-----------DYEMRVSPSDTTPLV---SRSVPPVKL---EDEDDSDS
2030 2040 2050 2060 2070
2140 2150 2160 2170 2180 2190
pF1KE9 DSERSSCSSRSSSSSSSSSCSHSRSGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEES
. . :. : :::.::::::::::..::
CCDS53 ELDLSKLSP---------------------------------SSSSSSSSSSSSSSTDES
2080 2090
2200 2210 2220 2230 2240 2250
pF1KE9 DSDEEEAQKRAESTTHMKAYDEESVASLSTTQD--ETQDSFQMNNGTPESAYILQGGYML
....:: . . .. : :::::. ::. .:: ..:. :: ::: .::
CCDS53 EDEKEE---KLTDQSRSKLYDEESLLSLTMSQDGFPNEDGEQM---TPE-LLLLQ--ERQ
2100 2110 2120 2130 2140
2260 2270 2280 2290 2300 2310
pF1KE9 AASYWPKDRVMINRLDSICQTVLKGKWPSARRSYDANTVASFYT-TKLLDSPGAAT-EYS
:: ::::::.:::.: .::.::.:::::.::: . : . . ..:::::. . ::.
CCDS53 RASEWPKDRVLINRIDLVCQAVLSGKWPSSRRSQEMVTGGILGPGNHLLDSPSLTPGEYG
2150 2160 2170 2180 2190 2200
2320 2330 2340 2350 2360 2370
pF1KE9 EPSVPTPPGAGVKEEHDQSTQMSKEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLR
. :::: .... .. .. . .. ..: ..:. .: .. ....
CCDS53 DSPVPTPRSSSAASMAEEEASAVSTAAAQFTKLRRGMDEK-------------EFTVQIK
2210 2220 2230 2240 2250
2380 2390 2400 2410 2420 2430
pF1KE9 ELQSASETSLVNFPKSIPVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFN
. .. . : : : : ::::. :..:. .:..: ::.. ... ..
CCDS53 DEEGLKLT----FQKH----------KLMANGVMGDGHPLFHKKKGNRKKLVELEVECME
2260 2270 2280 2290 2300
2440 2450 2460 2470 2480 2490
pF1KE9 RNKPPNHVSLGLTSSQISTGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRK
. :::... : :. .:::: ::: :.:.:::.:
CCDS53 E---PNHLDV------------------------DLETRIPVINKVDGTLLVGEDAPRRA
2310 2320 2330
2500 2510 2520 2530 2540 2550
pF1KE9 DLEKWLKEHPGYVEDLGAFIPR-MQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINR
.:: ::. :: .. : :: . : : ::: .::.. :: ..: : : : :: :
CCDS53 ELEMWLQGHPEFAVD-----PRFLAYMEDRRKQKWQRCKKNNKAELNCL-GMEPVQTANS
2340 2350 2360 2370 2380
2560 2570 2580 2590 2600 2610
pF1KE9 RNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREE
::..: : :....:.: ::.. :
CCDS53 RNGKK-----------------------------------GHHTETVFNRVLPGPIAPES
2390 2400 2410
2620 2630 2640 2650 2660 2670
pF1KE9 VSRRGRRPKSGIAKATAAAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQ
..:.:: . ..: : ..:. :.: . . .. . : ....: .. . ::
CCDS53 SKKRARRMRPDLSKMMALMQGGSTGSLSLHNTFQHS---SSGLQSVSSLGHSSATSASLP
2420 2430 2440 2450 2460 2470
2680 2690 2700 2710 2720 2730
pF1KE9 VTAGLMGMPTGLPSGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSD
.:: : ::
CCDS53 FMPFVMG---GAPSSPHVDSSTMLHHHHHHPHPHHHHHHHPGLRAPGYPSSPVTTASGTT
2480 2490 2500 2510 2520
>>CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302 aa)
initn: 5800 init1: 4537 opt: 5816 Z-score: 3425.1 bits: 648.0 E(32554): 1.8e-184
Smith-Waterman score: 7618; 55.4% identity (74.3% similar) in 2307 aa overlap (446-2685:91-2203)
420 430 440 450 460 470
pF1KE9 PHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARSWHSSFSNHQHLHD
:.: ....: ::. . : :.:
CCDS45 IQLQVQQPQQKIQIVPQPPSSQPQPQQPPSTQPVTLSSVQ---QAQIMGPGQSPGQRLSV
70 80 90 100 110
480 490 500 510 520
pF1KE9 RNHLCLQRQPPSSK-KSDGSGTYTKLQNTQVRVMSEK-------------KQRKKVESES
.. :: : ::. :.: .. :. ..: ..: .. ...: ..
CCDS45 PVKVVLQPQAGSSQGASSGLSVVKVLSASEVAALSSPASSAPHSGGKTGMEENRRLEHQK
120 130 140 150 160 170
530 540 550 560 570
pF1KE9 KQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEEKKGRRMKS---KPKDKD
::::::::..::::.:. :::.:::::.. ...:.. : . ::: :: :: . :..
CCDS45 KQEKANRIVAEAIARARARGEQNIPRVLNEDELPSVRPEEEGEKK-RRKKSAGERLKEEK
180 190 200 210 220 230
580 590 600 610 620 630
pF1KE9 SKKTKTC--SKLKEKTKIGKLIITLGKKQKRKNESSDEISDAEQMP-QHTLKDQDS--QK
::.:: :: : :.:.. . ..:::.:: : :::. ::.: :: : .:..: ::
CCDS45 PKKSKTSGASKTKGKSKLNTITPVVGKKRKR-NTSSDN-SDVEVMPAQSPREDEESSIQK
240 250 260 270 280 290
640 650 660 670 680
pF1KE9 RRSNRQIKRKKYAEDIEGK----QSEEEVKGSMKIKKNSA-PLPGEQP-------LQLFV
::::::.:::::.::.. : . :::: . :: . : : ..: .:.::
CCDS45 RRSNRQVKRKKYTEDLDIKITDDEEEEEVDVTGPIKPEPILPEPVQEPDGETLPSMQFFV
300 310 320 330 340 350
690 700 710 720 730 740
pF1KE9 ENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQLLKDKR
:::::::::::::.:: : ::::. : . ..::::::::::::::::::: :: ::::
CCDS45 ENPSEEDAAIVDKVLSMRIVKKELPSGQYTEAEEFFVKYKNYSYLHCEWATISQLEKDKR
360 370 380 390 400 410
750 760 770 780 790 800
pF1KE9 IQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVIYYLVKWC
:.::.:::: ..:: ::: . .:::::::::::::.:. : :::.::::::::::::
CCDS45 IHQKLKRFKTKMAQMRHFFHE-DEEPFNPDYVEVDRILDESHSIDKDNGEPVIYYLVKWC
420 430 440 450 460 470
810 820 830 840 850 860
pF1KE9 SLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDYKNGNQLR
:::::::::::::::: .::.::...:. .:. . ..:: .. :::.. :..::: ::::
CCDS45 SLPYEDSTWELKEDVDEGKIREFKRIQSRHPELKRVNRPQASAWKKLELSHEYKNRNQLR
480 490 500 510 520 530
870 880 890 900 910 920
pF1KE9 EYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLIIAPLSTIA
::::::.::::::::::.:::::::::::::::::.:: :. .::.::::.:::::::.
CCDS45 EYQLEGVNWLLFNWYNRQNCILADEMGLGKTIQSIAFLQEVYNVGIHGPFLVIAPLSTIT
540 550 560 570 580 590
930 940 950 960 970 980
pF1KE9 NWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIITTFEMILG
:::::: :::..:..:::::: ::::::::::: .::.::.: :::.:.:.::::::::.
CCDS45 NWEREFNTWTEMNTIVYHGSLASRQMIQQYEMYCKDSRGRLIPGAYKFDALITTFEMILS
600 610 620 630 640 650
990 1000 1010 1020 1030 1040
pF1KE9 GCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLH
: :: ::::::::::::::::.:::::..:: :.::::::::::::::::::::::::
CCDS45 DCPELREIEWRCVIIDEAHRLKNRNCKLLDSLKHMDLEHKVLLTGTPLQNTVEELFSLLH
660 670 680 690 700 710
1050 1060 1070 1080 1090 1100
pF1KE9 FLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVE
:::: .::::: :...:::::::::::::::::::::::::::::::.::::.:::::::
CCDS45 FLEPSQFPSESEFLKDFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKNLAPKQETIIEVE
720 730 740 750 760 770
1110 1120 1130 1140 1150 1160
pF1KE9 LTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEF
:::::::::::::::::::::::::.::.:::.::::::::::::::::.::::::: ::
CCDS45 LTNIQKKYYRAILEKNFSFLSKGAGHTNMPNLLNTMMELRKCCNHPYLINGAEEKILTEF
780 790 800 810 820 830
1170 1180 1190 1200 1210 1220
pF1KE9 RDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHK
:.. . :::::::..::::::::::::::.:::::::::::::::::::::::::..
CCDS45 REACHIIPHDFHLQAMVRSAGKLVLIDKLLPKLKAGGHKVLIFSQMVRCLDILEDYLIQR
840 850 860 870 880 890
1230 1240 1250 1260 1270 1280
pF1KE9 RYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWN
900 910 920 930 940 950
1290 1300 1310 1320 1330 1340
pF1KE9 PQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNV
::::::::::::::::.::::::::.:::::::::::.::::::::::::::::::..:.
CCDS45 PQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQSMSGRDGNI
960 970 980 990 1000 1010
1350 1360 1370 1380 1390 1400
pF1KE9 GGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEGRGSTF
::::.::::::::::.:::.:::::.::::::::::::::::::: ::::::::.::::
CCDS45 TGIQQFSKKEIEDLLRKGAYAAIMEEDDEGSKFCEEDIDQILLRRTTTITIESEGKGSTF
1020 1030 1040 1050 1060 1070
1410 1420 1430 1440 1450 1460
pF1KE9 AKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRPFSATK
:::::::: ::::::::::::::::::::..:.. ....:.:::::::.::::: ::. :
CCDS45 AKASFVASENRTDISLDDPNFWQKWAKKADLDMDLLNSKNNLVIDTPRVRKQTRHFSTLK
1080 1090 1100 1110 1120 1130
1470 1480 1490 1500 1510 1520
pF1KE9 DE-LAELSEAESEGDEKPKLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWREILSHGRFK
:. :.:.:. ::: ::.:. :: :: ..::::.::::::.::::::::::.::::::::
CCDS45 DDDLVEFSDLESEDDERPRSRRH-DRHHAYGRTDCFRVEKHLLVYGWGRWRDILSHGRFK
1140 1150 1160 1170 1180 1190
1530 1540 1550 1560 1570 1580
pF1KE9 RQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPR
:...:.::: ::::.:.:::.::::::.:::::::::.:.:.:.:.::::: ::: ::::
CCDS45 RRMTERDVETICRAILVYCLLHYRGDENIKGFIWDLISPAENGKTKELQNHSGLSIPVPR
1200 1210 1220 1230 1240 1250
1590 1600 1610 1620 1630 1640
pF1KE9 GRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQE
::::::::.: :.:::.::.:.:::::. :.:::.::::.::.::::::::::::::.::
CCDS45 GRKGKKVKSQ-STFDIHKADWIRKYNPDTLFQDESYKKHLKHQCNKVLLRVRMLYYLRQE
1260 1270 1280 1290 1300 1310
1650 1660 1670 1680 1690 1700
pF1KE9 VIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGYEKYNTIRA
:::.. .::. :. ::.::.: : :. :::. ::: .:::::::::::::::::::.::
CCDS45 VIGDQAEKVLGGAIASEIDIWFPVVDQLEVPTTWWDSEADKSLLIGVFKHGYEKYNTMRA
1320 1330 1340 1350 1360 1370
1710 1720 1730 1740 1750
pF1KE9 DPALCFLERVGKPDEKAVAAEQRA----NDYMDG-----DVEDPEYKPAPAIFKDDIEDD
::::::::..:.::.::.:::.:. .: ..: : ::::::: . :: .::
CCDS45 DPALCFLEKAGRPDDKAIAAEHRVLDNFSDIVEGVDFDKDCEDPEYKPLQGPPKD--QDD
1380 1390 1400 1410 1420
1760 1770 1780 1790 1800
pF1KE9 VSSPGDLVIADGDGQLMEGDK---------VYWPTQSALTTRLRRLITAYQRTNKNRQIQ
..: :.. : . ....::. ..:: ::::.:::::.:::::. : .:..
CCDS45 EGDP--LMMMDEEISVIDGDEAQVTQQPGHLFWPPGSALTARLRRLVTAYQRSYKREQMK
1430 1440 1450 1460 1470 1480
1810 1820 1830 1840 1850 1860
pF1KE9 QIQPTFSVPTSVMQPIYEEATLNPKMAAKIERQQRWTRREEADFYRVVSTFGVVFDPDRG
:. .. . . ::... : :. :.::::::::..::::::::::: .:::
CCDS45 -IE---AAERGDRRRRRCEAAFKLKEIARREKQQRWTRREQTDFYRVVSTFGVEYDPDTM
1490 1500 1510 1520 1530 1540
1870 1880 1890 1900 1910 1920
pF1KE9 QFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLP--SKEELVDPNIFIQPITEER
:: : .::..::: ::::.:: ::...:..:::.::::: . .: :::.::.::::::
CCDS45 QFHWDRFRTFARLDKKTDESLTKYFHGFVAMCRQVCRLPPAAGDEPPDPNLFIEPITEER
1550 1560 1570 1580 1590 1600
1930 1940 1950 1960 1970
pF1KE9 ASRTLYRIELLRKVREQALRHPQLFERLKLCHP-NPDLPVWWECGPHDRDLLIGAAKHGV
::::::::::::..:::.: :: : .:: ::.: .:.:: ::: :: .:: :::.:::
CCDS45 ASRTLYRIELLRRLREQVLCHPLLEDRLALCQPPGPELPKWWEPVRHDGELLRGAARHGV
1610 1620 1630 1640 1650 1660
1980 1990 2000 2010 2020 2030
pF1KE9 SRTDYHILRDPELSFMAAQRNYSQSKMAH------SRTSTPLLQQYQVALSASPLTSLPR
:.:: .:..::..::.::. :: :...: :: :::::.: .. .:::: :
CCDS45 SQTDCNIMQDPDFSFLAARMNYMQNHQAGAPAPSLSRCSTPLLHQQYTSRTASPLPLRP-
1670 1680 1690 1700 1710 1720
2040 2050 2060 2070 2080 2090
pF1KE9 LLDAKGIILEEMKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVSPKNGVLPQATGDQK
:: ... :. . . . :.:. :: . : .. ::
CCDS45 --DAP-------------VEKSPEETATQ-VPSLESLTLKLEHEVVARSRPTPQ------
1730 1740 1750 1760
2100 2110 2120 2130 2140 2150
pF1KE9 SGGKCETDRRMVAARTEPLTPNPASKKPRVHKRGSESSSDSDSDSERSSCSSRSSSSSSS
. . :. . : ::. . . : :. :. .::::. . :. :
CCDS45 -----DYEMRVSPSDTTPLV---SRSVPPVKL---EDEDDSDSELDLSKLSP--------
1770 1780 1790 1800
2160 2170 2180 2190 2200 2210
pF1KE9 SSCSHSRSGSSSSSSSSCSSASSSSSSSTSSSSSSSSSSSEESDSDEEEAQKRAESTTHM
:::.::::::::::..::....:: . . ..
CCDS45 -------------------------SSSSSSSSSSSSSSTDESEDEKEE---KLTDQSRS
1810 1820 1830
2220 2230 2240 2250 2260 2270
pF1KE9 KAYDEESVASLSTTQD--ETQDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDS
: :::::. ::. .:: ..:. :: ::: .:: :: ::::::.:::.:
CCDS45 KLYDEESLLSLTMSQDGFPNEDGEQM---TPE-LLLLQ--ERQRASEWPKDRVLINRIDL
1840 1850 1860 1870 1880
2280 2290 2300 2310 2320
pF1KE9 ICQTVLKGKWPSARRSYDANTVASFYT-TKLLDSPGAAT-EYSEPSVPTPPGAGVKEEHD
.::.::.:::::.::: . : . . ..:::::. . ::.. :::: .... .
CCDS45 VCQAVLSGKWPSSRRSQEMVTGGILGPGNHLLDSPSLTPGEYGDSPVPTPRSSSAASMAE
1890 1900 1910 1920 1930 1940
2330 2340 2350 2360 2370 2380
pF1KE9 QSTQMSKEGGLKLTFQKQGLAQKRPFDGEDGALGQQQYLTRLRELQSASETSLVNFPKSI
. .. . .. ..: ..:. .: .. ..... .. . : : :
CCDS45 EEASAVSTAAAQFTKLRRGMDEK-------------EFTVQIKDEEGLKLT----FQKH-
1950 1960 1970 1980
2390 2400 2410 2420 2430 2440
pF1KE9 PVSGTSIQPTLGANGVILDNQPIVKKRRGRRKNVEGVDIFFFNRNKPPNHVSLGLTSSQI
: ::::. :..:. .:..: ::.. ... . . :::...
CCDS45 ---------KLMANGVMGDGHPLFHKKKGNRKKLVELEVECM---EEPNHLDV-------
1990 2000 2010 2020 2030
2450 2460 2470 2480 2490 2500
pF1KE9 STGINPALSYTQPQGIPDTESPVPVINLKDGTRLAGDDAPKRKDLEKWLKEHPGYVEDLG
: :. .:::: ::: :.:.:::.: .:: ::. :: .. :
CCDS45 -----------------DLETRIPVINKVDGTLLVGEDAPRRAELEMWLQGHPEFAVD--
2040 2050 2060 2070
2510 2520 2530 2540 2550 2560
pF1KE9 AFIPR-MQLHEGRPKQKRHRCRNPNKLDVNSLTGEERVQLINRRNARKVGGAFAPPLKDL
:: . : : ::: .::.. :: ..: : : : :: : ::..:
CCDS45 ---PRFLAYMEDRRKQKWQRCKKNNKAELNCL-GMEPVQTANSRNGKK------------
2080 2090 2100 2110
2570 2580 2590 2600 2610 2620
pF1KE9 CRFLKENSEYGVAPEWGDVVKQSGFLPESMYERILTGPVVREEVSRRGRRPKSGIAKATA
: :....:.: ::.. : ..:.:: . ..: :
CCDS45 -----------------------GHHTETVFNRVLPGPIAPESSKKRARRMRPDLSKMMA
2120 2130 2140 2150
2630 2640 2650 2660 2670 2680
pF1KE9 AAAAASATSVSGNPLLANGLLPGVDLTTLQALQQNLQNLQSLQVTAGLMGMPTGLPSGGE
..:. :.: . . .. . : ....: .. . :: .:: : ::
CCDS45 LMQGGSTGSLSLHNTFQHS---SSGLQSVSSLGHSSATSASLPFMPFVMG---GAPSSPH
2160 2170 2180 2190 2200
2690 2700 2710 2720 2730 2740
pF1KE9 AKNMAAMFPMLLSGMAGLPNLLGMGGLLTKPTESGTEDKKGSDSKESEGKTERTESQSSE
CCDS45 VDSSTMLHHHHHHPHPHHHHHHHPGLRAPGYPSSPVTTASGTTLRLPPLQPEEDDDEDEE
2210 2220 2230 2240 2250 2260
>>CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715 aa)
initn: 3873 init1: 2850 opt: 5500 Z-score: 3238.5 bits: 613.7 E(32554): 4.6e-174
Smith-Waterman score: 6721; 46.7% identity (67.0% similar) in 2585 aa overlap (437-2691:9-2513)
410 420 430 440 450 460
pF1KE9 EDLLQEGLLPHFDESTFGQDNSSHILDHDLDRQFTSHLVTRPSDMAQTQLQSQARS---W
..:... : : :...... . .: .
CCDS13 MKMKIQKKEKQLSNLKVLNHSPMSDASVNFDYKSPSPF
10 20 30
470 480 490 500 510
pF1KE9 HSSFSNHQHLHDRNHLCLQRQPPSSKKSDGSGTYTKLQNTQVRVMSE-------KKQRKK
: .......: :: .. . . ... . . .... . . ::.:::
CCDS13 DCSTDQEEKIEDVASHCLPQKDLYTAEEEAATLFPRKMTSHNGMEDSGGGGTGVKKKRKK
40 50 60 70 80 90
520 530 540 550 560 570
pF1KE9 VESESKQEKANRIISEAIAKAKERGERNIPRVMSPENFPTASVEGKEEKK--GRRMKSKP
: . :: : . .. : :.. : . :. . : . : :: :. : . ::
CCDS13 KEP-GDQEGAAKGSKDREPKPKRKREPKEPKEPRKAKEPKKAKEHKEPKQKDGAKKARKP
100 110 120 130 140 150
580 590 600 610 620
pF1KE9 KD----KDSKKTKTCSKLKEKTKI-------GKLIITLGKKQKRKNESSDEISDAEQ---
.. :..:. ..:. .:: : . :: :::.:.. : . .:
CCDS13 REASGTKEAKEKRSCTDSAARTKSRKASKEQGPTPVEKKKKGKRKSETTVESLELDQGLT
160 170 180 190 200 210
630 640 650 660 670
pF1KE9 -----MPQHTLKDQDSQKRRSNRQIKRKKYAEDIEGKQSEEEVKGSMKIKKNSAPLPGEQ
:... .. :::::::.::.::.:: ::.. : ... . . . . . .
CCDS13 NPSLRSPEESTESTDSQKRRSGRQVKRRKYNEDLDFKVVDDDGETIAVLGAGRTSALSAS
220 230 240 250 260 270
680 690 700 710 720 730
pF1KE9 PLQLFVENPSEEDAAIVDKILSSRTVKKEISPGVM-IDTEEFFVKYKNYSYLHCEWATEE
: .:.: :.:: :..:::.:.::. :. :: .: : :.:::.:.:::::.::: :
CCDS13 TLAWQAEEPPEDDANIIEKILASKTVQ-EVHPGEPPFDLELFYVKYRNFSYLHCKWATME
280 290 300 310 320 330
740 750 760 770 780 790
pF1KE9 QLLKDKRIQQKIKRFKLRQAQRAHFFADMEEEPFNPDYVEVDRVLEVSFCEDKDTGEPVI
.: :: :: ::::::. .::: :.:.. .:. ::::::::::.:::. .: .::: :
CCDS13 ELEKDPRIAQKIKRFRNKQAQMKHIFTEPDEDLFNPDYVEVDRILEVAHTKDAETGEEVT
340 350 360 370 380 390
800 810 820 830 840 850
pF1KE9 YYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQLQASRPDTRCLDRPPSNIWKKIDQSRDY
.:::::::::::.:::::.:::: ::..:::.::. :. . ..:: :. :.:...::.:
CCDS13 HYLVKWCSLPYEESTWELEEDVDPAKVKEFESLQVL-PEIKHVERPASDSWQKLEKSREY
400 410 420 430 440 450
860 870 880 890 900 910
pF1KE9 KNGNQLREYQLEGLNWLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTGIRGPFLII
::.::::::::::.::::::::::.:::::::::::::::::::: ::.: ::.::::::
CCDS13 KNSNQLREYQLEGMNWLLFNWYNRKNCILADEMGLGKTIQSITFLSEIFLRGIHGPFLII
460 470 480 490 500 510
920 930 940 950 960 970
pF1KE9 APLSTIANWEREFRTWTDINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYRFQAIIT
::::::.::::::::::..:..::::: ::::::::::: .::.:: . :...:...::
CCDS13 APLSTITNWEREFRTWTEMNAIVYHGSQISRQMIQQYEMVYRDAQGNPLSGVFKFHVVIT
520 530 540 550 560 570
980 990 1000 1010 1020 1030
pF1KE9 TFEMILGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVE
::::::. : ::. :.: ::::::::::::.::::::::::: ::::::::::::::.::
CCDS13 TFEMILADCPELKKIHWSCVIIDEAHRLKNRNCKLLEGLKLMALEHKVLLTGTPLQNSVE
580 590 600 610 620 630
1040 1050 1060 1070 1080 1090
pF1KE9 ELFSLLHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKE
::::::.:::: .::::..:..:::::::::::.:::.:::::::::::.::::.::::.
CCDS13 ELFSLLNFLEPSQFPSETAFLEEFGDLKTEEQVKKLQSILKPMMLRRLKDDVEKNLAPKQ
640 650 660 670 680 690
1100 1110 1120 1130 1140 1150
pF1KE9 ETIIEVELTNIQKKYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAE
:::::::::::::::::::::::::::.:::.: :.:::.::::::::::::::::.:::
CCDS13 ETIIEVELTNIQKKYYRAILEKNFSFLTKGANQHNMPNLINTMMELRKCCNHPYLINGAE
700 710 720 730 740 750
1160 1170 1180 1190 1200 1210
pF1KE9 EKILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDIL
:::: .:: :..: : ::.::::::.:::::::::::::. :::::::::::::::::::
CCDS13 EKILEDFRKTHSPDAPDFQLQAMIQAAGKLVLIDKLLPKLIAGGHKVLIFSQMVRCLDIL
760 770 780 790 800 810
1220 1230 1240 1250 1260 1270
pF1KE9 EDYLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCI
:::::..:: :::::::::::::::::::: :::::::::::::::::::::::::::::
CCDS13 EDYLIQRRYTYERIDGRVRGNLRQAAIDRFCKPDSDRFVFLLCTRAGGLGINLTAADTCI
820 830 840 850 860 870
1280 1290 1300 1310 1320 1330
pF1KE9 IFDSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSM
:::::::::::::::::::::::.::::::::.:::::::::::.:::::::::::::..
CCDS13 IFDSDWNPQNDLQAQARCHRIGQSKAVKVYRLITRNSYEREMFDKASLKLGLDKAVLQDI
880 890 900 910 920 930
1340 1350 1360 1370 1380 1390
pF1KE9 SGRESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIES
. :.....:.::::: :.:::::.:::::.:.::::::::::::::::: :::.::::.:
CCDS13 N-RKGGTNGVQQLSKMEVEDLLRKGAYGALMDEEDEGSKFCEEDIDQILQRRTHTITIQS
940 950 960 970 980 990
1400 1410 1420 1430 1440 1450
pF1KE9 EGRGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQT
::.::::::::::::::::::::::::::::::: ::.: :: . ..::::: ::.::::
CCDS13 EGKGSTFAKASFVASGNRTDISLDDPNFWQKWAKIAELDTEAKNEKESLVIDRPRVRKQT
1000 1010 1020 1030 1040 1050
1460 1470 1480 1490 1500 1510
pF1KE9 RPFSA-TKDELAELSEAESEGDEKP-KLRRPCDRSNGYGRTECFRVEKNLLVYGWGRWRE
. ... .::: :.:: .:..::.: . :: :.. : :.::::::::::..:::::..
CCDS13 KHYNSFEEDELMEFSELDSDSDERPTRSRRLNDKARRYLRAECFRVEKNLLIFGWGRWKD
1060 1070 1080 1090 1100 1110
1520 1530 1540 1550 1560 1570
pF1KE9 ILSHGRFKRQLNEHDVEIICRALLAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHL
::.::::: .:::.:.:.::::::.::. ::.::::::.:::.:::::.:::.. ::::
CCDS13 ILTHGRFKWHLNEKDMEMICRALLVYCVKHYKGDEKIKSFIWELITPTKDGQAQTLQNHS
1120 1130 1140 1150 1160 1170
1580 1590 1600 1610 1620 1630
pF1KE9 GLSAPVPRGRKGKKVKTQTSSFDIQKAEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVR
::::::::::::::.:.: ... :.:: ::: .:.:.:::::.:.::::::::::
CCDS13 GLSAPVPRGRKGKKTKNQLLIPELKDADWLATCNPEVVLHDDGYKKHLKQHCNKVLLRVR
1180 1190 1200 1210 1220 1230
1640 1650 1660 1670 1680 1690
pF1KE9 MLYYLKQEVIGNECQKVFDGVDASDIDVWVPEPDHSEVPAEWWDFDADKSLLIGVFKHGY
:::::: :..:. .:.:.: : ..:: .:. :. :.:..::: .::::::::::::::
CCDS13 MLYYLKAEILGEAAEKAFEGSPARELDVPLPDIDYMEIPVDWWDAEADKSLLIGVFKHGY
1240 1250 1260 1270 1280 1290
1700 1710 1720 1730 1740 1750
pF1KE9 EKYNTIRADPALCFLERVGKPDEKAVAAEQRANDYMDGDVEDPEYKPAPAIFKDDIEDDV
:.::..::::::::::.:: ::::...::: ..: : . :: . .:. :: :
CCDS13 ERYNAMRADPALCFLEKVGMPDEKSLSAEQGVTD---GTSDIPERGNTDK--EDNAEDKV
1300 1310 1320 1330 1340
1760 1770 1780 1790
pF1KE9 ----------SSPGDLVIA---DGDGQLMEG---DKVYWPTQSALTTRLRRLITAYQRTN
:. :: :.. : . ..: :: ::..::::.:::::.:.::: :
CCDS13 DGLQKQTESSSDGGDGVFSEKKDDSRAAQDGSDPDKSPWPVSSALTARLRRLVTVYQRCN
1350 1360 1370 1380 1390 1400
1800 1810 1820 1830 1840 1850
pF1KE9 KNRQIQQIQPTFSVPTSVMQPIYEEA---TLNPKMAAKIERQQRWTRREEADFYRVVSTF
.. . .: . : . . :: : . . : : :.::::::.:::::.::.:
CCDS13 RK---ELCRPEILGPGNQGYWVQEEMFRRTSEMDLINK-EAQKRWTRREQADFYRTVSSF
1410 1420 1430 1440 1450 1460
1860 1870 1880 1890 1900 1910
pF1KE9 GVVFDPDRGQFDWTKFRAMARLHKKTDDSLEKYLYAFMSMCRRVCRLPSKEELVDPN--I
:::.: .. ::::.:: ..:: ::.:.:::.:.:.:..::: :::::. .. :. :
CCDS13 GVVYDQEKKTFDWTQFRIISRLDKKSDESLEQYFYSFVAMCRNVCRLPTWKDGGPPDTTI
1470 1480 1490 1500 1510 1520
1920 1930 1940 1950 1960 1970
pF1KE9 FIQPITEERASRTLYRIELLRKVREQALRHPQLFERLKLCHPNPDLPVWWECGPHDRDLL
...:::::::.:::::::::::::::.:. ::: :::.::.:. :::::::: ::::::
CCDS13 YVEPITEERAARTLYRIELLRKVREQVLKCPQLHERLQLCRPSLYLPVWWECGKHDRDLL
1530 1540 1550 1560 1570 1580
1980 1990 2000 2010 2020
pF1KE9 IGAAKHGVSRTDYHILRDPELSFMAAQRNYSQSKMAHSRTSTPLLQQYQV------ALSA
::.::::..::: .:. ::.:::. : :::.: : . ... : ::. .:.
CCDS13 IGTAKHGLNRTDCYIMNDPQLSFLDAYRNYAQHKRSGTQAPGNLCCLYQTNSKLYESLTY
1590 1600 1610 1620 1630 1640
2030 2040
pF1KE9 SPLT-----------------------SLP---------RLLDAKGII---------LEE
: .. ::: .. :. .: ::
CCDS13 SQMSRTSESLENEPENLVRVESRDDHLSLPDVTCENFISKVQDVISINHDESLLPESLES
1650 1660 1670 1680 1690 1700
2050 2060 2070 2080 2090
pF1KE9 MKVKSENLKEEPQSSEEESMSSVETRTLIKSEPVS---------PKNGVL--PQATGDQK
: .. :..::.: .: ...:.: . . .: :. . : :. .
CCDS13 MMYGKKVLSQEPSSFQESPSTNTESRKDVITISISKDGNCQSGGPEAEIASGPTFMGSLE
1710 1720 1730 1740 1750 1760
2100 2110 2120 2130
pF1KE9 SGGKCETDRR------MVAARTEPLTPNPASKKP----RVHKR---------GSESS---
.:: ... . : .. : . :...: ... . :.::.
CCDS13 AGGVAQANIKNGKHLLMSISKEGELCCSEAGQRPENIGQLEAKCLASPSLNPGNESGFVD
1770 1780 1790 1800 1810 1820
2140 2150
pF1KE9 --SDSDSDSERSSCS---------SRSSSSSSSSSCSHS---------------------
: : ::.:. : ..: :. : .::
CCDS13 MCSLSVCDSKRNLSSDQQLIDLLENKSLESKLILSQNHSDEEEEEEENEEENLAMAVGMG
1830 1840 1850 1860 1870 1880
2160 2170
pF1KE9 ---------------------------RSGS--------------SSSSSSSC-------
..:: . .. .:
CCDS13 ERPEVLHLTEPTTNISREKNQGFQDETKKGSLEVANQTPGLQRAFPAPAACQCHCKHMER
1890 1900 1910 1920 1930 1940
2180
pF1KE9 ------------------------SSASSSSSSSTSSSSSS-------------------
:.... . . .. :
CCDS13 WMHGLENDEFEIEKPKAYIPDLFKSKTNTIAMEGEPTAIPSQPFKVKHELLKEPWKESAE
1950 1960 1970 1980 1990 2000
2190 2200 2210 2220 2230
pF1KE9 ------------SSSSSEESDSDEEEAQKRAESTTHMKAY-----DEESVASLSTTQDET
: .::. : .... : ... : . : .::: .: : .
CCDS13 GQNVFPTYPLEGSELKSEDMDFENKDDYDR-DGNCHSQDYPGKYSEEESKSSTSGITGDI
2010 2020 2030 2040 2050 2060
2240 2250 2260 2270 2280 2290
pF1KE9 QDSFQMNNGTPESAYILQGGYMLAASYWPKDRVMINRLDSICQTVLKGKWPSARRSYDAN
: .: . .: : .:: . . : ::::::.:::::.::..::::::::... ..
CCDS13 GDELQ-EARAPTIAQLLQEKTLYSFSEWPKDRVIINRLDNICHVVLKGKWPSSQQYEPSG
2070 2080 2090 2100 2110 2120
2300 2310 2320 2330 2340
pF1KE9 TVASFYTTKLLDSPGAATEYSEPSVPTPP---GAGVKEEHDQSTQMSKEGGLKLTFQKQG
:. : : .: :. : ::: . ::.. ..:. ::. : .: :.
CCDS13 TLP---TPVLTSSAGSRTSLSEPEAAEHSFSNGAAL------AAQIHKESFLAPVFTKDE
2130 2140 2150 2160 2170
2350 2360 2370 2380
pF1KE9 LAQKRPFDGE---DG-ALGQQQYLTR---------------LRELQSASETS---LVNFP
..::.. : :. : : .:. . .:. .:: : ::
CCDS13 QKHRRPYEFEVERDAKARGLEQFSATHGHTPIILNGWHGESAMDLSCSSEGSPGATSPFP
2180 2190 2200 2210 2220 2230
2390 2400 2410 2420
pF1KE9 --KSIPVSG--TSIQPTLG-------------------ANGVILDNQPIVKKRRGRRKNV
: : : .:.: .:: .:: . .. ...::::::.:
CCDS13 VSASTPKIGAISSLQGALGMDLSGILQAGLIHPVTGQIVNGSLRRDDAATRRRRGRRKHV
2240 2250 2260 2270 2280 2290
2430 2440 2450 2460 2470 2480
pF1KE9 EG-VDIFFFNRNKPPNHVSLGLTSSQISTGINPALSYTQPQGI-PDTESPVPVINLKDGT
:: .:..:.... .. :. . . : . .:: :.:.: : : .: :. ..
CCDS13 EGGMDLIFLKEQT----LQAGILEVHEDPG-QATLSTTHPEGPGPATSAPEPATA---AS
2300 2310 2320 2330 2340
2490 2500 2510 2520 2530 2540
pF1KE9 RLAGDDAPKRKDLEKWLKEHPGYVEDLGAFIPRMQLHEGRPKQKRHRCRNPNKLDVNSLT
: . :. :.: ::... : .. .: .. .:::.: ::..:.::::.::.
CCDS13 SQAEKSIPS-KSLLDWLRQQADYSLEVPGFGANFS---DKPKQRRPRCKEPGKLDVSSLS
2350 2360 2370 2380 2390 2400
2550 2560 2570 2580 2590 2600
pF1KE9 GEERVQLINRRNARKVGGAFAPPLKDLCRFLKENSEYGVAPEWGDVVKQSGFLPESMYER
::::: : .. : :. :::::. ...
CCDS13 GEERVPAIPKE----------PGLR-------------------------GFLPENKFNH
2410 2420
2610 2620 2630 2640 2650
pF1KE9 ILTGPVVREE-VSRRGRRPKSGIAKATAAAAAASATSVSG-NPLLANGLLPGVDLTTLQA
:. :..:. ::::::.: . :: . .: : :: .::. :::. :.::. ::
CCDS13 TLAEPILRDTGPRRRGRRPRSELLKAPSIVA----DSPSGMGPLFMNGLIAGMDLVGLQ-
2430 2440 2450 2460 2470 2480
2660 2670 2680 2690 2700 2710
pF1KE9 LQQNLQNLQSLQVTAGLMGMPTG---LPSGGEAKNMAAMFPMLLSGMAGLPNLLGMGGLL
:..:. .. .: ::.:.:.: .:.: :.:.
CCDS13 ---NMRNMPGIPLT-GLVGFPAGFATMPTGEEVKSTLSMLPMMLPGMAAVPQMFGVGGLL
2490 2500 2510 2520 2530
2720 2730 2740 2750 2760 2770
pF1KE9 TKPTESGTEDKKGSDSKESEGKTERTESQSSENGGENSVSSSPSASSTAALNTAAAANPL
CCDS13 SPPMATTCTSTAPASLSSTTKSGTAVTEKTAEDKPSSHDVKTDTLAEDKPGPGPFSDQSE
2540 2550 2560 2570 2580 2590
>>CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905 aa)
initn: 1635 init1: 630 opt: 1602 Z-score: 951.0 bits: 189.9 E(32554): 1.2e-46
Smith-Waterman score: 1770; 37.2% identity (62.6% similar) in 958 aa overlap (715-1563:535-1467)
690 700 710 720 730 740
pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKDKRIQ
.::::....:: :: :..: :: :. . .
CCDS76 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF
510 520 530 540 550 560
750 760 770 780
pF1KE9 QKIKR-----------F-----KLRQAQ-RAHFFADMEEEPF----NPDYVEVDRVLEVS
.. .: : : :. . . ::.:::. . .:... . :.:. :
CCDS76 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILNHS
570 580 590 600 610 620
790 800 810 820 830
pF1KE9 FCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL----------QASRP
:: :. ..::.:: .:::....:: .:::.. . :.: . .::
CCDS76 V--DKK-GH--VHYLIKWRDLPYDQASWE-SEDVEIQDYDLFKQSYWNHRELMRGEEGRP
630 640 650 660 670
840 850 860 870
pF1KE9 DT-------RCLDRPPSNIWKKIDQSRDYK--------NGNQLREYQLEGLNWLLFNWYN
: :.::: . .: . :. .:. :. ::.:::::: :.: .
CCDS76 GKKLKKVKLRKLERPPET--PTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQ
680 690 700 710 720 730
880 890 900 910 920 930
pF1KE9 RRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWT-DINV
. :::::::::::.:. .::: . : .::::. :::::: ::::::. :. :. :
CCDS76 GTDTILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYV
740 750 760 770 780 790
940 950 960 970 980
pF1KE9 VVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGCGELN
:.: :. :: .:.. :. :.:. : . : : :....:..:.: . :.
CCDS76 VTYVGDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILG
800 810 820 830 840 850
990 1000 1010 1020 1030 1040
pF1KE9 AIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLR
.:.: :.:.::::::::.. :... :. ..:.::.:::::::::..:::: ::.:: : :
CCDS76 SIDWACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPER
860 870 880 890 900 910
1050 1060 1070 1080 1090 1100
pF1KE9 FPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQK
: . :..::.:. :.:..::. .: : :::::: :: :.. : : :..:::. .::
CCDS76 FHNLEGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQK
920 930 940 950 960 970
1110 1120 1130 1140 1150 1160
pF1KE9 KYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNP
:::. :: .:: :. .: ..: .:.:..:.:.::::::::. : . :.
CCDS76 KYYKYILTRNFEALNARGGGNQV-SLLNVVMDLKKCCNHPYLFPVAAMEAPKMPNGMYDG
980 990 1000 1010 1020 1030
1170 1180 1190 1200 1210 1220
pF1KE9 AASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYER
.: .:...:::.:..:.: ..: :::.:::::::.. ::.:::.: :. : :::
CCDS76 SA-------LIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYER
1040 1050 1060 1070 1080
1230 1240 1250 1260 1270 1280
pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ
::: . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:
CCDS76 IDGGITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQ
1090 1100 1110 1120 1130 1140
1290 1300 1310 1320 1330 1340
pF1KE9 AQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQL
: .: ::::::: : .::.::: : :... . :. :. : . :.. : :..:. .
CCDS76 AFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLG--SKTGS---M
1150 1160 1170 1180 1190 1200
1350 1360 1370 1380 1390
pF1KE9 SKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID-----------QILLRRTKTITIESEG
::.:..:.:. :. . .: .:. .: : . :: :.. : ..:
CCDS76 SKQELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTEL
1210 1220 1230 1240 1250 1260
1400 1410 1420 1430
pF1KE9 RG-----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAEIDIEAISG
.: :.: :..:. :.. .. . ::..:.: .. . . .
CCDS76 QGMNEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLA
1270 1280 1290 1300 1310 1320
1440 1450 1460 1470 1480
pF1KE9 RNSLVIDTPRIRKQTRPFSATK----------DELAELSEAESEGDE-----KPKLRRPC
:: . :::::. .... :. .. : : :::: . :::
CCDS76 RN--LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPS
1330 1340 1350 1360 1370 1380
1490 1500 1510 1520 1530
pF1KE9 DRSNGYGRTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRAL
.. . . . :: :. : :.. : :. . .. .. . .:. . . : :
CCDS76 RKGLRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDL
1390 1400 1410 1420 1430 1440
1540 1550 1560 1570 1580 1590
pF1KE9 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD
. .... .. :. : : ::
CCDS76 RGKSEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKV
1450 1460 1470 1480 1490
>>CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912 aa)
initn: 1635 init1: 630 opt: 1602 Z-score: 951.0 bits: 189.9 E(32554): 1.2e-46
Smith-Waterman score: 1770; 37.2% identity (62.6% similar) in 958 aa overlap (715-1563:542-1474)
690 700 710 720 730 740
pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKDKRIQ
.::::....:: :: :..: :: :. . .
CCDS85 QPPSPTPVPRPPDADPNTPSPKPLEGRPERQFFVKWQGMSYWHCSWVSELQLELHCQVMF
520 530 540 550 560 570
750 760 770 780
pF1KE9 QKIKR-----------F-----KLRQAQ-RAHFFADMEEEPF----NPDYVEVDRVLEVS
.. .: : : :. . . ::.:::. . .:... . :.:. :
CCDS85 RNYQRKNDMDEPPSGDFGGDEEKSRKRKNKDPKFAEMEERFYRYGIKPEWMMIHRILNHS
580 590 600 610 620 630
790 800 810 820 830
pF1KE9 FCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL----------QASRP
:: :. ..::.:: .:::....:: .:::.. . :.: . .::
CCDS85 V--DKK-GH--VHYLIKWRDLPYDQASWE-SEDVEIQDYDLFKQSYWNHRELMRGEEGRP
640 650 660 670 680
840 850 860 870
pF1KE9 DT-------RCLDRPPSNIWKKIDQSRDYK--------NGNQLREYQLEGLNWLLFNWYN
: :.::: . .: . :. .:. :. ::.:::::: :.: .
CCDS85 GKKLKKVKLRKLERPPET--PTVDPTVKYERQPEYLDATGGTLHPYQMEGLNWLRFSWAQ
690 700 710 720 730 740
880 890 900 910 920 930
pF1KE9 RRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWT-DINV
. :::::::::::.:. .::: . : .::::. :::::: ::::::. :. :. :
CCDS85 GTDTILADEMGLGKTVQTAVFLYSLYKEGHSKGPFLVSAPLSTIINWEREFEMWAPDMYV
750 760 770 780 790 800
940 950 960 970 980
pF1KE9 VVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGCGELN
:.: :. :: .:.. :. :.:. : . : : :....:..:.: . :.
CCDS85 VTYVGDKDSRAIIRENEFSFEDNAIRGGKKASRMKKEASVKFHVLLTSYELITIDMAILG
810 820 830 840 850 860
990 1000 1010 1020 1030 1040
pF1KE9 AIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFLEPLR
.:.: :.:.::::::::.. :... :. ..:.::.:::::::::..:::: ::.:: : :
CCDS85 SIDWACLIVDEAHRLKNNQSKFFRVLNGYSLQHKLLLTGTPLQNNLEELFHLLNFLTPER
870 880 890 900 910 920
1050 1060 1070 1080 1090 1100
pF1KE9 FPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELTNIQK
: . :..::.:. :.:..::. .: : :::::: :: :.. : : :..:::. .::
CCDS85 FHNLEGFLEEFADIAKEDQIKKLHDMLGPHMLRRLKADVFKNMPSKTELIVRVELSPMQK
930 940 950 960 970 980
1110 1120 1130 1140 1150 1160
pF1KE9 KYYRAILEKNFSFLSKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFRDTYNP
:::. :: .:: :. .: ..: .:.:..:.:.::::::::. : . :.
CCDS85 KYYKYILTRNFEALNARGGGNQV-SLLNVVMDLKKCCNHPYLFPVAAMEAPKMPNGMYDG
990 1000 1010 1020 1030 1040
1170 1180 1190 1200 1210 1220
pF1KE9 AASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKRYLYER
.: .:...:::.:..:.: ..: :::.:::::::.. ::.:::.: :. : :::
CCDS85 SA-------LIRASGKLLLLQKMLKNLKEGGHRVLIFSQMTKMLDLLEDFLEHEGYKYER
1050 1060 1070 1080 1090
1230 1240 1250 1260 1270 1280
pF1KE9 IDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNPQNDLQ
::: . ::.:: :::::. : ...: ::: ::::::::::..::: ::.::::::.::.:
CCDS85 IDGGITGNMRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIYDSDWNPHNDIQ
1100 1110 1120 1130 1140 1150
1290 1300 1310 1320 1330 1340
pF1KE9 AQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVGGIQQL
: .: ::::::: : .::.::: : :... . :. :. : . :.. : :..:. .
CCDS85 AFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKKKMMLTHLVVRPGLG--SKTGS---M
1160 1170 1180 1190 1200 1210
1350 1360 1370 1380 1390
pF1KE9 SKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDID-----------QILLRRTKTITIESEG
::.:..:.:. :. . .: .:. .: : . :: :.. : ..:
CCDS85 SKQELDDILKFGTEELFKDEATDGGGDNKEGEDSSVIHYDDKAIERLLDRNQDETEDTEL
1220 1230 1240 1250 1260 1270
1400 1410 1420 1430
pF1KE9 RG-----STFAKASFVAS----GNRTDISLD--------DPNFWQKWAKKAEIDIEAISG
.: :.: :..:. :.. .. . ::..:.: .. . . .
CCDS85 QGMNEYLSSFKVAQYVVREEEMGEEEEVEREIIKQEESVDPDYWEKLLRHHYEQQQEDLA
1280 1290 1300 1310 1320 1330
1440 1450 1460 1470 1480
pF1KE9 RNSLVIDTPRIRKQTRPFSATK----------DELAELSEAESEGDE-----KPKLRRPC
:: . :::::. .... :. .. : : :::: . :::
CCDS85 RN--LGKGKRIRKQVNYNDGSQEDRDWQDDQSDNQSDYSVASEEGDEDFDERSEAPRRPS
1340 1350 1360 1370 1380
1490 1500 1510 1520 1530
pF1KE9 DRSNGYGRTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRAL
.. . . . :: :. : :.. : :. . .. .. . .:. . . : :
CCDS85 RKGLRNDKDKPLPPLLARVGGNIEVLGFNARQRKAFLNAIMRYGMPPQDAFTTQWLVRDL
1390 1400 1410 1420 1430 1440
1540 1550 1560 1570 1580 1590
pF1KE9 LAYCLVHYRGDEKIKGFIWDLITPTEDGQTRELQNHLGLSAPVPRGRKGKKVKTQTSSFD
. .... .. :. : : ::
CCDS85 RGKSEKEFKA--YVSLFMRHLCEPGADGAETFADGVPREGLSRQHVLTRIGVMSLIRKKV
1450 1460 1470 1480 1490 1500
>>CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954 aa)
initn: 1550 init1: 609 opt: 1577 Z-score: 936.2 bits: 187.2 E(32554): 8e-46
Smith-Waterman score: 1716; 41.9% identity (68.6% similar) in 725 aa overlap (711-1371:506-1207)
690 700 710 720 730
pF1KE9 VENPSEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-LKD
: .:::::. . :: :: :. : :: :
CCDS57 RWTEPPAPFMVGLPGPDVEPSLPPPKPLEGIPEREFFVKWAGLSYWHCSWVKELQLELYH
480 490 500 510 520 530
740 750 760 770
pF1KE9 KRIQQKIKR---------FKL----------RQAQRAHFFADMEEEPF----NPDYVEVD
. .. .: : .. .. ..: :::. . .:... .
CCDS57 TVMYRNYQRKNDMDEPPPFDYGSGDEDGKSEKRKNKDPLYAKMEERFYRYGIKPEWMMIH
540 550 560 570 580 590
780 790 800 810 820
pF1KE9 RVLEVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQL---------
:.:. :: :: :. ..::.:: .:::.. :::. .:.:. ....:
CCDS57 RILNHSF--DKK-GD--VHYLIKWKDLPYDQCTWEI-DDIDIPYYDNLKQAYWGHRELML
600 610 620 630 640
830 840 850 860
pF1KE9 -QASRPDTRCL-----------DRPPS----NIWKKIDQSRDY--KNGNQLREYQLEGLN
. .: : : ..::. . :.:.. : ..:. :. :::::::
CCDS57 GEDTRLPKRLLKKGKKLRDDKQEKPPDTPIVDPTVKFDKQPWYIDSTGGTLHPYQLEGLN
650 660 670 680 690 700
870 880 890 900 910 920
pF1KE9 WLLFNWYNRRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFR
:: :.: . . :::::::::::.:.:.::: . : .::.:. :::::: ::::::.
CCDS57 WLRFSWAQGTDTILADEMGLGKTVQTIVFLYSLYKEGHSKGPYLVSAPLSTIINWEREFE
710 720 730 740 750 760
930 940 950 960 970
pF1KE9 TWT-DINVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMI
:. :. ::.: :. ::..:.. :. :.:. : . ..: :....:..:.:
CCDS57 MWAPDFYVVTYTGDKESRSVIRENEFSFEDNAIRSGKKVFRMKKEVQIKFHVLLTSYELI
770 780 790 800 810 820
980 990 1000 1010 1020 1030
pF1KE9 LGGCGELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSL
. :..::: :...::::::::.. :... :. .....:.:::::::::..:::: :
CCDS57 TIDQAILGSIEWACLVVDEAHRLKNNQSKFFRVLNSYKIDYKLLLTGTPLQNNLEELFHL
830 840 850 860 870 880
1040 1050 1060 1070 1080 1090
pF1KE9 LHFLEPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIE
:.:: : :: . :..::.:.. :.:..::. .: : :::::: :: :.. : : :..
CCDS57 LNFLTPERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVR
890 900 910 920 930 940
1100 1110 1120 1130 1140 1150
pF1KE9 VELTNIQKKYYRAILEKNFSFL-SKGAGQTNVPNLVNTMMELRKCCNHPYL--IKGAEEK
:::...:::::. :: .:: : :::.: : .:.: ::.:.:::::::: . ..:
CCDS57 VELSQMQKKYYKFILTRNFEALNSKGGG--NQVSLLNIMMDLKKCCNHPYLFPVAAVEAP
950 960 970 980 990 1000
1160 1170 1180 1190 1200 1210
pF1KE9 ILGEFRDTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILED
.: : .: . .....:.:::.:..:.: :.. ::.:::::::.. ::.:::
CCDS57 VL--------PNGS-YDGSSLVKSSGKLMLLQKMLKKLRDEGHRVLIFSQMTKMLDLLED
1010 1020 1030 1040 1050
1220 1230 1240 1250 1260 1270
pF1KE9 YLIHKRYLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIF
.: .. : :::::: . :.::: :::::. : ...: ::: ::::::::::..::: ::.
CCDS57 FLEYEGYKYERIDGGITGGLRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIY
1060 1070 1080 1090 1100 1110
1280 1290 1300 1310 1320 1330
pF1KE9 DSDWNPQNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSG
::::::.::.:: .: ::::::: : .::.::: : :... . :. :. : . :.. :
CCDS57 DSDWNPHNDIQAFSRAHRIGQNKKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRPGLG
1120 1130 1140 1150 1160 1170
1340 1350 1360 1370 1380 1390
pF1KE9 RESNVGGIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQILLRRTKTITIESEG
.:. ...:.:..:.:. :. ..... ::
CCDS57 SKSG-----SMTKQELDDILKFGTE-ELFKDDVEGMMSQGQRPVTPIPDVQSSKGGNLAA
1180 1190 1200 1210 1220 1230
1400 1410 1420 1430 1440 1450
pF1KE9 RGSTFAKASFVASGNRTDISLDDPNFWQKWAKKAEIDIEAISGRNSLVIDTPRIRKQTRP
CCDS57 SAKKKHGSTPPGDNKDVEDSSVIHYDDAAISKLLDRNQDATDDTELQNMNEYLSSFKVAQ
1240 1250 1260 1270 1280 1290
>>CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966 aa)
initn: 1557 init1: 604 opt: 1577 Z-score: 936.1 bits: 187.2 E(32554): 8e-46
Smith-Waterman score: 1744; 37.1% identity (62.7% similar) in 993 aa overlap (715-1601:549-1512)
690 700 710 720 730
pF1KE9 SEEDAAIVDKILSSRTVKKEISPGVMIDTEEFFVKYKNYSYLHCEWATEEQL-----LKD
:::::. . :: :: :: : :: .
CCDS32 EPPVAVPAPQQADGNPDVPPPRPLQGRSEREFFVKWVGLSYWHCSWAKELQLEIFHLVMY
520 530 540 550 560 570
740 750 760 770
pF1KE9 KRIQQKIK----------------RFKLRQAQRAHFFADMEEEPF----NPDYVEVDRVL
. :.: . :... :. :.:::. . .:... : :..
CCDS32 RNYQRKNDMDEPPPLDYGSGEDDGKSDKRKVKDPHY-AEMEEKYYRFGIKPEWMTVHRII
580 590 600 610 620 630
780 790 800 810 820 830
pF1KE9 EVSFCEDKDTGEPVIYYLVKWCSLPYEDSTWELKEDVDLAKIEEFEQ--------LQASR
. : :: :. .::::: .:::..:::: ...... . :: .: ...
CCDS32 NHSV--DKK-GN--YHYLVKWRDLPYDQSTWE-EDEMNIPEYEEHKQSYWRHRELIMGED
640 650 660 670 680 690
840 850 860 870
pF1KE9 P--------DTRCL--DRPPSNIWKKIDQSRDYKN--------GNQLREYQLEGLNWLLF
: . : : :::. : . :.. :. :. ::::::::: :
CCDS32 PAQPRKYKKKKKELQGDGPPSS--PTNDPTVKYETQPRFITATGGTLHMYQLEGLNWLRF
700 710 720 730 740
880 890 900 910 920 930
pF1KE9 NWYNRRNCILADEMGLGKTIQSITFLYEILLTG-IRGPFLIIAPLSTIANWEREFRTWTD
.: . . :::::::::::::.:.::: . : .::::. :::::: ::::::. :.
CCDS32 SWAQGTDTILADEMGLGKTIQTIVFLYSLYKEGHTKGPFLVSAPLSTIINWEREFQMWAP
750 760 770 780 790 800
940 950 960 970 980
pF1KE9 -INVVVYHGSLISRQMIQQYEMYFRDSQGRIIRGAYR--------FQAIITTFEMILGGC
. ::.: :. :: .:.. :. :.:. . . :.. :....:..:.:
CCDS32 KFYVVTYTGDKDSRAIIRENEFSFEDNAIKGGKKAFKMKREAQVKFHVLLTSYELITIDQ
810 820 830 840 850 860
990 1000 1010 1020 1030 1040
pF1KE9 GELNAIEWRCVIIDEAHRLKNKNCKLLEGLKLMNLEHKVLLTGTPLQNTVEELFSLLHFL
. :..:.: :...::::::::.. :... :. ....::.:::::::::..:::: ::.::
CCDS32 AALGSIRWACLVVDEAHRLKNNQSKFFRVLNGYKIDHKLLLTGTPLQNNLEELFHLLNFL
870 880 890 900 910 920
1050 1060 1070 1080 1090 1100
pF1KE9 EPLRFPSESTFMQEFGDLKTEEQVQKLQAILKPMMLRRLKEDVEKKLAPKEETIIEVELT
: :: . :..::.:.. :.:..::. .: : :::::: :: :.. : : :..:::.
CCDS32 TPERFNNLEGFLEEFADISKEDQIKKLHDLLGPHMLRRLKADVFKNMPAKTELIVRVELS
930 940 950 960 970 980
1110 1120 1130 1140 1150 1160
pF1KE9 NIQKKYYRAILEKNFSFL-SKGAGQTNVPNLVNTMMELRKCCNHPYLIKGAEEKILGEFR
.:::::. :: .:: : :.:.: : .:.: ::.:.::::::::. .. ..
CCDS32 PMQKKYYKYILTRNFEALNSRGGG--NQVSLLNIMMDLKKCCNHPYLFP------VAAME
990 1000 1010 1020 1030 1040
1170 1180 1190 1200 1210 1220
pF1KE9 DTYNPAASDFHLQAMIQSAGKLVLIDKLLPKMKAGGHKVLIFSQMVRCLDILEDYLIHKR
. :... .. :.:.:.:::.:..:.: :.: ::.:::::::.. ::.:::.: ..
CCDS32 SPKLPSGA-YEGGALIKSSGKLMLLQKMLRKLKEQGHRVLIFSQMTKMLDLLEDFLDYEG
1050 1060 1070 1080 1090 1100
1230 1240 1250 1260 1270 1280
pF1KE9 YLYERIDGRVRGNLRQAAIDRFSKPDSDRFVFLLCTRAGGLGINLTAADTCIIFDSDWNP
: :::::: . : ::: :::::. : ...: ::: ::::::::::..::: :::::::::
CCDS32 YKYERIDGGITGALRQEAIDRFNAPGAQQFCFLLSTRAGGLGINLATADTVIIFDSDWNP
1110 1120 1130 1140 1150 1160
1290 1300 1310 1320 1330 1340
pF1KE9 QNDLQAQARCHRIGQNKAVKVYRLVTRNSYEREMFDRASLKLGLDKAVLQSMSGRESNVG
.::.:: .: ::::: . : .::.::: : :... . :. :. : . :.. : :..:
CCDS32 HNDIQAFSRAHRIGQANKVMIYRFVTRASVEERITQVAKRKMMLTHLVVRP--GLGSKAG
1170 1180 1190 1200 1210
1350 1360 1370 1380 1390
pF1KE9 GIQQLSKKEIEDLLRRGAYGAIMEEEDEGSKFCEEDIDQI---------LLRRTKTITIE
. .::.:..:.:. :. ....:.:: . ::: . : :: :.. : .
CCDS32 S---MSKQELDDILKFGTE-ELFKDENEGEN-KEEDSSVIHYDNEAIARLLDRNQDATED
1220 1230 1240 1250 1260 1270
1400 1410 1420 1430
pF1KE9 SEGRG-----STFAKASFVASGN-------RTDISLD---DPNFWQKWAKKAEIDIEAIS
.. .. :.: :..:. . : :. . ::..:.: .. . .
CCDS32 TDVQNMNEYLSSFKVAQYVVREEDKIEEIEREIIKQEENVDPDYWEKLLRHHYEQQQEDL
1280 1290 1300 1310 1320 1330
1440 1450 1460 1470 1480 1490
pF1KE9 GRNSLVIDTPRIRKQTRPFSATK---DELAELS---EAESEG-DEKPKLRRPCDRSNGYG
.:: . :.:::. .:.. :. .: : : :.: ::.:. :: :.
CCDS32 ARN--LGKGKRVRKQVNYNDAAQEDQDNQSEYSVGSEEEDEDFDERPEGRRQSKRQLRNE
1340 1350 1360 1370 1380 1390
1500 1510 1520 1530 1540
pF1KE9 RTECF-----RVEKNLLVYGWG-RWREILSHGRFKRQLNEHDV---EIICRALLAYCLVH
. . . :: :. : :.. : :. . .. .. . .:. . . : : . .
CCDS32 KDKPLPPLLARVGGNIEVLGFNTRQRKAFLNAVMRWGMPPQDAFTTQWLVRDLRGKTEKE
1400 1410 1420 1430 1440 1450
1550 1560 1570 1580 1590
pF1KE9 YRGDEKIKGFIWDLITPTEDGQTRELQN--HLGLSAPVPRGRKG--KKVKTQTSSFDIQK
... .. :. : : ::. .. . ::: : : . :: ... :. .
CCDS32 FKA--YVSLFMRHLCEPGADGSETFADGVPREGLSRQQVLTRIGVMSLVKKKVQEFEHIN
1460 1470 1480 1490 1500
1600 1610 1620 1630 1640 1650
pF1KE9 AEWLRKYNPEQLLQDEGYKKHIKHHCNKVLLRVRMLYYLKQEVIGNECQKVFDGVDASDI
..:
CCDS32 GRWSMPELMPDPSADSKRSSRASSPTKTSPTTPEASATNSPCTSKPATPAPSEKGEGIRT
1510 1520 1530 1540 1550 1560
2882 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:28:07 2016 done: Mon Nov 7 19:28:08 2016
Total Scan time: 7.170 Total Display time: 2.770
Function used was FASTA [36.3.4 Apr, 2011]