FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9670, 3230 aa
1>>>pF1KE9670 3230 - 3230 aa - 3230 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 14.6704+/-0.00123; mu= -12.1574+/- 0.074
mean_var=683.0692+/-140.712, 0's: 0 Z-trim(116.5): 163 B-trim: 0 in 0/54
Lambda= 0.049073
statistics sampled from 16999 (17154) to 16999 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.767), E-opt: 0.2 (0.527), width: 16
Scan time: 10.720
The best scores are: opt bits E(32554)
CCDS10689.2 SRCAP gene_id:10847|Hs108|chr16 (3230) 21602 1546.9 0
CCDS31929.2 EP400 gene_id:57634|Hs108|chr12 (3123) 1609 131.4 8.9e-29
CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 919 82.1 2.1e-14
CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054) 916 81.9 2.4e-14
CCDS76018.1 SMARCA1 gene_id:6594|Hs108|chrX (1058) 916 81.9 2.4e-14
CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070) 916 81.9 2.4e-14
CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 848 77.3 9e-13
CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 848 77.3 9.1e-13
CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 822 75.5 3.3e-12
CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 822 75.5 3.3e-12
CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 822 75.5 3.3e-12
CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 822 75.5 3.3e-12
CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 822 75.5 3.3e-12
>>CCDS10689.2 SRCAP gene_id:10847|Hs108|chr16 (3230 aa)
initn: 21602 init1: 21602 opt: 21602 Z-score: 8279.6 bits: 1546.9 E(32554): 0
Smith-Waterman score: 21602; 100.0% identity (100.0% similar) in 3230 aa overlap (1-3230:1-3230)
10 20 30 40 50 60
pF1KE9 MQSSPSPAHPQLPVLQTQMVSDGMTGSNPVSPASSSSPASSGAGGISPQHIAQDSSLDGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MQSSPSPAHPQLPVLQTQMVSDGMTGSNPVSPASSSSPASSGAGGISPQHIAQDSSLDGP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 PGPPDGATVPLEGFSLSQAADLANKGPKWEKSHAEIAEQAKHEAEIETRIAELRKEGFWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PGPPDGATVPLEGFSLSQAADLANKGPKWEKSHAEIAEQAKHEAEIETRIAELRKEGFWS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 LKRLPKVPEPPRPKGHWDYLCEEMQWLSADFAQERRWKRGVARKVVRMVIRHHEEQRQKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LKRLPKVPEPPRPKGHWDYLCEEMQWLSADFAQERRWKRGVARKVVRMVIRHHEEQRQKE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 ERARREEQAKLRRIASTMAKDVRQFWSNVEKVVQFKQQSRLEEKRKKALDLHLDFIVGQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ERARREEQAKLRRIASTMAKDVRQFWSNVEKVVQFKQQSRLEEKRKKALDLHLDFIVGQT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 EKYSDLLSQSLNQPLTSSKAGSSPCLGSSSAASSPPPPASRLDDEDGDFQPQEDEEEDDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EKYSDLLSQSLNQPLTSSKAGSSPCLGSSSAASSPPPPASRLDDEDGDFQPQEDEEEDDE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 ETIEVEEQQEGNDAEAQRREIELLRREGELPLEELLRSLPPQLLEGPSSPSQTPSSHDSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ETIEVEEQQEGNDAEAQRREIELLRREGELPLEELLRSLPPQLLEGPSSPSQTPSSHDSD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 TRDGPEEGAEEEPPQVLEIKPPPSAVTQRNKQPWHPDEDDEEFTANEEEAEDEEDTIAAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 TRDGPEEGAEEEPPQVLEIKPPPSAVTQRNKQPWHPDEDDEEFTANEEEAEDEEDTIAAE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 EQLEGEVDHAMELSELAREGELSMEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EQLEGEVDHAMELSELAREGELSMEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 GPVEAEEPPQEDSSSQSDSVEDRSEDEEDEHSEEEETSGSSASEESESEESEDAQSQSQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GPVEAEEPPQEDSSSQSDSVEDRSEDEEDEHSEEEETSGSSASEESESEESEDAQSQSQA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 DEEEEDDDFGVEYLLARDEEQSEADAGSGPPTPGPTTLGPKKEITDIAAAAESLQPKGYT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DEEEEDDDFGVEYLLARDEEQSEADAGSGPPTPGPTTLGPKKEITDIAAAAESLQPKGYT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 LATTQVKTPIPLLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LATTQVKTPIPLLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 ACEKGNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ACEKGNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHV
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 CITSYKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CITSYKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQN
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 SLMELWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SLMELWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRR
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 VKVDVEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQTTTKETLATGHFMSVINILMQLRKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VKVDVEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQTTTKETLATGHFMSVINILMQLRKV
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 CNHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 CNHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE9 DTFLPRHRLSRRVLLEVATAPDPPPRPKPVKMKVNRMLQPVPKQEGRTVVVVNNPRAPLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DTFLPRHRLSRRVLLEVATAPDPPPRPKPVKMKVNRMLQPVPKQEGRTVVVVNNPRAPLG
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE9 PVPVRPPPGPELSAQPTPGPVPQVLPASLMVSASPAGPPLIPASRPPGPVLLPPLQPNSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PVPVRPPPGPELSAQPTPGPVPQVLPASLMVSASPAGPPLIPASRPPGPVLLPPLQPNSG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE9 SLPQVLPSPLGVLSGTSRPPTPTLSLKPTPPAPVRLSPAPPPGSSSLLKPLTVPPGYTFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SLPQVLPSPLGVLSGTSRPPTPTLSLKPTPPAPVRLSPAPPPGSSSLLKPLTVPPGYTFP
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE9 PAAATTTSTTTATATTTAVPAPTPAPQRLILSPDMQARLPSGEVVSIGQLASLAQRPVAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PAAATTTSTTTATATTTAVPAPTPAPQRLILSPDMQARLPSGEVVSIGQLASLAQRPVAN
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE9 AGGSKPLTFQIQGNKLTLTGAQVRQLAVGQPRPLQRNVVHLVSAGGQHHLISQPAHVALI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AGGSKPLTFQIQGNKLTLTGAQVRQLAVGQPRPLQRNVVHLVSAGGQHHLISQPAHVALI
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE9 QAVAPTPGPTPVSVLPSSTPSTTPAPTGLSLPLAANQVPPTMVNNTGVVKIVVRQAPRDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QAVAPTPGPTPVSVLPSSTPSTTPAPTGLSLPLAANQVPPTMVNNTGVVKIVVRQAPRDG
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE9 LTPVPPLAPAPRPPSSGLPAVLNPRPTLTPGRLPTPTLGTARAPMPTPTLVRPLLKLVHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LTPVPPLAPAPRPPSSGLPAVLNPRPTLTPGRLPTPTLGTARAPMPTPTLVRPLLKLVHS
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE9 PSPEVSASAPGAAPLTISSPLHVPSSLPGPASSPMPIPNSSPLASPVSSTVSVPLSSSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PSPEVSASAPGAAPLTISSPLHVPSSLPGPASSPMPIPNSSPLASPVSSTVSVPLSSSLP
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KE9 ISVPTTLPAPASAPLTIPISAPLTVSASGPALLTSVTPPLAPVVPAAPGPPSLAPSGASP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ISVPTTLPAPASAPLTIPISAPLTVSASGPALLTSVTPPLAPVVPAAPGPPSLAPSGASP
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KE9 SASALTLGLATAPSLSSSQTPGHPLLLAPTSSHVPGLNSTVAPACSPVLVPASALASPFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SASALTLGLATAPSLSSSQTPGHPLLLAPTSSHVPGLNSTVAPACSPVLVPASALASPFP
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KE9 SAPNPAPAQASLLAPASSASQALATPLAPMAAPQTAILAPSPAPPLAPLPVLAPSPGAAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SAPNPAPAQASLLAPASSASQALATPLAPMAAPQTAILAPSPAPPLAPLPVLAPSPGAAP
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KE9 VLASSQTPVPVMAPSSTPGTSLASASPVPAPTPVLAPSSTQTMLPAPVPSPLPSPASTQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VLASSQTPVPVMAPSSTPGTSLASASPVPAPTPVLAPSSTQTMLPAPVPSPLPSPASTQT
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KE9 LALAPALAPTLGGSSPSQTLSLGTGNPQGPFPTQTLSLTPASSLVPTPAQTLSLAPGPPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LALAPALAPTLGGSSPSQTLSLGTGNPQGPFPTQTLSLTPASSLVPTPAQTLSLAPGPPL
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KE9 GPTQTLSLAPAPPLAPASPVGPAPAHTLTLAPASSSASLLAPASVQTLTLSPAPVPTLGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GPTQTLSLAPAPPLAPASPVGPAPAHTLTLAPASSSASLLAPASVQTLTLSPAPVPTLGP
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KE9 AAAQTLALAPASTQSPASQASSLVVSASGAAPLPVTMVSRLPVSKDEPDTLTLRSGPPSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AAAQTLALAPASTQSPASQASSLVVSASGAAPLPVTMVSRLPVSKDEPDTLTLRSGPPSP
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KE9 PSTATSFGGPRPRRQPPPPPRSPFYLDSLEEKRKRQRSERLERIFQLSEAHGALAPVYGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PSTATSFGGPRPRRQPPPPPRSPFYLDSLEEKRKRQRSERLERIFQLSEAHGALAPVYGT
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KE9 EVLDFCTLPQPVASPIGPRSPGPSHPTFWTYTEAAHRAVLFPQQRLDQLSEIIERFIFVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EVLDFCTLPQPVASPIGPRSPGPSHPTFWTYTEAAHRAVLFPQQRLDQLSEIIERFIFVM
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KE9 PPVEAPPPSLHACHPPPWLAPRQAAFQEQLASELWPRARPLHRIVCNMRTQFPDLRLIQY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PPVEAPPPSLHACHPPPWLAPRQAAFQEQLASELWPRARPLHRIVCNMRTQFPDLRLIQY
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KE9 DCGKLQTLAVLLRQLKAEGHRVLIFTQMTRMLDVLEQFLTYHGHLYLRLDGSTRVEQRQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 DCGKLQTLAVLLRQLKAEGHRVLIFTQMTRMLDVLEQFLTYHGHLYLRLDGSTRVEQRQA
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KE9 LMERFNADKRIFCFILSTRSGGVGVNLTGADTVVFYDSDWNPTMDAQAQDRCHRIGQTRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LMERFNADKRIFCFILSTRSGGVGVNLTGADTVVFYDSDWNPTMDAQAQDRCHRIGQTRD
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KE9 VHIYRLISERTVEENILKKANQKRMLGDMAIEGGNFTTAYFKQQTIRELFDMPLEEPSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VHIYRLISERTVEENILKKANQKRMLGDMAIEGGNFTTAYFKQQTIRELFDMPLEEPSSS
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KE9 SVPSAPEEEEETVASKQTHILEQALCRAEDEEDIRAATQAKAEQVAELAEFNENDGFPAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SVPSAPEEEEETVASKQTHILEQALCRAEDEEDIRAATQAKAEQVAELAEFNENDGFPAG
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KE9 EGEEAGRPGAEDEEMSRAEQEIAALVEQLTPIERYAMKFLEASLEEVSREELKQAEEQVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EGEEAGRPGAEDEEMSRAEQEIAALVEQLTPIERYAMKFLEASLEEVSREELKQAEEQVE
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KE9 AARKDLDQAKEEVFRLPQEEEEGPGAGDESSCGTGGGTHRRSKKAKAPERPGTRVSERLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 AARKDLDQAKEEVFRLPQEEEEGPGAGDESSCGTGGGTHRRSKKAKAPERPGTRVSERLR
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KE9 GARAETQGANHTPVISAHQTRSTTTPPRCSPARERVPRPAPRPRPTPASAPAAIPALVPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 GARAETQGANHTPVISAHQTRSTTTPPRCSPARERVPRPAPRPRPTPASAPAAIPALVPV
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KE9 PVSAPVPISAPNPITILPVHILPSPPPPSQIPPCSSPACTPPPACTPPPAHTPPPAQTCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PVSAPVPISAPNPITILPVHILPSPPPPSQIPPCSSPACTPPPACTPPPAHTPPPAQTCL
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KE9 VTPSSPLLLGPPSVPISASVTNLPLGLRPEAELCAQALASPESLELASVASSETSSLSLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VTPSSPLLLGPPSVPISASVTNLPLGLRPEAELCAQALASPESLELASVASSETSSLSLV
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KE9 PPKDLLPVAVEILPVSEKNLSLTPSAPSLTLEAGSIPNGQEQEAPDSAEGTTLTVLPEGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PPKDLLPVAVEILPVSEKNLSLTPSAPSLTLEAGSIPNGQEQEAPDSAEGTTLTVLPEGE
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KE9 ELPLCVSESNGLELPPSAASDEPLQEPLEADRTSEELTEAKTPTSSPEKPQELVTAEVAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ELPLCVSESNGLELPPSAASDEPLQEPLEADRTSEELTEAKTPTSSPEKPQELVTAEVAA
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750 2760
pF1KE9 PSTSSSATSSPEGPSPARPPRRRTSADVEIRGQGTGRPGQPPGPKVLRKLPGRLVTVVEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PSTSSSATSSPEGPSPARPPRRRTSADVEIRGQGTGRPGQPPGPKVLRKLPGRLVTVVEE
2710 2720 2730 2740 2750 2760
2770 2780 2790 2800 2810 2820
pF1KE9 KELVRRRRQQRGAASTLVPGVSETSASPGSPSVRSMSGPESSPPIGGPCEAAPSSSLPTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 KELVRRRRQQRGAASTLVPGVSETSASPGSPSVRSMSGPESSPPIGGPCEAAPSSSLPTP
2770 2780 2790 2800 2810 2820
2830 2840 2850 2860 2870 2880
pF1KE9 PQQPFIARRHIELGVTGGGSPENGDGALLAITPPAVKRRRGRPPKKNRSPADAGRGVDEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PQQPFIARRHIELGVTGGGSPENGDGALLAITPPAVKRRRGRPPKKNRSPADAGRGVDEA
2830 2840 2850 2860 2870 2880
2890 2900 2910 2920 2930 2940
pF1KE9 PSSTLKGKTNGADPVPGPETLIVADPVLEPQLIPGPQPLGPQPVHRPNPLLSPVEKRRRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 PSSTLKGKTNGADPVPGPETLIVADPVLEPQLIPGPQPLGPQPVHRPNPLLSPVEKRRRG
2890 2900 2910 2920 2930 2940
2950 2960 2970 2980 2990 3000
pF1KE9 RPPKARDLPIPGTISSAGDGNSESRTQPPPHPSPLTPLPPLLVCPTATVANTVTTVTIST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RPPKARDLPIPGTISSAGDGNSESRTQPPPHPSPLTPLPPLLVCPTATVANTVTTVTIST
2950 2960 2970 2980 2990 3000
3010 3020 3030 3040 3050 3060
pF1KE9 SPPKRKRGRPPKNPPSPRPSQLPVLDRDSTSVLESCGLGRRRQPQGQGESEGSSSDEDGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SPPKRKRGRPPKNPPSPRPSQLPVLDRDSTSVLESCGLGRRRQPQGQGESEGSSSDEDGS
3010 3020 3030 3040 3050 3060
3070 3080 3090 3100 3110 3120
pF1KE9 RPLTRLARLRLEAEGMRGRKSGGSMVVAVIQDDLDLADSGPGGLELTPPVVSLTPKLRST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RPLTRLARLRLEAEGMRGRKSGGSMVVAVIQDDLDLADSGPGGLELTPPVVSLTPKLRST
3070 3080 3090 3100 3110 3120
3130 3140 3150 3160 3170 3180
pF1KE9 RLRPGSLVPPLETEKLPRKRAGAPVGGSPGLAKRGRLQPPSPLGPEGSVEESEAEASGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RLRPGSLVPPLETEKLPRKRAGAPVGGSPGLAKRGRLQPPSPLGPEGSVEESEAEASGEE
3130 3140 3150 3160 3170 3180
3190 3200 3210 3220 3230
pF1KE9 EEGDGTPRRRPGPRRLVGTTNQGDQRILRSSAPPSLAGPAVSHRGRKAKT
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 EEGDGTPRRRPGPRRLVGTTNQGDQRILRSSAPPSLAGPAVSHRGRKAKT
3190 3200 3210 3220 3230
>>CCDS31929.2 EP400 gene_id:57634|Hs108|chr12 (3123 aa)
initn: 3162 init1: 863 opt: 1609 Z-score: 630.1 bits: 131.4 E(32554): 8.9e-29
Smith-Waterman score: 2298; 25.8% identity (45.7% similar) in 3218 aa overlap (1-3149:633-2924)
10 20
pF1KE9 MQSSPSPAHPQLPVLQTQMVSDGMTGSN--
.:.: . ::. : .:.. :
CCDS31 IPAPPSSQLPIPPSQPAQLALHVPTPGKVQVQASQLSSLPQM-VASTRLPVDPAPPCPRP
610 620 630 640 650 660
30 40 50 60 70 80
pF1KE9 -PVSPASSSSPASSGAGGISPQHIAQDSSLDGPPGPPDGATVPLEGFSLSQAADLANK--
:.: .:: .:.:... : :: :..: .. : . . : :. . . . .:. .:
CCDS31 LPTSSTSSLAPVSGSGPGPSP---ARSSPVNRPSSATNKALSPVTSRTPGVVASAPTKPQ
670 680 690 700 710
90 100 110 120 130
pF1KE9 GP------KWEKSHAEIAEQAKHEAEIETRIAELRKEGFWSLKRLPKVPEPPRPKGHWDY
.: . ..:. ..:: : ... ::::::: :.:: .::::. : ::::.::::
CCDS31 SPAQNATSSQDSSQDTLTEQITLENQVHQRIAELRKAGLWSQRRLPKLQEAPRPKSHWDY
720 730 740 750 760 770
140 150 160 170 180 190
pF1KE9 LCEEMQWLSADFAQERRWKRGVARKVVRMVIRHHEEQRQKEERARREEQAKLRRIASTMA
: :::::...::::::::: ..:.:.:: :.:::::.. .:::...:::..:::::.. :
CCDS31 LLEEMQWMATDFAQERRWKVAAAKKLVRTVVRHHEEKQLREERGKKEEQSRLRRIAASTA
780 790 800 810 820 830
200 210 220 230 240 250
pF1KE9 KDVRQFWSNVEKVVQFKQQSRLEEKRKKALDLHLDFIVGQTEKYSDLLSQSLNQPLTSSK
.... ::::.:.::..: . .:::::::::.: .: :
CCDS31 REIECFWSNIEQVVEIKLRVELEEKRKKALNL---------QKVS---------------
840 850 860 870
260 270 280 290 300 310
pF1KE9 AGSSPCLGSSSAASSPPPPASRLDDEDGDFQPQEDEEEDDEETIEVEEQQEGNDAEAQRR
::
CCDS31 ----------------------------------------------------------RR
320 330 340 350 360 370
pF1KE9 EIELLRREGELPLEELLRSLPPQLLEGPSSPSQTPSSHDSDTRDGPEEGAEEEPPQVLEI
:: : .: :.: :: ::
CCDS31 GKEL-RPKGFDALQE--------------------SSLDS--------------------
880 890
380 390 400 410 420 430
pF1KE9 KPPPSAVTQRNKQPWHPDEDDEEFTANEEEAEDEEDTIAAEEQLEGEVDHAMELSELARE
... :... .. ...:..:::.:: :: :: ::: :::.::.:
CCDS31 -----GMSGRKRKA--------SISLTDDEVDDEEETIEEEEANEGVVDHQTELSNLAKE
900 910 920 930 940
440 450 460 470 480 490
pF1KE9 GELSMEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEAEEPPQEDSSSQSDS
.:: . .:.. : ::. :.: . : :. :.
CCDS31 AELPLLDLMKLYEGAFLPSS--------------------QWPR-----PKPDG------
950 960 970
500 510 520 530 540 550
pF1KE9 VEDRSEDEEDEHSEEEETSGSSASEESESEESEDAQSQSQADEEEEDDDFGVEYLLARDE
:.::: ::. : . .:.: . : .. :. :.
CCDS31 ---------------EDTSG---------EEDAD---DCPGDRESRKDLVLIDSLFIMDQ
980 990 1000
560 570 580 590 600 610
pF1KE9 EQSEADAGSGPPTPGPTTLGPKKEITDIAAAAESLQPKGYTLATTQVKTPIPLLLRGQLR
.. . : :. :.:.:..:.::.. ::: . .::.:: : :: : ::
CCDS31 FKAAERMNIGKPNA--------KDIADVTAVAEAILPKGSARVTTSVKFNAPSLLYGALR
1010 1020 1030 1040 1050
620 630 640 650 660 670
pF1KE9 EYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEKGNWGPHLIIVPTSVM
.::.::::::. .:.:.:::::::: :::::.: :...:::::..:::::::..: . .
CCDS31 DYQKIGLDWLAKLYRKNLNGILADEAGLGKTVQIIAFFAHLACNEGNWGPHLVVVRSCNI
1060 1070 1080 1090 1100 1110
680 690 700 710 720 730
pF1KE9 LNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITSYKLVLQDHQAFRRKN
:.::.:::::::..:::.: :...: : ::: :..::.:::::::: .. :: :
CCDS31 LKWELELKRWCPGLKILSYIGSHRELKAKRQEWAEPNSFHVCITSYTQFFRGLTAFTRVR
1120 1130 1140 1150 1160 1170
740 750 760 770 780 790
pF1KE9 WRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQNSLMELWSLMHFLMPHVFQS
:. :..:: : .:.. ..:.......::.:::: .::.:...:::...:::.: .
CCDS31 WKCLVIDEMQRVKGMTERHWEAVFTLQSQQRLLLIDSPLHNTFLELWTMVHFLVPGIS--
1180 1190 1200 1210 1220 1230
800 810 820 830 840 850
pF1KE9 HREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRRVKVDVEKQMPKKYEHVIRC
. ..:.:: . : ::.: . .: :::.: .::.:::.: :::::. ::::::..:
CCDS31 ----RPYLSSPLRAPSEESQDYYHKVVIRLHRVTQPFILRRTKRDVEKQLTKKYEHVLKC
1240 1250 1260 1270 1280 1290
860 870 880 890 900 910
pF1KE9 RLSKRQRCLYDDFMAQTTTKETLATGHFMSVINILMQLRKVCNHPNLFDPRPVTSPFITP
:::.::. ::.: . : :.:.: .:::..:..::..:...::::.: .:: : ...
CCDS31 RLSNRQKALYEDVILQPGTQEALKSGHFVNVLSILVRLQRICNHPGLVEPRHPGSSYVAG
1300 1310 1320 1330 1340 1350
920 930 940 950 960 970
pF1KE9 GICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEADTFLPRHRLSRRVLLEVAT
. . .:::.:.: . .. :.. :::::::....:.::. .: .... :... :..:
CCDS31 PLEYPSASLILKALERDFWKEADLSMFDLIGLENKITRHEAE-LLSKKKIPRKLMEEIST
1360 1370 1380 1390 1400
980 990 1000 1010 1020 1030
pF1KE9 APDPPPRPKPVKMKVNRMLQPVP---KQEGRTVVVVNNPRAPLGPVPVRPPPGPELSAQP
. : :: .:.:..:..::: : :::::. : : .: :
CCDS31 SAAPAARPAAAKLKASRLFQPVQYGQKPEGRTVAF--------------PSTHPPRTAAP
1410 1420 1430 1440 1450
1040 1050 1060 1070 1080 1090
pF1KE9 TPGPVPQVLPASLMVSASPAGPPLIPASRPPGPVLLPPLQPNSGSLPQVLPSPLGVLSGT
: . ::.: :: .:: :. .:.. . . . . :.
CCDS31 TTA------------SAAPQGPL---RGRP--PIATFSANPEAKAAAAPFQTSQASASAP
1460 1470 1480 1490
1100 1110 1120 1130 1140 1150
pF1KE9 SRPPTPTLSLKPTPPAPVRLSPAPPPGSSSLLKPLTVPPGYTFPPAAATTTSTTTATATT
. :. . : .: :..: .:. .: :: : :: ..
CCDS31 RHQPASASSTAASPAHPAKLRAQTTAQASTPGQP---PPQPQAPSHAAGQSAL-------
1500 1510 1520 1530 1540
1160 1170 1180 1190 1200 1210
pF1KE9 TAVPAPTPAPQRLILSPDMQARLPSGEVVSIGQLASLAQRPVANAGGSKPLTFQIQGNKL
::::.: . ::::::::::.:.::::.. : :.:.:.::.:.
CCDS31 ---------PQRLVLPSQAQARLPSGEVVKIAQLASITGPQSRVAQPETPVTLQFQGSKF
1550 1560 1570 1580 1590
1220 1230 1240 1250 1260 1270
pF1KE9 TLTGAQVRQLAVGQPRPLQRNVVHLVSAGGQHHLISQPAHVALIQAVAPTPGPTPVSVLP
::. .:.:::..::: :: .:...::: :: .: . :::
CCDS31 TLSHSQLRQLTAGQPLQLQGSVLQIVSAPGQPYLRA--------------PGP-------
1600 1610 1620 1630
1280 1290 1300 1310 1320 1330
pF1KE9 SSTPSTTPAPTGLSLPLAANQVPPTMVNNTGVVKIVVRQAPRDGLTPVPPLAPAPRPPSS
:: :
CCDS31 -----------------------------------VVMQ---------------------
1640
1340 1350 1360 1370 1380 1390
pF1KE9 GLPAVLNPRPTLTPGRLPTPTLGTARAPMPTPTLVRPLLKLVHSPSPEVSASAPGAAPLT
CCDS31 ------------------------------------------------------------
1400 1410 1420 1430 1440 1450
pF1KE9 ISSPLHVPSSLPGPASSPMPIPNSSPLASPVSSTVSVPLSSSLPISVPTTLPAPASAPLT
CCDS31 ------------------------------------------------------------
1460 1470 1480 1490 1500 1510
pF1KE9 IPISAPLTVSASGPALLTSVTPPLAPVVPAAPGPPSLAPSGASPSASALTLGLATAPSLS
::: .: : :: ::
CCDS31 -------TVSQAG------------------------AVHGA--------LG--------
1650
1520 1530 1540 1550 1560 1570
pF1KE9 SSQTPGHPLLLAPTSSHVPGLNSTVAPACSPVLVPASALASPFPSAPNPAPAQASLLAPA
: : ::
CCDS31 --------------------------------------------SKP-----------PA
1660
1580 1590 1600 1610 1620 1630
pF1KE9 SSASQALATPLAPMAAPQTAILAPSPAPPLAPLPVLAPSPGAAPVLASSQTPVPVMAPSS
.. ::::: :.:. :.
CCDS31 GG---------------------PSPAP-------LTPQVGV------------------
1670
1640 1650 1660 1670 1680 1690
pF1KE9 TPGTSLASASPVPAPTPVLAPSSTQTMLPAPVPSPLPSPASTQTLALAPALAPTLGGSSP
:: ..: : :
CCDS31 -PGRVAVNALAVGEP---------------------------------------------
1680
1700 1710 1720 1730 1740 1750
pF1KE9 SQTLSLGTGNPQGPFPTQTLSLTPASSLVPTPAQTLSLAPGPPLGPTQTLSLAPAPPLAP
:: ::. :
CCDS31 ------GT----------------ASK--------------------------------P
1690
1760 1770 1780 1790 1800 1810
pF1KE9 ASPVGPAPAHTLTLAPASSSASLLAPASVQTLTLSPAPVPTLGPAAAQTLALAPASTQSP
:::.: :: ::
CCDS31 ASPIG-------------------------------------GP------------TQ--
1700
1820 1830 1840 1850 1860 1870
pF1KE9 ASQASSLVVSASGAAPLPVTMVSRLPVSKDEPDTLTLRSGPPSPPSTATSFGGPRPRRQP
CCDS31 ------------------------------------------------------------
1880 1890 1900 1910 1920 1930
pF1KE9 PPPPRSPFYLDSLEEKRKRQRSERLERIFQLSEAHGALAPVYGTEVLDFCTLP-----QP
:.. : .:::..:. ..: . . ::::: ..: .:.:: :
CCDS31 --------------EEKTRLLKERLDQIYLVNERRCSQAPVYGRDLLRICALPSHGRVQW
1710 1720 1730 1740
1940 1950 1960 1970 1980
pF1KE9 VASPIGPRSP--GPSHPTFWTYTEAAHRAVLFPQQRLDQLSEIIERFIFVMPPVEAPPPS
.: : :. ::.: .. . .:. . .: . ..:...:.: ::.::: : :::
CCDS31 RGSLDGRRGKEAGPAH-SYTSSSESPSELMLTLCRCGESLQDVIDRVAFVIPPVVAAPPS
1750 1760 1770 1780 1790 1800
1990 2000 2010 2020 2030 2040
pF1KE9 LHACHPPPWLAPRQAAFQEQLASELWPRARPLHRIVCNMRTQFPDLRLIQYDCGKLQTLA
:.. .::: . :. ... : . : . :.. . :::.:::.:.: :::..::
CCDS31 LRVPRPPPLYSHRMRILRQGLREHAAPYFQQLRQTTAPRLLQFPELRLVQFDSGKLEALA
1810 1820 1830 1840 1850 1860
2050 2060 2070 2080 2090 2100
pF1KE9 VLLRQLKAEGHRVLIFTQMTRMLDVLEQFLTYHGHLYLRLDGSTRVEQRQALMERFNADK
.::..::.::.::::..:: :::.::.::..: :.:.: .. :::: ::. :: :.
CCDS31 ILLQKLKSEGRRVLILSQMILMLDILEMFLNFHYLTYVRIDENASSEQRQELMRSFNRDR
1870 1880 1890 1900 1910 1920
2110 2120 2130 2140 2150 2160
pF1KE9 RIFCFILSTRSGGVGVNLTGADTVVFYDSDWNPTMDAQAQDRCHRIGQTRDVHIYRLISE
:::: ::::.: .:.::. ::::::::.: ::.:::.::. : :::. .:.:::::.:
CCDS31 RIFCAILSTHSRTTGINLVEADTVVFYDNDLNPVMDAKAQEWCDRIGRCKDIHIYRLVSG
1930 1940 1950 1960 1970 1980
2170 2180 2190 2200 2210 2220
pF1KE9 RTVEENILKKANQKRMLGDMAIEGGNFTTAYFKQQTIRELFDM--PLEE---PSSSS---
..::..::... : .. ..: .:.... :.. :.::.:::.. :... : ..
CCDS31 NSIEEKLLKNGT-KDLIREVAAQGNDYSMAFLTQRTIQELFEVYSPMDDAGFPVKAEEFV
1990 2000 2010 2020 2030 2040
2230 2240 2250 2260 2270 2280
pF1KE9 VPSAPEEEEETVASKQTHILEQALCRAED-EEDIRAATQAKAEQVAELAEFNENDGFPAG
: : ::.: : .. . .:: : ::: . ..: . : ......:
CCDS31 VLSQEPSVTETIAPKIARPFIEALKSIEYLEEDAQKSAQEGVLGPHTDALSSDSENMPC-
2050 2060 2070 2080 2090 2100
2290 2300 2310 2320 2330 2340
pF1KE9 EGEEAGRPGAEDEEMSRAEQEIAALVEQLTPIERYAMKFLEASLEEVSREELKQAEEQVE
::: :. : :.: ..:::::::.::...:: . .:. ...:. :
CCDS31 -----------DEEPSQLE-ELADFMEQLTPIEKYALNYLELFHTSIEQEKERNSEDAVM
2110 2120 2130 2140 2150
2350 2360 2370 2380 2390
pF1KE9 AARKDLD-------QAKEEVFRLPQEEEEGPGAGDESSCGTGGGTHRRSKKAKAPERPGT
.: . . : .: .:: ::: : :.. : . . :
CCDS31 TAVRAWEFWNLKTLQEREARLRLEQEEAELLTYTREDA---------YSMEYVYEDVDGQ
2160 2170 2180 2190 2200
2400 2410 2420 2430 2440 2450
pF1KE9 RVSERLRGARAETQGANHTPVISAHQTRSTTTP-P--RCSPARERVPRPAPRPRPTPASA
: . : . . :. .:: : . :. : : . :. :.
CCDS31 TEVMPLWTPPTPPQDDSDIYLDSVMCLMYEATPIPEAKLPPVYVRKERKRHKTDPSAAGR
2210 2220 2230 2240 2250 2260
2460 2470 2480 2490 2500
pF1KE9 PAAI---PALVPVPVSAPVPISAPNPITILPVHILPSPPPPSQIPPCSSPACTPPPACTP
:.:: : : .. .: .: .. . . . . : : :. .
CCDS31 KKKQRHGEAVVP-PRSL---FDRATP-GLLKIRREGKEQKKNILLKQQVPFAKPLPTFAK
2270 2280 2290 2300 2310 2320
2510 2520 2530 2540 2550 2560
pF1KE9 PPAHTPPPAQTCLVTPSSPLLLGPPSV---PISASVTNLPLGLRPEAELCAQALASPESL
: :. :.. . :: . .. :.. .... : . :. .: .... : .
CCDS31 PTAEPGQDNPEWLISEDWALLQAVKQLLELPLNLTIVS-P-AHTPNWDLVSDVVNSCSRI
2330 2340 2350 2360 2370
2570 2580 2590 2600 2610
pF1KE9 ELASVASSETSSLSLVP-----PKDLLPVAVEILPVSEKNLSLTPSAPSLTLEAGSIPNG
.: . ..: :. :. . . ....: . : : .. .. :
CCDS31 YRSSKQCRNRYENVIIPREEGKSKNNRPLRTSQIYAQDENATHTQLYTS-HFDLMKMTAG
2380 2390 2400 2410 2420 2430
2620 2630 2640 2650 2660 2670
pF1KE9 QEQEAPDSAEGTTLTVLPEGEELPLCVSESNGLELPPSAASDEPLQEPLEADRTSEELTE
.. .: .. . .. . ..:: :.. :.:: :. .:....
CCDS31 KR--SPPIKPLLGMNPFQKNPKHASVLAES-GINY------DKPLPPIQVASLRAERIAK
2440 2450 2460 2470 2480
2680 2690 2700 2710 2720 2730
pF1KE9 AKTPTSSPEKPQELVTAEVAAPSTSSSATSSPEGPSPARPPRRRTSADVEIRGQGTGRPG
: .. .: :. :: : : :.: ::.. . .. :.
CCDS31 EKKALADQQKAQQ---PAVAQPP--------PPQPQPPPPPQQPPPPLPQPQAAGS----
2490 2500 2510 2520 2530
2740 2750 2760 2770 2780 2790
pF1KE9 QPP-GPKVLRKLPGRLVTVVEEKELVRRRRQQ---RGAASTLVPGVSETSASPGSPSVRS
::: :: ... : . . . . : :...... :. .::.. : . .
CCDS31 QPPAGPPAVQPQPQPQPQTQPQPVQAPAKAQPAITTGGSAAVLAGTIKTSVTGTSMPTGA
2540 2550 2560 2570 2580 2590
2800 2810 2820 2830 2840 2850
pF1KE9 MSGPESSPPIGGPCEAAPSSSLPTPPQQPFIARRHIELGVTGGGSPENGDGALLAITPPA
.:: :.: :: .:. .: : . ::..: : .. : :
CCDS31 VSGNVIVNTIAG-VPAATFQSINKRLASPVAPG---ALTTPGGSAP-----AQVVHTQP-
2600 2610 2620 2630 2640
2860 2870 2880 2890 2900 2910
pF1KE9 VKRRRGRPPKKNRSPADAGRGVDEAPSSTLKGKTNGADPVPGPETLIVADPVLEPQLIPG
::. ::: : .:. . . :.:. : . . :. : : :.
CCDS31 -------PPRAVGSPATA------TPDLVSMATTQGVRAVTSVTASAVVTTNLTPVQTPA
2650 2660 2670 2680 2690
2920 2930 2940 2950 2960 2970
pF1KE9 ----PQPLGPQPVHRPNPLLSPVEKRRRGRPPKARDLPIPGTISSAGDGNSESRTQPPPH
:: :. :. ..:.. . . . .. .. . ..... :
CCDS31 RSLVPQVSQATGVQLPGKTITPAHFQLLRQQQQQQQQQQQQQQQQQQQQQQQQQQQQQTT
2700 2710 2720 2730 2740 2750
2980 2990 3000 3010 3020
pF1KE9 PSPLTPLPPLL---VCPTATVANTVTTVTISTSPPKRKRGRPPKNPPSPRPSQLPVLDRD
. . .: . :. : : . :.: ::. :: :. .. :
CCDS31 TTSQVQVPQIQGQAQSPAQIKAVGKLTPEHLIKMQKQKLQMPPQ-PPPPQAQSAPPQPTA
2760 2770 2780 2790 2800
3030 3040 3050 3060 3070 3080
pF1KE9 STSVLESCGLGRRRQPQGQGESEGSSSDEDGSRPLTRLARLRLEAEGMRGRKSGGSMVVA
...: : . :: :. . . . . :: . :.. : . :.. :
CCDS31 QVQVQTS------QPPQQQSPQLTTVTAPRPGALLTGTTVANLQVA--RLTRVPTSQLQA
2810 2820 2830 2840 2850 2860
3090 3100 3110 3120 3130 3140
pF1KE9 VIQDDLDLADSGPGGLELT-PPVVSLTPKLRSTRLRPGSLVPPLETEKL------PRKRA
: ... :. . :. :::::. . :. :: . :... . :.: :
CCDS31 --QGQMQTQAPQPAQVALAKPPVVSVPAAVVSS---PGVTTLPMNVAGISVAIGQPQKAA
2870 2880 2890 2900 2910
3150 3160 3170 3180 3190 3200
pF1KE9 GAPVGGSPGLAKRGRLQPPSPLGPEGSVEESEAEASGEEEEGDGTPRRRPGPRRLVGTTN
: : ..:
CCDS31 GQTVVAQPVHMQQLLKLKQQAVQQQKAIQPQAAQGPAAVQQKITAQQITTPGAQQKVAYA
2920 2930 2940 2950 2960 2970
>>CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052 aa)
initn: 1434 init1: 668 opt: 919 Z-score: 372.2 bits: 82.1 E(32554): 2.1e-14
Smith-Waterman score: 942; 37.3% identity (61.7% similar) in 480 aa overlap (474-918:2-474)
450 460 470 480 490 500
pF1KE9 MEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEAEEPPQEDSSSQSDSVEDR
:: :: : : :.. ..: ... .
CCDS37 MSSAAEPPPPPPPESAPSKPAASIASGGSNS
10 20 30
510 520 530 540 550
pF1KE9 SED--EEDEHSEEEETSGSSASEESESEES-EDAQSQSQADEEEEDDDFG----------
:. : .. ...:.. ..: :: .::. .: . .: : .
CCDS37 SNKGGPEGVAAQAVASAASAGPADAEMEEIFDDASPGKQKEIQEPDPTYEEKMQTDRANR
40 50 60 70 80 90
560 570 580 590
pF1KE9 VEYLLARDEEQSEADAGSGPPTP-GPTTLGP------KKEITDIAAAAE-----SLQPKG
:::: . : .. .. :: .: . : : : .. .... . : .
CCDS37 FEYLLKQTELFAHFIQPAAQKTPTSPLKMKPGRPRIKKDEKQNLLSVGDYRHRRTEQEED
100 110 120 130 140 150
600 610 620 630 640
pF1KE9 YTLATTQVK-TPI-------PLLLR-GQLREYQHIGLDWLVTMYEKKLNGILADEMGLGK
: : . : : . : .. :.::.:: ::.::...::. .::::::::::::
CCDS37 EELLTESSKATNVCTRFEDSPSYVKWGKLRDYQVRGLNWLISLYENGINGILADEMGLGK
160 170 180 190 200 210
650 660 670 680 690 700
pF1KE9 TIQTISLLAHLACEKGNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKR
:.::::::... .. :::...:: :.. :: :.::: :... . : ...:
CCDS37 TLQTISLLGYMKHYRNIPGPHMVLVPKSTLHNWMSEFKRWVPTLRSVCLIGDKEQRAAFV
220 230 240 250 260 270
710 720 730 740 750 760
pF1KE9 QGWTKPNAFHVCITSYKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQR
. :. . ::.:::.........:.. :::::..:::. ::: ::. . . .:..
CCDS37 RDVLLPGEWDVCVTSYEMLIKEKSVFKKFNWRYLVIDEAHRIKNEKSKLSEIVREFKTTN
280 290 300 310 320 330
770 780 790 800 810 820
pF1KE9 RLLLTGTPLQNSLMELWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRL
:::::::::::.: :::::..::.: ::.: .: ::. :. :.:. ::.::
CCDS37 RLLLTGTPLQNNLHELWSLLNFLLPDVFNSADDFDSWFD---TNNCLGDQK----LVERL
340 350 360 370 380
830 840 850 860 870 880
pF1KE9 HKVLRPFLLRRVKVDVEKQMPKKYEHVIRCRLSKRQRCLYDD-FMAQTTTKETLATGHFM
: :::::::::.:.::::..: : : : ::: :: : .: . .. . :
CCDS37 HMVLRPFLLRRIKADVEKSLPPKKEVKIYVGLSKMQREWYTRILMKDIDILNSAGKMDKM
390 400 410 420 430 440
890 900 910 920 930 940
pF1KE9 SVINILMQLRKVCNHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDL
..:::::::: :::: ::: :. :
CCDS37 RLLNILMQLRKCCNHPYLFDGAEPGPPYTTDMHLVTNSGKMVVLDKLLPKLKEQGSRVLI
450 460 470 480 490 500
>>CCDS14612.1 SMARCA1 gene_id:6594|Hs108|chrX (1054 aa)
initn: 1404 init1: 670 opt: 916 Z-score: 371.1 bits: 81.9 E(32554): 2.4e-14
Smith-Waterman score: 954; 37.0% identity (64.5% similar) in 467 aa overlap (476-918:26-477)
450 460 470 480 490 500
pF1KE9 ELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEAEEPPQEDSSSQSDSVEDRSE
: .: :: ..: ..... .. ...:
CCDS14 MEQDTAAVAATVAAADATATIVVIEDEQP-GPSTSQEEGAAAAATEATAATEKGE
10 20 30 40 50
510 520 530 540 550 560
pF1KE9 DEEDEHSEEEETSGSSASEESESEESEDAQSQSQADEEEEDDDFGVEYLLARDEEQS---
..... . . .. . .::.: . . . . .::. .. :.:: . : .
CCDS14 KKKEKNVSSFQLKLAAKAPKSEKEMDPEYEEKMKADRAKR-----FEFLLKQTELFAHFI
60 70 80 90 100
570 580 590 600 610
pF1KE9 EADAGSGPPTPGPTTLG-P---KKEITDIAAAAE-----SLQPKGYTLATTQVKTPI---
. .: ..: .: :: : : : .. .:.. . : . : . . ::
CCDS14 QPSAQKSPTSPLNMKLGRPRIKKDEKQSLISAGDYRHRRTEQEEDEELLSESRKTSNVCI
110 120 130 140 150 160
620 630 640 650 660
pF1KE9 -----PLLLRG-QLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEK
: ..: ::.:: ::.::...::. .:::::::::::::.:::.::..: .
CCDS14 RFEVSPSYVKGGPLRDYQIRGLNWLISLYENGVNGILADEMGLGKTLQTIALLGYLKHYR
170 180 190 200 210 220
670 680 690 700 710 720
pF1KE9 GNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITS
. :::...:: :.. :: :.::: ::.... . : . : . :. . ::.::
CCDS14 NIPGPHMVLVPKSTLHNWMNEFKRWVPSLRVICFVGDKDARAAFIRDEMMPGEWDVCVTS
230 240 250 260 270 280
730 740 750 760 770 780
pF1KE9 YKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQNSLME
:..:......:.. .::::..:::. ::: ::. . . .:.: :::::::::::.: :
CCDS14 YEMVIKEKSVFKKFHWRYLVIDEAHRIKNEKSKLSEIVREFKSTNRLLLTGTPLQNNLHE
290 300 310 320 330 340
790 800 810 820 830 840
pF1KE9 LWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRRVKVD
::.:..::.: ::.: .: ::. : :.:. ::.::: ::.::::::.:.:
CCDS14 LWALLNFLLPDVFNSADDFDSWFD---TKNCLGDQK----LVERLHAVLKPFLLRRIKTD
350 360 370 380 390 400
850 860 870 880 890 900
pF1KE9 VEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQTTTKETL-ATGHF--MSVINILMQLRKVC
:::..: : : : ::: :: : .. . ..: ..:.. : ..:::::::: :
CCDS14 VEKSLPPKKEIKIYLGLSKMQREWYTKILMKDI--DVLNSSGKMDKMRLLNILMQLRKCC
410 420 430 440 450 460
910 920 930 940 950 960
pF1KE9 NHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEAD
::: ::: :. :
CCDS14 NHPYLFDGAEPGPPYTTDEHIVSNSGKMVVLDKLLAKLKEQGSRVLIFSQMTRLLDILED
470 480 490 500 510 520
>>CCDS76018.1 SMARCA1 gene_id:6594|Hs108|chrX (1058 aa)
initn: 1406 init1: 670 opt: 916 Z-score: 371.0 bits: 81.9 E(32554): 2.4e-14
Smith-Waterman score: 954; 37.0% identity (64.5% similar) in 467 aa overlap (476-918:26-477)
450 460 470 480 490 500
pF1KE9 ELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEAEEPPQEDSSSQSDSVEDRSE
: .: :: ..: ..... .. ...:
CCDS76 MEQDTAAVAATVAAADATATIVVIEDEQP-GPSTSQEEGAAAAATEATAATEKGE
10 20 30 40 50
510 520 530 540 550 560
pF1KE9 DEEDEHSEEEETSGSSASEESESEESEDAQSQSQADEEEEDDDFGVEYLLARDEEQS---
..... . . .. . .::.: . . . . .::. .. :.:: . : .
CCDS76 KKKEKNVSSFQLKLAAKAPKSEKEMDPEYEEKMKADRAKR-----FEFLLKQTELFAHFI
60 70 80 90 100
570 580 590 600 610
pF1KE9 EADAGSGPPTPGPTTLG-P---KKEITDIAAAAE-----SLQPKGYTLATTQVKTPI---
. .: ..: .: :: : : : .. .:.. . : . : . . ::
CCDS76 QPSAQKSPTSPLNMKLGRPRIKKDEKQSLISAGDYRHRRTEQEEDEELLSESRKTSNVCI
110 120 130 140 150 160
620 630 640 650 660
pF1KE9 -----PLLLRG-QLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEK
: ..: ::.:: ::.::...::. .:::::::::::::.:::.::..: .
CCDS76 RFEVSPSYVKGGPLRDYQIRGLNWLISLYENGVNGILADEMGLGKTLQTIALLGYLKHYR
170 180 190 200 210 220
670 680 690 700 710 720
pF1KE9 GNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITS
. :::...:: :.. :: :.::: ::.... . : . : . :. . ::.::
CCDS76 NIPGPHMVLVPKSTLHNWMNEFKRWVPSLRVICFVGDKDARAAFIRDEMMPGEWDVCVTS
230 240 250 260 270 280
730 740 750 760 770 780
pF1KE9 YKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQNSLME
:..:......:.. .::::..:::. ::: ::. . . .:.: :::::::::::.: :
CCDS76 YEMVIKEKSVFKKFHWRYLVIDEAHRIKNEKSKLSEIVREFKSTNRLLLTGTPLQNNLHE
290 300 310 320 330 340
790 800 810 820 830 840
pF1KE9 LWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRRVKVD
::.:..::.: ::.: .: ::. : :.:. ::.::: ::.::::::.:.:
CCDS76 LWALLNFLLPDVFNSADDFDSWFD---TKNCLGDQK----LVERLHAVLKPFLLRRIKTD
350 360 370 380 390 400
850 860 870 880 890 900
pF1KE9 VEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQTTTKETL-ATGHF--MSVINILMQLRKVC
:::..: : : : ::: :: : .. . ..: ..:.. : ..:::::::: :
CCDS76 VEKSLPPKKEIKIYLGLSKMQREWYTKILMKDI--DVLNSSGKMDKMRLLNILMQLRKCC
410 420 430 440 450 460
910 920 930 940 950 960
pF1KE9 NHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEAD
::: ::: :. :
CCDS76 NHPYLFDGAEPGPPYTTDEHIVSNSGKMVVLDKLLAKLKEQGSRVLIFSQMTRLLDILED
470 480 490 500 510 520
>>CCDS76019.1 SMARCA1 gene_id:6594|Hs108|chrX (1070 aa)
initn: 1404 init1: 670 opt: 916 Z-score: 371.0 bits: 81.9 E(32554): 2.4e-14
Smith-Waterman score: 954; 37.0% identity (64.5% similar) in 467 aa overlap (476-918:26-477)
450 460 470 480 490 500
pF1KE9 ELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEAEEPPQEDSSSQSDSVEDRSE
: .: :: ..: ..... .. ...:
CCDS76 MEQDTAAVAATVAAADATATIVVIEDEQP-GPSTSQEEGAAAAATEATAATEKGE
10 20 30 40 50
510 520 530 540 550 560
pF1KE9 DEEDEHSEEEETSGSSASEESESEESEDAQSQSQADEEEEDDDFGVEYLLARDEEQS---
..... . . .. . .::.: . . . . .::. .. :.:: . : .
CCDS76 KKKEKNVSSFQLKLAAKAPKSEKEMDPEYEEKMKADRAKR-----FEFLLKQTELFAHFI
60 70 80 90 100
570 580 590 600 610
pF1KE9 EADAGSGPPTPGPTTLG-P---KKEITDIAAAAE-----SLQPKGYTLATTQVKTPI---
. .: ..: .: :: : : : .. .:.. . : . : . . ::
CCDS76 QPSAQKSPTSPLNMKLGRPRIKKDEKQSLISAGDYRHRRTEQEEDEELLSESRKTSNVCI
110 120 130 140 150 160
620 630 640 650 660
pF1KE9 -----PLLLRG-QLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEK
: ..: ::.:: ::.::...::. .:::::::::::::.:::.::..: .
CCDS76 RFEVSPSYVKGGPLRDYQIRGLNWLISLYENGVNGILADEMGLGKTLQTIALLGYLKHYR
170 180 190 200 210 220
670 680 690 700 710 720
pF1KE9 GNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITS
. :::...:: :.. :: :.::: ::.... . : . : . :. . ::.::
CCDS76 NIPGPHMVLVPKSTLHNWMNEFKRWVPSLRVICFVGDKDARAAFIRDEMMPGEWDVCVTS
230 240 250 260 270 280
730 740 750 760 770 780
pF1KE9 YKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSLLNFNSQRRLLLTGTPLQNSLME
:..:......:.. .::::..:::. ::: ::. . . .:.: :::::::::::.: :
CCDS76 YEMVIKEKSVFKKFHWRYLVIDEAHRIKNEKSKLSEIVREFKSTNRLLLTGTPLQNNLHE
290 300 310 320 330 340
790 800 810 820 830 840
pF1KE9 LWSLMHFLMPHVFQSHREFKEWFSNPLTGMIEGSQEYNEGLVKRLHKVLRPFLLRRVKVD
::.:..::.: ::.: .: ::. : :.:. ::.::: ::.::::::.:.:
CCDS76 LWALLNFLLPDVFNSADDFDSWFD---TKNCLGDQK----LVERLHAVLKPFLLRRIKTD
350 360 370 380 390 400
850 860 870 880 890 900
pF1KE9 VEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQTTTKETL-ATGHF--MSVINILMQLRKVC
:::..: : : : ::: :: : .. . ..: ..:.. : ..:::::::: :
CCDS76 VEKSLPPKKEIKIYLGLSKMQREWYTKILMKDI--DVLNSSGKMDKMRLLNILMQLRKCC
410 420 430 440 450 460
910 920 930 940 950 960
pF1KE9 NHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEAD
::: ::: :. :
CCDS76 NHPYLFDGAEPGPPYTTDEHIVSNSGKMVVLDKLLAKLKEQGSRVLIFSQMTRLLDILED
470 480 490 500 510 520
>>CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572 aa)
initn: 1008 init1: 472 opt: 848 Z-score: 342.8 bits: 77.3 E(32554): 9e-13
Smith-Waterman score: 927; 36.8% identity (63.8% similar) in 478 aa overlap (449-907:563-1022)
420 430 440 450 460 470
pF1KE9 AEEQLEGEVDHAMELSELAREGELSMEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCE
.. : : :. :. : . .: .:.
CCDS34 TDEYVANLTNLVWEHKQAQAAKEKKKRRRRKKKAEENAEGGESALGPDGEPIDESSQ--M
540 550 560 570 580 590
480 490 500 510 520 530
pF1KE9 PEGPVEAEEPPQEDSSSQSDSVEDRSEDEEDEHSEEEETSGSSASEESESE-ESEDAQSQ
. ::.. . .. . . : : . :.. : ::::.:. : :: . .
CCDS34 SDLPVKVTHTETGKVLFGPEAPKASQLDAWLEMNPGYEVAPRSDSEESDSDYEEEDEEEE
600 610 620 630 640 650
540 550 560 570 580 590
pF1KE9 SQADEEEEDDDFGVEYLL-ARDEEQSEADAGSGPPTPGPTTLGPKKEITD---IAAAAES
:. .: :: . :: .:: :: :: . : :... : . .:..
CCDS34 SSRQETEE------KILLDPNSEEVSEKDAKQIIETA-------KQDVDDEYSMQYSARG
660 670 680 690
600 610 620 630 640 650
pF1KE9 LQPKGYTLA---TTQVKTPIPLLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKT
: ::.: . .:. ::. : :..:: ::.:.:..:...::::::::::::::
CCDS34 SQSY-YTVAHAISERVEKQSALLINGTLKHYQLQGLEWMVSLYNNNLNGILADEMGLGKT
700 710 720 730 740 750
660 670 680 690 700
pF1KE9 IQTISLLAHLACEKGNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERK-LKR
::::.:...: .: ::.::::: :.. :: .:. .: :: ..: :. :. :
CCDS34 IQTIALITYLMEHKRLNGPYLIIVPLSTLSNWTYEFDKWAPSVVKISYKGTPAMRRSLVP
760 770 780 790 800 810
710 720 730 740 750 760
pF1KE9 QGWTKPNAFHVCITSYKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSL-LNFNSQ
: . . :.: .:.:. ...:.. . . :.:.:.::.. .:: . . : : .. .
CCDS34 Q--LRSGKFNVLLTTYEYIIKDKHILAKIRWKYMIVDEGHRMKNHHCKLTQVLNTHYVAP
820 830 840 850 860 870
770 780 790 800 810 820
pF1KE9 RRLLLTGTPLQNSLMELWSLMHFLMPHVFQSHREFKEWFSNP--LTGM-IEGSQEYNEGL
::.:::::::::.: :::.:..::.: .:.: :..::. : .:: .. ..: . .
CCDS34 RRILLTGTPLQNKLPELWALLNFLLPTIFKSCSTFEQWFNAPFAMTGERVDLNEEETILI
880 890 900 910 920 930
830 840 850 860 870
pF1KE9 VKRLHKVLRPFLLRRVKVDVEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQT------TTK
..:::::::::::::.: .::.:.:.: :.::.: .: :. :: ..:. . :
CCDS34 IRRLHKVLRPFLLRRLKKEVESQLPEKVEYVIKCDMSALQKILYRHMQAKGILLTDGSEK
940 950 960 970 980 990
880 890 900 910 920 930
pF1KE9 ETLATGHFMSVINILMQLRKVCNHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQ
. . : ...: .:::::.:::: .:
CCDS34 DKKGKGGAKTLMNTIMQLRKICNHPYMFQHIEESFAEHLGYSNGVINGAELYRASGKFEL
1000 1010 1020 1030 1040 1050
>>CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590 aa)
initn: 1008 init1: 472 opt: 848 Z-score: 342.7 bits: 77.3 E(32554): 9.1e-13
Smith-Waterman score: 927; 36.8% identity (63.8% similar) in 478 aa overlap (449-907:563-1022)
420 430 440 450 460 470
pF1KE9 AEEQLEGEVDHAMELSELAREGELSMEELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCE
.. : : :. :. : . .: .:.
CCDS34 TDEYVANLTNLVWEHKQAQAAKEKKKRRRRKKKAEENAEGGESALGPDGEPIDESSQ--M
540 550 560 570 580 590
480 490 500 510 520 530
pF1KE9 PEGPVEAEEPPQEDSSSQSDSVEDRSEDEEDEHSEEEETSGSSASEESESE-ESEDAQSQ
. ::.. . .. . . : : . :.. : ::::.:. : :: . .
CCDS34 SDLPVKVTHTETGKVLFGPEAPKASQLDAWLEMNPGYEVAPRSDSEESDSDYEEEDEEEE
600 610 620 630 640 650
540 550 560 570 580 590
pF1KE9 SQADEEEEDDDFGVEYLL-ARDEEQSEADAGSGPPTPGPTTLGPKKEITD---IAAAAES
:. .: :: . :: .:: :: :: . : :... : . .:..
CCDS34 SSRQETEE------KILLDPNSEEVSEKDAKQIIETA-------KQDVDDEYSMQYSARG
660 670 680 690
600 610 620 630 640 650
pF1KE9 LQPKGYTLA---TTQVKTPIPLLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKT
: ::.: . .:. ::. : :..:: ::.:.:..:...::::::::::::::
CCDS34 SQSY-YTVAHAISERVEKQSALLINGTLKHYQLQGLEWMVSLYNNNLNGILADEMGLGKT
700 710 720 730 740 750
660 670 680 690 700
pF1KE9 IQTISLLAHLACEKGNWGPHLIIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERK-LKR
::::.:...: .: ::.::::: :.. :: .:. .: :: ..: :. :. :
CCDS34 IQTIALITYLMEHKRLNGPYLIIVPLSTLSNWTYEFDKWAPSVVKISYKGTPAMRRSLVP
760 770 780 790 800 810
710 720 730 740 750 760
pF1KE9 QGWTKPNAFHVCITSYKLVLQDHQAFRRKNWRYLILDEAQNIKNFKSQRWQSL-LNFNSQ
: . . :.: .:.:. ...:.. . . :.:.:.::.. .:: . . : : .. .
CCDS34 Q--LRSGKFNVLLTTYEYIIKDKHILAKIRWKYMIVDEGHRMKNHHCKLTQVLNTHYVAP
820 830 840 850 860 870
770 780 790 800 810 820
pF1KE9 RRLLLTGTPLQNSLMELWSLMHFLMPHVFQSHREFKEWFSNP--LTGM-IEGSQEYNEGL
::.:::::::::.: :::.:..::.: .:.: :..::. : .:: .. ..: . .
CCDS34 RRILLTGTPLQNKLPELWALLNFLLPTIFKSCSTFEQWFNAPFAMTGERVDLNEEETILI
880 890 900 910 920 930
830 840 850 860 870
pF1KE9 VKRLHKVLRPFLLRRVKVDVEKQMPKKYEHVIRCRLSKRQRCLYDDFMAQT------TTK
..:::::::::::::.: .::.:.:.: :.::.: .: :. :: ..:. . :
CCDS34 IRRLHKVLRPFLLRRLKKEVESQLPEKVEYVIKCDMSALQKILYRHMQAKGILLTDGSEK
940 950 960 970 980 990
880 890 900 910 920 930
pF1KE9 ETLATGHFMSVINILMQLRKVCNHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQ
. . : ...: .:::::.:::: .:
CCDS34 DKKGKGGAKTLMNTIMQLRKICNHPYMFQHIEESFAEHLGYSNGVINGAELYRASGKFEL
1000 1010 1020 1030 1040 1050
>>CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613 aa)
initn: 1129 init1: 472 opt: 822 Z-score: 332.7 bits: 75.5 E(32554): 3.3e-12
Smith-Waterman score: 923; 36.8% identity (62.9% similar) in 456 aa overlap (475-907:631-1052)
450 460 470 480 490 500
pF1KE9 EELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEA--EEPPQEDSSSQSDSVED
.: : .:: : : . . .::: :.
CCDS54 PDGEPLDETSQMSDLPVKVIHVESGKILTGTDAPKAGQLEAWLEMNPGYEVAPRSDSEES
610 620 630 640 650 660
510 520 530 540 550
pF1KE9 RSEDEEDEHSEEEETSGSSAS---EESESEESEDAQSQSQAD--------EEEEDDDFGV
::.::.:. ::. ... . ::... . :... :..: ... ::..::
CCDS54 GSEEEEEEEEEEQPQAAQPPTLPVEEKKKIPDPDSDDVSEVDARHIIENAKQDVDDEYGV
670 680 690 700 710 720
560 570 580 590 600 610
pF1KE9 EYLLARDEEQSEADAGSGPPTPGPTTLGPKKEITDIAAAAESLQPKGYTLATTQVKTPIP
::: .. : .: :. : .:
CCDS54 SQALARGLQSYYA----------------------VAHAV-----------TERVDKQSA
730 740
620 630 640 650 660 670
pF1KE9 LLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEKGNWGPHL
:.. : :..:: ::.:::..:...::::::::::::::::::.:...: .: :: :
CCDS54 LMVNGVLKQYQIKGLEWLVSLYNNNLNGILADEMGLGKTIQTIALITYLMEHKRINGPFL
750 760 770 780 790 800
680 690 700 710 720 730
pF1KE9 IIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITSYKLVLQD
:::: :.. :: .:. .: :: ..: :. :. . . :.: .:.:. ...:
CCDS54 IIVPLSTLSNWAYEFDKWAPSVVKVSYKGSPAARR-AFVPQLRSGKFNVLLTTYEYIIKD
810 820 830 840 850 860
740 750 760 770 780 790
pF1KE9 HQAFRRKNWRYLILDEAQNIKNFKSQRWQSL-LNFNSQRRLLLTGTPLQNSLMELWSLMH
.. . . :.:.:.::.. .:: . . : : .. . ::::::::::::.: :::.:..
CCDS54 KHILAKIRWKYMIVDEGHRMKNHHCKLTQVLNTHYVAPRRLLLTGTPLQNKLPELWALLN
870 880 890 900 910 920
800 810 820 830 840
pF1KE9 FLMPHVFQSHREFKEWFSNP--LTGM-IEGSQEYNEGLVKRLHKVLRPFLLRRVKVDVEK
::.: .:.: :..::. : .:: .. ..: . ...:::::::::::::.: .::
CCDS54 FLLPTIFKSCSTFEQWFNAPFAMTGEKVDLNEEETILIIRRLHKVLRPFLLRRLKKEVEA
930 940 950 960 970 980
850 860 870 880 890 900
pF1KE9 QMPKKYEHVIRCRLSKRQRCLYDDFMAQT------TTKETLATGHFMSVINILMQLRKVC
:.:.: :.::.: .: :: :: ..:. . :. . : ...: .:::::.:
CCDS54 QLPEKVEYVIKCDMSALQRVLYRHMQAKGVLLTDGSEKDKKGKGGTKTLMNTIMQLRKIC
990 1000 1010 1020 1030 1040
910 920 930 940 950 960
pF1KE9 NHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEAD
::: .:
CCDS54 NHPYMFQHIEESFSEHLGFTGGIVQGLDLYRASGKFELLDRILPKLRATNHKVLLFCQMT
1050 1060 1070 1080 1090 1100
>>CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614 aa)
initn: 1129 init1: 472 opt: 822 Z-score: 332.7 bits: 75.5 E(32554): 3.3e-12
Smith-Waterman score: 923; 36.8% identity (62.9% similar) in 456 aa overlap (475-907:631-1052)
450 460 470 480 490 500
pF1KE9 EELLQQYAGAYAPGSGSSEDEDEDEVDANSSDCEPEGPVEA--EEPPQEDSSSQSDSVED
.: : .:: : : . . .::: :.
CCDS54 PDGEPLDETSQMSDLPVKVIHVESGKILTGTDAPKAGQLEAWLEMNPGYEVAPRSDSEES
610 620 630 640 650 660
510 520 530 540 550
pF1KE9 RSEDEEDEHSEEEETSGSSAS---EESESEESEDAQSQSQAD--------EEEEDDDFGV
::.::.:. ::. ... . ::... . :... :..: ... ::..::
CCDS54 GSEEEEEEEEEEQPQAAQPPTLPVEEKKKIPDPDSDDVSEVDARHIIENAKQDVDDEYGV
670 680 690 700 710 720
560 570 580 590 600 610
pF1KE9 EYLLARDEEQSEADAGSGPPTPGPTTLGPKKEITDIAAAAESLQPKGYTLATTQVKTPIP
::: .. : .: :. : .:
CCDS54 SQALARGLQSYYA----------------------VAHAV-----------TERVDKQSA
730 740
620 630 640 650 660 670
pF1KE9 LLLRGQLREYQHIGLDWLVTMYEKKLNGILADEMGLGKTIQTISLLAHLACEKGNWGPHL
:.. : :..:: ::.:::..:...::::::::::::::::::.:...: .: :: :
CCDS54 LMVNGVLKQYQIKGLEWLVSLYNNNLNGILADEMGLGKTIQTIALITYLMEHKRINGPFL
750 760 770 780 790 800
680 690 700 710 720 730
pF1KE9 IIVPTSVMLNWEMELKRWCPSFKILTYYGAQKERKLKRQGWTKPNAFHVCITSYKLVLQD
:::: :.. :: .:. .: :: ..: :. :. . . :.: .:.:. ...:
CCDS54 IIVPLSTLSNWAYEFDKWAPSVVKVSYKGSPAARR-AFVPQLRSGKFNVLLTTYEYIIKD
810 820 830 840 850 860
740 750 760 770 780 790
pF1KE9 HQAFRRKNWRYLILDEAQNIKNFKSQRWQSL-LNFNSQRRLLLTGTPLQNSLMELWSLMH
.. . . :.:.:.::.. .:: . . : : .. . ::::::::::::.: :::.:..
CCDS54 KHILAKIRWKYMIVDEGHRMKNHHCKLTQVLNTHYVAPRRLLLTGTPLQNKLPELWALLN
870 880 890 900 910 920
800 810 820 830 840
pF1KE9 FLMPHVFQSHREFKEWFSNP--LTGM-IEGSQEYNEGLVKRLHKVLRPFLLRRVKVDVEK
::.: .:.: :..::. : .:: .. ..: . ...:::::::::::::.: .::
CCDS54 FLLPTIFKSCSTFEQWFNAPFAMTGEKVDLNEEETILIIRRLHKVLRPFLLRRLKKEVEA
930 940 950 960 970 980
850 860 870 880 890 900
pF1KE9 QMPKKYEHVIRCRLSKRQRCLYDDFMAQT------TTKETLATGHFMSVINILMQLRKVC
:.:.: :.::.: .: :: :: ..:. . :. . : ...: .:::::.:
CCDS54 QLPEKVEYVIKCDMSALQRVLYRHMQAKGVLLTDGSEKDKKGKGGTKTLMNTIMQLRKIC
990 1000 1010 1020 1030 1040
910 920 930 940 950 960
pF1KE9 NHPNLFDPRPVTSPFITPGICFSTASLVLRATDVHPLQRIDMGRFDLIGLEGRVSRYEAD
::: .:
CCDS54 NHPYMFQHIEESFSEHLGFTGGIVQGLDLYRASGKFELLDRILPKLRATNHKVLLFCQMT
1050 1060 1070 1080 1090 1100
3230 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 07:13:36 2016 done: Tue Nov 8 07:13:38 2016
Total Scan time: 10.720 Total Display time: 1.080
Function used was FASTA [36.3.4 Apr, 2011]