テーマ 31タンパク質を指定しないDNAがあります

ロイ・ブリテンが、デービット・コーネと行った、反復DNAとその進化的起源についての研究を紹介します。

私はロイ・ブリテンです。1960年代、デヴィッド・コーンと私は、マウスの細胞が複数コピーの非常に良く似たDNA配列を持っていることを発見しました。私たちはこれをDNA鎖の乖離(かいり)率を測ることで調べました。これを説明します。 私たちはすでにDNAがタンパク質をコードすることを知っていました。遺伝情報はDNA鎖の塩基配列に保存されています。 ヌクレオチドは、AとT、GとCという水素結合を通して、2本の相補鎖を整列させて対にします。これがDNA二本鎖です。 DNAは原核生物から抽出して、小さな断片にせん断することができます。二本鎖DNAは、溶液中で沸点近くまで加熱すると、相補的な塩基対の間の水素結合が壊され、一本鎖DNAに分かれます。 この二本鎖DNAの乖離する温度から、約25℃下げると、一本鎖DNAどうしはまた会合します。これは、確率的な衝突により出会った相補鎖の間に、水素結合が再び形成されるためです。 完全一致する一本鎖どうしの会合が常に起こるわけではありません。温度が急速に下がると、相補鎖どうしがお互いを"見つける”ための時間が短くなります。この場合、相補性に局所性が生じることになります。 私たちは、DNAの再会合時間を一本鎖DNAと二本鎖DNAの性質の違いを利用して測定しました。 二本鎖DNAは、リン酸カルシウムの結晶構造のひとつである、ハイドロキシアパタイトにより強い親和性を持っています。 [ハイドロキシアパタイト] ハイドロキシアパタイトを詰めたカラムは、二本鎖DNAを結合して捕まえますが、一本鎖DNAは素通りさせます。条件を調節することで、ミスマッチを含んだ二本鎖DNAもカラムで捉えることができます。 全てのDNAをこのカラムから洗い流すことができるので、一本鎖、二本鎖DNAの量をそれぞれ定量することができます。 1962年、真核生物のDNAを用いた再会合反応が行われました。マウスのような真核生物の細胞は、大腸菌と比較して、100倍以上のDNAを持っています。それゆえに、私たちは真核生物の持つDNAのいくつかが、大腸菌DNAよりも早く再会合することに驚きました。 私たちは、もう少し解析を進めることにしました。私たちは、再会合したDNAの分画をDNA濃度と時間の積の対数(C0t)でグラフ化しました。 [再会合したDNAの分画] [DNA濃度と時間の積の対数(C0t)] 私たちは異なるゲノムサイズを持つ生物の再会合の頻度を比較しました。ポリU:ポリA鎖をグラフ化すると、C0tの曲線はこのようになります: [ポリU:ポリA鎖] ポリU鎖とポリA鎖は研究室で合成して、対照として用いました。大腸菌DNAのC0tグラフはこのようになります。 [大腸菌DNA] 曲線が右側に移動していることに注意してください。大腸菌ゲノムは複雑なため、再会合反応の完了により多くの時間がかかっています。ポリU:ポリA鎖とは異なり、大腸菌DNAでは正しい相補鎖を見つけるのにより多くの時間がかかるのです。 サテライトDNAと呼ばれるマウスDNAの再会合曲線はこのようになります。 [マウス サテライト] マウスのDNAが大腸菌DNAに比べてどれだけ早く再会合しているかに注目してください。マウスのサテライトDNAが多くの反復配列を含んでいることが分かります。これらの配列は非常によく似ているために、簡単に再会合します。相補鎖を見つけるのが難しいユニークな配列は含まれていないのです。 私たちは、平均的な真核生物のゲノムの再会合曲線がこのようになることを見つけました。 曲線の最初の領域は、非常に早く再会合する構成成分で、高頻度反復配列を示しています。高頻度反復配列は、ゲノムの約25%になります。 曲線の二つ目の領域は、中間的な構成成分で、中程度の頻度で反復したDNAの再会合を示しています。この中間的DNAは真核生物ゲノムの約30%に相当します。 三つ目の領域は再会合の遅い構成成分で、この中には反復配列は含まれていません。この遅い構成成分は真核生物ゲノムの約45%に相当します。 私たちはこれらのDNA成分のうち、どの分画がタンパク質をコードしているかを調べました。そこで、放射性標識したメッセンジャーRNAを加えて、これと再会合する分画を探しました。 温度を下げると、メッセンジャーRNAは自身の鋳型DNAと対合してハイブリッドを形成します。高頻度反復配列とハイブリッドを形成するメッセンジャーRNAはありませんでした。 [DNA再会合] ごくわずかなメッセンジャーRNAは、中程度の頻度で反復したDNAの分画とハイブリッドを形成しました。 メッセンジャーRNAの大部分は、再会合の遅いDNA分画とハイブリッドを形成しました。このことから、大まかに見積もって、この分画がゲノム中のタンパク質をコードする分画であることが示唆されます。 緑の曲線は放射性標識したメッセンジャーRNAとDNAのハイブリッド形成を示しています。 [RNAトレーサーハイブリダイゼーション] もし、反復DNA配列がタンパク質をコードしないとすると、これらの配列はどこから生じて、なぜ今も存在するのでしょうか。 反復DNA配列はおそらくDNA複製のエラーに起因しています。ほとんどの高頻度反復配列は、セントロメアの近傍に見つかり、細胞分裂時に姉妹染色体を対合させるのに役立っているのかもしれません。 [セントロメア] [染色体] 高頻度反復配列は、主に非常に短い配列が、車や電車のように先頭から後尾まで順方向に反復した、“タンデムリピート(縦列反復)”構造になっています。この反復単位は、短いもので2塩基から… …約20塩基のものまであります。 中頻度反復配列は、ゲノム上に広く分散して存在する比較的DNA長の大きな因子から構成されます。主要なグループは、DNAの長さで2群に分けられます。数百塩基の長さを持つ散在配列はSINE(Short Interspersed Elements)で、数千塩基の長さ持つものはLINE(Long Interspersed Elements)です。 どちらのグループも、“ジャンピング(動く)遺伝子”とも呼ばれるトランスポゾンから生じたもので、これらが進化の間に新しい染色体上の位置に自身のコピーをジャンプさせることで蓄積されたものです。LINEは逆転写酵素(RT)を用いてジャンプします。これはレトロウイルスの逆転写酵素と一部は同じ機能ですが、似て非なるものです。 [DNAの挿入と転移] SINEは自分自身では逆転写酵素を作りません。SINEはLINEなどが作った逆転写酵素を"借り"ます。SINEとLINEは、ゲノムDNA上への挿入に同じ酵素を使用するにも関わらず、異なる挿入部位を好みます。 ヒトや他の霊長類は、約50万コピーのAluと呼ばれる300塩基の長さのSINEを持っています。Alu配列のみで、ヒトのゲノム配列の約5%を占めると考えられており、これはタンパク質をコードしている配列の割合に匹敵します!

factoid Did you know ?

LINEのような反復配列は、哺乳類が誕生する以前から存在していました。

Hmmm...

なぜ生物は反復配列を持っているのかを考えてみましょう。