遺伝子の構成

原核生物の転写単位

遺伝子の転写単位には、次の3つがある。

 (a) モノシストロン転写単位: 単一のタンパク質をコードする遺伝子

   コード配列の前後に5'リーダー(leader)と3'トレーラー(trailer)がつく。

 (b) ポリシストロン転写単位: オペロンを構成する複数のタンパク質をコードする遺伝子

 (c) rRNAとtRNAをコードする遺伝子: スペーサー配列で区切られている。

=>原核生物のタンパク質遺伝子の多くはポリシストロン転写単位である。

[原核生物の遺伝子の構造的特徴]

真核生物の転写単位

真核生物の場合、全てモノシストロン転写単位から成る。用いられる転写系の違いで次の3つに分けられる。

(1) クラスI遺伝子: RNAポリメラーゼI(核小体に局在)によって転写

   5.8S, 18S, 28S rRNA前駆体の遺伝子(タンパク質を作るリボソームに関係していることに注目)

(2) クラスII遺伝子: RNAポリメラーゼIIによって転写

   全てのmRNAと核内低分子RNA(snRNA)遺伝子

(3) クラスIII遺伝子: RNAポリメラーゼIIIによって転写

   5S rRNA, tRNA, いくつかの細胞質低分子RNA(scRNA)遺伝子

ゲノム


遺伝子(gene)は、個々の表現形質に対応する原因となる単位を表わし,分子的には独立した存在ではなく,単に巨大なDNAの一部である。これに対して、ゲノム(genome)という概念は、ある生物種の個体全体を完全な状態に保つために必要な遺伝的情報の1セットを指す言葉である。従って,生物種ごとに固有のゲノムが存在する。ウイルスや細菌についてもファージゲノム細菌ゲノムとよぶ。細胞小器官でDNAをもつミトコンドリアや葉緑体についても、ミトコンドリアゲノム葉緑体ゲノムと呼ぶことができる。遺伝情報そのものはDNAの塩基配列であるから,ゲノムの実体はDNAそのものといえる。

 今後、たくさんの生物のゲノムの全構造が決められ、 その中の遺伝子と遺伝子産物に関する情報が次々と明らかにされるであろう。ゲノム全体を対象に全遺伝情報を調べあげ、そこから個別的な研究を始めるという研究を「ゲノム生物学」という。

ヒトのゲノムDNAには何が書かれているのか?

タンパク質とrRNA,tRNAをコードする約22,000個の遺伝子があるとされている。構造遺伝子領域はわずかに全体の1.5%ほど,残りはまだ十分にわかっていない。

構造遺伝子領域(全体の1.5%)

・ リボソームRNA遺伝子約250コピーが複数の染色体上に存在する。5S rRNAは約2,000コピーもある。 RNAポリメラーゼI の1分子がrRNA前駆体を転写するのに約5分かかる。複数のポリメラーゼで一度にたくさんのrRNAをつくるには多コピーが必要。

・ tRNA遺伝子約1,300コピー存在(1つのtRNA当り約10~100コピー)

・ タンパク質をコードする遺伝子。通常、1つのタンパク質当り1コピー。(例外的に,ヒストンのように同じ遺伝子が多数、直列に配置している場合もある)

・ また、a-およびb-グロビン遺伝子群、アクチン群、チューブリン群、コラーゲン群など、遺伝子重複によって生じた近縁遺伝子群(多重遺伝子)が25~50%を占める。

[グロビン遺伝子スーパーファミリーの分子進化(分子系統樹)]

グロビン遺伝子群は共通の祖先遺伝子から進化した。

非コード領域(~30%)

・ 遺伝子を分断するイントロン、転写調節領域、5'-リーダーや3'-トレーラー配列などがある。

いくつかの遺伝子における介在配列(イントロン)

植物,動物,それらに感染するウイルスにはイントロンが多いが,無脊椎動物ではまれ。原核生物にはないが,T4バクテリオファージのチミジル酸シンテターゼにはイントロンがある。古細菌にもイントロンが見つかっている。

非遺伝子領域: ゲノム全体の〜70%

機能不明ものが多い。ガラクタ(junk)DNAといわれてきた。マウスゲノムの発現の解析から、全体の長さの60%以上が何らかの形で細胞内で利用されていることが報告されている。人でも同様の仕組みがあると考えられるので、下記の非繰り返し配列にはまだ機能未知のものが含まれる可能性が高い。

非繰り返し配列(ゲノム全体の〜50%)

・ 遺伝子重複で生じた非機能性の偽遺伝子(pseudogene)

・ スペーサーDNA遺伝子間を区切っている無意味な配列

・ 応答エレメント(エンハンサーやサイレンサー配列)、複製開始点など

繰り返し配列(〜20%)

[縦列型反復配列] 短い配列が同じ領域に数千回繰り返している

・ サテライトDNA(セントロメア近傍に局在)

・ ミニサテライトDNA(大きさが>500bp)染色体末端に存在。

 テロメアはTTAGGGという配列が2000回以上(12kbp)繰り返したミニサテライトである。

・ ミクロサテライトDNA(大きさが500bp以下)染色体全体に散在。

[分散型反復配列] 染色体に散在する反復配列(ゲノム全体の10%)

・ 短分散型核因子(SINE): (例)Alu配列ゲノム全体の5%

・ 長分散型核因子(LINE): (例)L16.1kbp。2つのORFをもつ。ゲノム全体の4%。

・ ウィルス遺伝子の挿入痕跡レトロウィルスのプロウィルスDNA(LTR)

・ トランスポゾン(transposons、動く遺伝子)染色体をあちこち動き回る遺伝子

《Alu配列》制限酵素Alu Iで切断される部位を持つ全長300bpの配列で、ゲノム全体にほぼ均一に存在。

ミトコンドリアのゲノム

ミトコンドリアの構築や機能に必要なタンパク質の大部分は核DNAの遺伝子でつくられるが、一部はミトコンドリアゲノムにコードされている。ゲノムの大きさや遺伝子の構成は種によって大きく異なる。動物では20kbp以下、植物では数100~数1000kbp、酵母は約80kbp。1つのミトコンドリアに5~10コピー存在する。

【ヒトミトコンドリアDNAの特徴】

 全体的には原核生物的な特徴が見られるが,mRNAがポリA化されるなど真核生物的性質も兼ね備えている。

ゲノムの構造

・ミトコンドリアDNAはクリステに結合した状態で存在し,核様体をなす(原核生物的)。

・ミトコンドリアゲノムは環状二本鎖構造をしており,数コピー存在する。

・ゲノムには13個のタンパク質、2個のrRNA(原核生物的)および全種類のtRNAがコードされている。

・遺伝子にはイントロンがない(原核生物的)。

・ミトコンドリアDNAは核DNAよりも10倍早く変異する種内集団遺伝学の研究対象としてよく用いられる

DNA2本鎖(H鎖,L鎖と呼ぶ)のそれぞれに複製起点(OriHとOriL)が存在。

内側の矢印はOriHからの転写産物。一番内側の矢印はrRNA専用の転写。

OriLからは全長のものは1つだけつくられる。

遺伝子の向きは時計回りのものと,反時計回りのものとがある。

赤いboxはtRNA遺伝子。

ND, NADHデヒドロゲナーゼ複合体; CO, シトクロムcオキシダーゼ;Cytb, シトクロムb

ミトコンドリアの分裂とDNA複製

・細胞分裂に伴ってミトコンドリアも分裂する。この時,細胞の分裂に先立ってミトコンドリアの分裂も起こる。

・ミトコンドリアのDNAの複製は核DNAとは独立に行われるが,核の遺伝子で厳密な制御を受けている。複製酵素はDNAポリメラーゼgである。

転写

・転写は特別なミトコンドリアRNAポリメラーゼが行う。

・mRNAはポリA化されるが(真核生物的),5'末端のキャップ構造はない(原核生物的)。

・2つのDNA鎖(H鎖,L鎖)のそれぞれに複製起点(OriHとOriL)が存在し,それぞれ全長が転写されてプロセシングでmRNA, rRNA, tRNAになる。

・rRNA専用の転写もある → 一度に多くのrRNAを作るため

・いくつかの遺伝子には終止コドンがない → これらの転写産物の3'末端はUかUAで、ポリA化されるとUAAという終止コドンが自動的に生じる。

翻訳

・ミトコンドリアのコドンは核のコドンと一部異なる。また,種による違いもある。

→AUG以外に、AUA, AUU, AUCも開始コドン

→UGAは終止コドンではなくTrpのコドン

→AGAとAGGはArgのコドンではなく終止コドン

・翻訳の際、開始tRNAはFormyl-Metを運ぶ(原核生物的)

・ミトコンドリアのリボソームは細胞質のリボソームよりも小型(原核生物的)