蛋白質溶液学(アミノ酸)
疎水性が高いから溶けない? なぜこの20種類?
疎水性が高いから溶けない? なぜこの20種類?
アミノ酸の性質
タンパク質は、アミノ酸がペプチド結合で連なったポリマーである。多くのタンパク質は、結晶化できるほど均一な立体構造をとり、その構造に基づいて機能する。では、タンパク質はいかにして固有の立体構造を形成するのか。この問いは、科学において最も長く研究されてきたテーマの一つである。
一般に、タンパク質は、親水性側鎖を水に接触する外側に、疎水性側鎖を水と接触しにくい内側に配置するようにフォールディングすると説明される。しかし実際には、構造内部にある残基ほど疎水的であるとは限らない。本章では、生命を形づくる基本部品であるアミノ酸について、溶解度、側鎖の疎水性、立体構造形成能などの観点から比較する(1)。
◆アミノ酸の構造と性質
アミノ酸は、中心となる炭素原子(α炭素)に、アミノ基(–NH₂)、カルボキシル基(–COOH)、水素原子、および多様な化学的性質をもつ側鎖(R基)が結合した構造を基本単位とする。天然に存在するタンパク質構成アミノ酸はすべてα-アミノ酸であり、立体配置はほぼ例外なくL型である(唯一の例外は光学活性を持たないグリシン)。側鎖の化学的性質は、アミノ酸の物理化学的特性や立体構造における配置、さらにはタンパク質の機能発現において決定的な役割を担う。
生理的pH(約7.4)では、アミノ基がプロトン化され正に帯電(–NH₃⁺)、カルボキシル基が脱プロトン化され負に帯電(–COO⁻)するため、全体として正負両方の電荷をもつ双性イオンとして存在する。この両性電解質的性質は、溶解度や等電点(pI)などの化学的挙動に強く影響する。
タンパク質を構成する天然アミノ酸は20種類であり、それぞれ遺伝暗号表に対応するコドンによって翻訳される。隣接するアミノ酸は、カルボキシル基とアミノ基の間に形成されるペプチド結合によって連結され、直鎖状の一次構造を形成する。この結合は部分的に二重結合性をもち、アミド平面を形成するため回転が制限され、二次構造の形成に寄与する。
なお、タンパク質を構成したアミノ酸は、リン酸化(セリン、スレオニン、チロシン)や、アセチル化(リシン)、メチル化(アルギニン、リシン)など、多様な翻訳後修飾を受けることで、タンパク質の機能や局在が制御される。
◆側鎖の性質による分類と特徴
(1) 疎水性アミノ酸:アラニン(Ala)、バリン(Val)、ロイシン(Leu)、イソロイシン(Ile)、メチオニン(Met)、フェニルアラニン(Phe)、トリプトファン(Trp)などは側鎖が非極性または芳香族であり、疎水性が高い。水溶液中のタンパク質では疎水効果により、これらの残基は立体構造の内部に集まり、疎水性コアを形成して熱力学的安定化に寄与する。また、膜タンパク質の膜貫通領域や、疎水性リガンドとの相互作用面にも現れるアミノ酸である。
(2) 酸性(負電荷)アミノ酸:アスパラギン酸(Asp)、グルタミン酸(Glu)。側鎖のカルボキシル基がpH 7付近で解離し、負電荷を帯びる。金属イオンとの配位や塩橋形成に関与する。
(3) 塩基性(正電荷)アミノ酸:リシン(Lys)、アルギニン(Arg)、ヒスチジン(His)。リシンは側鎖アミノ基、アルギニンはグアニジニウム基により常に正電荷を帯びやすい。ヒスチジンは側鎖イミダゾール基のpKaが約6.0であり、生理的pH域でプロトン化状態が変化しやすく、酸塩基触媒として酵素活性中心で頻繁に利用される。また、ヒスチジンはpHセンシングや金属イオン結合においても重要な役割を果たす。
(4) 極性だが電荷を持たないアミノ酸:セリン(Ser)、スレオニン(Thr)、アスパラギン(Asn)、グルタミン(Gln)、チロシン(Tyr)は極性基(ヒドロキシル基、アミド基、フェノール基)をもち、水素結合の供与体または受容体として機能する。これらはタンパク質の表面に多く存在し、溶媒や基質との相互作用、リン酸化などの翻訳後修飾の標的となる。
(5) 特殊なアミノ酸:システイン(Cys):チオール基(–SH)をもち、酸化によりジスルフィド結合(–S–S–)を形成する。この共有結合は、タンパク質の三次構造および四次構造を強固に安定化する。細胞外環境のような酸化的条件下で特に重要であり、抗体や分泌性酵素などに多く見られる。また、チオール基は求核性が高く、補酵素結合や金属イオン配位にも利用される。
(6) 特殊なアミノ酸:プロリン(Pro):側鎖が主鎖アミノ基と環状結合を形成し、二級アミンとなっている。この構造的制約により、ペプチド鎖の回転自由度が著しく低下し、αヘリックスやβシートの形成を阻害することが多い。一方で、タンパク質構造の折れ曲がりやループ構造形成に不可欠である。
(7) 特殊なアミノ酸:グリシン(Gly):側鎖が水素原子1個のみであるため、立体障害が最小であり、構造的柔軟性が非常に高い。ループやターンなどの可動性の高い領域、または立体的に制限された部位に好んで存在する。光学活性を持たないため、L型・D型の区別は存在しない。
◆アミノ酸の水への溶解度
アミノ酸は、カルボキシル基とアミノ基を併せ持つ双性イオン(zwitterion)として存在するため、水にはよく溶ける一方、炭化水素のような非極性有機溶媒にはほとんど溶けない。また、同程度の分子量をもつ有機化合物と比べて融点や沸点が高いことも特徴である。
表に、20種類のタンパク質構成アミノ酸の25 ℃における水への溶解度(g/100 mL)を示す(2)。最も水溶性が高いアミノ酸はプロリンで、100 mLの水に130 gも溶ける。一方、最も溶けにくいのはチロシンで、わずか0.054 g(54 mg)しか溶けない。コップ一杯の水に、ほんのひとかけらのチロシンも溶けないのである。タンパク質を構成するアミノ酸の水への溶解度には、およそ2,500倍もの差があるのは興味深い事実である。
ここで、個々のアミノ酸を比べながら、溶解度とは何かを考えてみたい。アミノ酸の溶解度と化学構造を見比べると、一見予想に反する例がある。たとえばフェニルアラニンとチロシンはいずれも側鎖にベンゼン環をもつが、フェニルアラニン(疎水性側鎖)は100 mLの水に2.8 g溶けるのに対し、チロシン(ベンゼン環の先に親水性のヒドロキシ基を持つ)は0.054 gしか溶けない。親水性基をもつチロシンの方が、むしろ50分の1しか溶けないのである。
この理由は、単純に「側鎖の親水性が高いと水に溶けやすい」という発想だけでは説明できない。溶解度は、分子の水との親和性だけでなく、固体状態の安定性(結晶格子エネルギー)にも依存する。チロシンは分子間で強い水素結合ネットワークを形成し、結晶構造が非常に安定であるため、固体から水中へ分散するのが難しい。一方、フェニルアラニンは固体状態での相互作用が比較的弱く、結晶格子から水中への移行が起こりやすい。そのため、似た構造をもつ二者であっても、溶解度が大きく異なるのである。
一方、最も水に溶けやすいアミノ酸であるプロリンは、疎水性アミノ酸とは異なる特徴を示す。プロリンは環状の二級アミン構造をもち、分子全体がコンパクトにまとまっているため、疎水性部分が外部に大きく露出せず、双性イオンとしての電荷や極性基が水と強く相互作用できる状態が保たれる。また、固体状態における分子間相互作用が比較的弱く、結晶格子の安定化も小さい。このため、固体から水中へ分散する際のエネルギー障壁が低く、さらに水和による自由エネルギー利得が大きく働く。つまり、結晶状態が不安定であり、同時に水和が有利であることが、プロリンの異常に高い水溶性(130 g/100 mL水)を生む主因である。
この特徴は、フェニルアラニンやチロシンと比べるとよく分かる。フェニルアラニンは側鎖が疎水性のベンゼン環であり、固体状態での分子間相互作用が比較的強く、チロシンはベンゼン環にヒドロキシ基を持つにもかかわらず、固体中で水素結合ネットワークを形成して結晶安定化が強い。このため、両者の水への溶解度はプロリンに比べて低く、フェニルアラニンは2.8 g/100 mL、チロシンはわずか0.054 g/100 mLしか溶けない。プロリンの場合は、結晶安定性の低さと水和の有利さが重なり、構造的に非常に水に溶けやすい例外的なアミノ酸となっている。
塩基性アミノ酸であるリシンやアルギニンは、100 mLの水に数十グラムと非常に高い溶解度を示すのに対し、酸性アミノ酸であるグルタミン酸やアスパラギン酸は、同じ100 mLの水に1 gも溶けない。どちらも側鎖に電荷をもち、直感的には水によく溶けそうに思えるが、実際の溶解度は大きく異なる。この理由もプロリンと同様、固体状態の安定性と水和のバランスで説明できる。酸性アミノ酸は分子間で強い水素結合やイオン性相互作用を形成しやすく、結晶格子の安定化が大きいため、固体から水中へ分散するのに高いエネルギーが必要となる。一方、リシンやアルギニンは側鎖の長いアルキル鎖に末端アミノ基やグアニジニウム基をもつため、固体中での分子間相互作用は相対的に弱く、水和による自由エネルギー利得が非常に大きくなる。その結果、塩基性アミノ酸は酸性アミノ酸に比べて圧倒的に水に溶けやすいのである。
さらに、酸性アミノ酸とそのアミド誘導体を比較すると、固体安定性の影響がより明確になる。例えば、グルタミン酸に比べてグルタミンは約5倍高い水溶性を示し、アスパラギン酸よりアスパラギンの水溶解度も同様に約5倍高い。これは、アミド化によって固体中での水素結合ネットワークが弱まり、水分子との相互作用が有利になるためであり、酸性アミノ酸の水に溶けにくい性質が主に固体構造の安定性に由来することを示している。
◆移相自由エネルギーの算出
今度は、アミノ酸そのものの溶解度ではなく、アミノ酸の側鎖の疎水性について考えてみよう。側鎖の疎水性を定量的に評価するために、古典的に用いられてきた方法のひとつが分配実験である。
具体的には、水と有機溶媒(典型的にはオクタノール)の二相系を準備する。両者は互いに混じらず、上相と下相に分離する。この系にアミノ酸を加えて十分に平衡に達した後、それぞれの相に分配したアミノ酸の濃度を測定する。そのアミノ酸がもし水に溶けやすければ水の中に多く含まれるし、そうでなければ有機溶媒の中に多く含まれることになる。こうして得られる「有機相/水相の濃度比」が分配係数Pであり、その常用対数(log P)を取ることで、分子が水相から有機相に移動する際の自由エネルギー変化ΔGに換算できる。
25 ℃では、ΔGはおよそ logP x (-1.36 kcal/mol) に相当する。すなわち単純な計算では、logPが1増えるごとに約1.36 kcal/mol分だけ有機相が有利になる。ただし、この値にはアミノ酸の主鎖部分(–NH₃⁺ と –COO⁻ をもつ骨格)の寄与が必ず含まれてしまう。そこで、主鎖だけを持つグリシンの移相自由エネルギーを基準値として測定し、各アミノ酸の移相自由エネルギーからグリシンの値を差し引く。この操作により、純粋に側鎖のみが担う疎水性の寄与を抽出することができる。
このようにして得られたアミノ酸側鎖の疎水性の定量値は、NozakiとTanfordによって1971年に初めて体系的に報告された(3)。彼らの報告に基づく値は現在でも疎水性スケールとして広く引用されている。表に示した Hydrophobicity 値は、オクタノールから水への移相自由エネルギーであり、値が正であるほど有機相に分配されやすく、より疎水的であることを意味する。
◆アミノ酸側鎖の疎水性
このようにして求めたアミノ酸の側鎖の疎水性に関する一覧表を見てみたい。この表はFauchereらの数値による(4)。一覧を見てみると、数値は我々の直感によく一致しているように見える。
最も大きな疎水性を示すのはトリプトファンであり(ΔG ≈ +2.25 kcal/mol)、次いでフェニルアラニンやロイシン、イソロイシンといった、メチル基やベンゼン環など大きな疎水性基を側鎖にもつアミノ酸が続く。側鎖がもう少し小さいバリンや、芳香環にヒドロキシ基を導入したチロシンは、それらより疎水性が低くなる。一方、セリン(ΔG ≈ –0.04 kcal/mol)やスレオニンのように小さな水酸基を持つアミノ酸や、アスパラギンやグルタミンのようにアミド基を持つアミノ酸は、負電荷こそ持たないが親水性の性質である。
側鎖に解離基を持つリシン(ΔG ≈ –0.99 kcal/mol)やアルギニン、グルタミン酸やアスパラギン酸などは、さらに親水的であり、移相自由エネルギーは大きく負の値をとる。これらは水和がきわめて有利であり、有機溶媒相に分配されにくいことを意味する。
なお、チロシンは上述のとおり水にほとんど溶けないが、有機溶媒にも同様に溶けにくい。そのために水とオクタノール間の溶解度比をとると、フェニルアラニンより疎水性が低く、バリンよりは疎水性が高いという、妥当な値を示していることがわかる。
◆タンパク質の構造の内部と外部
タンパク質が立体構造を形成するとき、各アミノ酸残基がタンパク質の内部に配置されやすいのか、それとも外部に露出しやすいのかを統計的に解析したChothiaらの研究がある(5)。彼らは結晶構造が明らかになっていたタンパク質を解析し、アミノ酸ごとの平均的な溶媒露出度を定量化した。その結果を、溶媒中での移相自由エネルギーと同様の形式に換算することで、アミノ酸ごとに「内部から表面へ移動させたときのエネルギー変化(kcal/mol)」が推定された。表1の In–Out の欄には、その値がまとめられている。
脂肪族アミノ酸(アラニン、バリン、ロイシン、イソロイシンなど)は、疎水性が高いためタンパク質の内部に配置されることが有利であり、正の大きな値を示す。一方、アルギニンやリシンのような塩基性アミノ酸は正電荷をもつため水和が極めて有利であり、負の大きな値を示してタンパク質表面に位置する傾向が強い。酸性アミノ酸(アスパラギン酸、グルタミン酸)も同様に負の値をとり、外部に局在することが多い。
興味深いのは芳香族アミノ酸である。トリプトファンは側鎖が大きく疎水性指標(移相自由エネルギー)も高いにもかかわらず、In–Out の値はそれほど大きくない。つまり、必ずしもタンパク質内部に深く埋もれるわけではなく、部分的に表面に露出する傾向をもつ。その結果、トリプトファンの位置づけはアラニンやバリンと同程度の中間的な値となっている。これは、トリプトファンの大きな芳香環が内部に完全に収まりにくく、立体障害が制約要因となっているためと考えられる。
特に、システイン・メチオニン・トリプトファンの3種類は疎水性の大きさが互いに異なるにもかかわらず、埋もれやすさはほぼ同程度を示す点が興味深い。これは、単純な疎水性指標だけでは説明できない、立体構造上の制約や特殊な化学的性質(システインのジスルフィド結合、メチオニンの柔軟な硫黄原子、トリプトファンの大環芳香環)などが影響していると考えられる。
アミノ酸の疎水性を横軸に取り、タンパク質の立体構造を形成したときの内外への位置を縦軸にグラフにしてみると傾向がわかる。疎水性がある程度の値までは疎水性が高いほどタンパク質の内部に位置しやすいが、一定以上の疎水性の高さになると頭打ちになる。側鎖が大きくなりすぎると、内部でパッキングするときに困難になるために、単に疎水性が高いというだけでは内部に位置しにくいのである。
このような研究の流れで、Chothiaは後年、タンパク質の立体構造は限られた数のフォールドに分類できるという重要な指摘をしている(6)。アミノ酸配列の類似性が乏しいタンパク質同士であっても、立体構造を比較すると同じ基本的な折り畳み様式をとることが少なくない。Chothia は既知の構造データを系統的に解析し、自然界のタンパク質がとりうる立体構造の種類はおおよそ数千程度に収まると見積もった。これは「タンパク質構造空間の有限性」という概念として広く受け入れられ、その後の構造分類体系の基盤となり、構造ゲノミクスやホモロジーモデリングの発展を大きく促した。
◆アミノ酸のハイドロパシー
ハイドロパシー(hydropathy)スケールは、Kyte と Doolittle が1982年に提案したタンパク質の疎水性に関する重要な指数である(7)。このスケールは、単にアミノ酸側鎖の水・有機溶媒間の移相自由エネルギーだけでなく、タンパク質立体構造を形成したときに埋もれやすいかどうかも含めて算出されたものである。すなわち、アミノ酸がタンパク質を形成した場合の「実質的な疎水性」を反映した値となっている。
側鎖の疎水性に対してハイドロパシーをプロットすると、一定の相関は見られるものの、個々の残基によってかなりばらつきがあることがわかる。例えば、アラニンは側鎖の疎水性自体は小さいにもかかわらず、タンパク質内部に埋もれやすいため、ハイドロパシーは比較的大きな値を示す。それとは対照的に、芳香族残基のトリプトファンやチロシンは、疎水性が大きいにもかかわらず側鎖のサイズも大きいため内部に完全に埋まることが難しく、表面に部分的に露出しやすい。その結果、これらのアミノ酸はハイドロパシーが低くなっている。
このように、Kyte–Doolittle のハイドロパシースケールは、アミノ酸の側鎖疎水性だけでなく、立体構造における空間的制約やパッキング効果も考慮した「実質的な疎水性」の指標として広く受け入れられている。実際、この論文は現在までに約22,000回引用されている。1億本あるとされる学術論文の中でも引用数から考えてトップ100に入る影響力を持つことからも、その重要性がうかがえる(8)。
◆アミノ酸の二次構造の取りやすさ
アミノ酸には、固有の二次構造形成傾向という値も存在する。代表的な二次構造であるα-ヘリックスは、ペプチド主鎖のアミノ基とカルボキシ基間で水素結合を形成し、全体としてらせん構造をとる。側鎖はらせんの外側に向き、3.6残基で1回転する。一方、β-ストランドも主鎖間の水素結合により伸びた構造をとり、側鎖は交互に上下方向に向く。Chou と Fasman は1974年に、15種類の既知タンパク質構造を解析し、各アミノ酸がα-ヘリックスやβ-ストランドに含まれる頻度を算出することで、アミノ酸固有の二次構造形成傾向を定量化した(9)。
表のαおよびβの値は、それぞれのアミノ酸がα-ヘリックスやβ-ストランドに存在する割合を示す。アミノ酸によって明確な傾向があり、側鎖の性質によって形成能が異なることがわかる。例えば、グルタミン酸はα-ヘリックスを好む一方でβ-ストランド形成はほとんどせず、アスパラギン酸はどちらもわずかに好まない。グリシンは主鎖の二面角自由度が高くα-ヘリックスを形成しにくいが、側鎖にメチル基を持つアラニンになると自由度が制限され、α-ヘリックスを形成しやすくなる。分岐型脂肪族アミノ酸であるイソロイシンやバリンはβ-ストランドを好み、疎水性コアの形成に寄与する。逆にプロリンは環状構造により取りうる二面角が限られるため、α-ヘリックスもβ-ストランドも形成しにくい。
ちなみに、アミノ酸の側鎖の疎水性と二次構造形成傾向はほとんど相関がない。このことは、タンパク質立体構造が主鎖の二次構造だけでなく、側鎖パッキングを含む三次構造によって制御されることを示している。1970年代から90年代には、経験的な二次構造指標を組み合わせて立体構造予測を試みる研究が盛んだったが、完全な予測は困難であった。21世紀に入ると、計算能力の向上により全原子間相互作用を第一原理から計算する手法が台頭し(10)、さらにAIを用いた設計により、天然には存在しない多くのタンパク質が創出されるようになっている。
参考文献
1. Nomoto, A., Nishinami, S., and Shiraki, K. (2021). Solubility parameters of amino acids on liquid–liquid phase separation and aggregation of proteins. Frontiers in cell and developmental biology, 9, 691052.
2. Fleck, M., and Petrosyan, A. M. (2014). Salts of Amino Acids: Crystallization, Structure and Properties. Cham: Springer, doi: 10.1007/978-3-319-06299-0
3. Nozaki Y, Tanford C. The solubility of amino acids and two glycine peptides in aqueous ethanol and dioxane solutions. Establishment of a hydrophobicity scale. J Biol Chem. 1971;246(7):2211–2217.
4. Fauchère JL, Charton M, Kier LB, Verloop A, Pliska V. Amino acid side chain parameters for correlation studies in biology and pharmacology. Int J Pept Protein Res. 1988;32(4):269–278.
5. Miller S, Janin J, Lesk AM, Chothia C. Interior and surface of monomeric proteins. J Mol Biol. 1987;196(3):641–656.
6. Chothia, C. (1992) "Proteins. One thousand families for the molecular biologist". Nature 357:543-4.
7. Kyte J, Doolittle RF. A simple method for displaying the hydropathic character of a protein. J Mol Biol. 1982;157(1):105–132.
8. https://www.nature.com/news/the-top-100-papers-1.16224
9. Chou PY, Fasman GD. Conformational parameters for amino acids in helical, beta-sheet, and random coil regions calculated from proteins. Biochemistry. 1974;13(2):211–222. doi:10.1021/bi00699a001
10. Baker D, Sali A. Protein structure prediction and structural genomics. Science. 2001;294(5540):93–96. doi:10.1126/science.106565
20種類のアミノ酸が選ばれた理由
生物を構成するアミノ酸は20種類である。では、なぜこの20種類のアミノ酸セットが選ばれ、現在まで変わることがなかったのだろうか。さまざまな理由が議論されてきたが、ここではタンパク質フォールディングの観点から、この標準アミノ酸の性質を考えてみたい。
◆タンパク質を構成するアミノ酸
生物の遺伝子にコードされるアミノ酸は基本的に20種類である。例外的に、システインの側鎖がセレンに置き換わったセレノシステイン(1)や、リシン側鎖にピロリン環が結合したピロリシン(2)を持つ生物も存在するが、全体としてはほぼ全ての生物が同じアミノ酸セットを利用している。この20種類のアミノ酸の表を眺めると、いくつかの疑問が自然に湧いてくる。
一部の疑問は、従来の生化学や高分子科学の知識で説明できる。α-アミノ酸はβ-アミノ酸やγ-アミノ酸に比べて、非生物的条件下でも合成されやすいことが知られており、ミラーの放電実験や隕石中のアミノ酸分析でも確認されている(3)。しかし、それだけでは説明が不十分である。例えば、ペプチド結合はエステル結合やチオエステル結合よりも加水分解に強く、ヒドロキシ酸やチオ酸よりも安定であることが、選択の一因であった可能性がある(4)。さらに、ポリエステルやポリチオアミドでは、タンパク質の二次構造を安定化する主鎖間の水素結合を形成できないため、現存するタンパク質に類似した立体構造は作れない。主鎖に炭素が一つ多いβ-ペプチドも立体構造を形成できるが、フォールディング可能な空間を考慮すると、α-ペプチドの方が有利であると考えられる(5)。
では、α-アミノ酸の中で、なぜこの20種類が標準として選ばれたのだろうか。20種類のアミノ酸の大きさはさまざまで、炭素数で見るとグリシンはわずか2個だが、最も大きなトリプトファンは11個のである。炭素数が増えるほど異性体の数も急増する。例えば、炭素数6個のアミノ酸には理論上654種類もの異性体が存在するが、標準アミノ酸セットに含まれるのはロイシンやイソロイシンなどわずか5種類しかない(3)。このように、α-アミノ酸には多くの候補があるにもかかわらず、なぜ一部のみが選ばれたのだろうか。それは次に述べるように、ペプチドになったときの溶解性やフォールディングのしやすさが、この選択に大きく関わった可能性が高いと考えられている。
◆初期アミノ酸セットの特徴
生物の標準アミノ酸20種類を分類すると、無生物的に合成されやすい初期アミノ酸として、疎水性や酸性のアミノ酸など約10種類が含まれることがわかる(6)。これらは、ミラーの放電実験や熱水噴出孔での合成、隕石の分析などからも示唆され、初期アミノ酸の組み合わせによりタンパク質様のペプチドが形成されていた可能性がある。その後、塩基性アミノ酸や芳香族アミノ酸、チオール基を持つアミノ酸が生化学的に合成可能となり、後期アミノ酸として標準セットに組み込まれたと考えられている(7)。初期には酸性アミノ酸は存在していたが、塩基性アミノ酸はまだ存在しなかったとされる(8)。
一方、前生物的世界に豊富であったとされるノルバリンやノルロイシンのような直鎖側鎖アミノ酸、小型の2-アミノブチル酸は標準アミノ酸には選ばれなかった。この代わりに、同程度の大きさの分岐アミノ酸(バリン、ロイシン、イソロイシン)が標準アミノ酸として採用された。系統学的分析によると、トリプトファンは20種類の中で最後に追加されたアミノ酸とされる(10)。すなわち、普遍的共通祖先が登場した時点で遺伝暗号表は完成しておらず、後にバージョンアップされることで現在の20種類のアミノ酸セットが形成され、地球上の生物多様性を支えてきたと考えられる(11)。
◆フォールダビリティとアミノ酸
20種類のアミノ酸セットを、ペプチドのフォールディングの観点から評価した研究がある(12)。ここでは、想定される初期アミノ酸から25残基のペプチドを合成し、その物理化学的性質を調べたものである。
初期アミノ酸セットには、小型アミノ酸(グリシン、アラニン、プロリン)、ヒドロキシ基を持つアミノ酸(セリン、スレオニン)、酸性アミノ酸(アスパラギン酸、グルタミン酸)、分岐アミノ酸(バリン、ロイシン、イソロイシン)が含まれ、進化上後期に追加された塩基性や芳香族アミノ酸は含まれていない。これらをランダムにペプチド結合して作った25残基のペプチドを「初期アミノ酸ペプチド」と名付けた。同様に、分岐アミノ酸を直鎖状アミノ酸に置き換えたペプチドを「アンブランチペプチド」、初期アミノ酸にアルギニンを加えたペプチドを「アルギニンペプチド」、チロシンを加えたペプチドを「チロシンペプチド」、直鎖状のジアミノブチル酸を加えたペプチドを「ジアミノペプチド」と呼んだ。
ここで、合成ペプチドの溶解度を比較すると、アンブランチペプチドは溶解性が高く、さらにジアミノペプチドは溶解性がより高かった。これは、前生物時代に豊富だったアミノ酸を単純にペプチド化すると溶解性が高すぎるため、溶けやすいアミノ酸が排除される方向で初期アミノ酸セットが形成されたことを示唆する。
さらに、システインを除く標準アミノ酸19種類からなるペプチドでは、酸性から中性pHで広い範囲にわたり溶解性が低いことが確認され、初期アミノ酸よりも溶解性が抑えられることがわかった(13)。また、初期アミノ酸ペプチドやアンブランチペプチド、ジアミノペプチドは二次構造を形成しにくいが、チロシンの追加で二次構造形成能が向上することも確認された。標準アミノ酸として最後にトリプトファンが加わったことも、この溶解性とフォールディングの関係と関連していると考えられる。すなわち、初期アミノ酸から現在の標準アミノ酸セットが形成される過程には、溶解性の適正化と二次構造形成能の向上が重要な要因として関与していたと理解できる。
◆アミノ酸から見たタンパク質
生物を構成するアミノ酸は、単に無生物的に合成されやすいという理由だけで選ばれたわけではない。ペプチドが立体構造を形成しやすいようなバイアスがかかっていたのである。正電荷を持つアミノ酸は水に溶けやすいため、初期のアミノ酸セットには含まれなかったと考えられる。しかし、ペプチドがある程度フォールディングできるようになると、側鎖の負電荷は正電荷とのイオン対形成によって構造を安定化できるようになり、存在に有利である。こうして後に、塩基性アミノ酸は標準アミノ酸に組み込まれていったと考えられる。また、芳香族アミノ酸は、短いペプチドに組み込まれると二次構造を安定化しやすいため、現存する3種類にまでバリエーションが増えたのかもしれない。
この過程を液–液相分離(LLPS)の観点から見ると、初期アミノ酸セットは「溶解性が高すぎず、局所的凝集や相分離が過剰にならない」バランスを持っていたことがわかる。後期アミノ酸の追加により、疎水性、電荷、芳香族残基による相互作用が増え、ペプチドやタンパク質は局所的な濃縮や機能的ドメイン形成を行いつつ、安定した二次・三次構造も維持できるようになった。つまり、標準アミノ酸セットの選択は、フォールディング可能性と液–液相分離の両方を制御するという、シンプルで強力な物理化学的制約に基づいていたと考えられる。
共通性と多様性を兼ね備えた20種類のアミノ酸セットは、地球上の生物が何十億年もかけて多様なタンパク質を生み出し、さまざまな環境に適応して進化する基盤となったのである。タンパク質のフォールディングと相分離という単純な制約が、生命の普遍性と多様性の両方を支えていたのは、非常に示唆に富む事実である。
参考文献
1. Johansson L, Gafvelin G, Arnér ES. Selenocysteine in proteins-properties and biotechnological use. Biochim Biophys Acta. 2005 Oct 30;1726(1):1-13.
2. Krzycki JA. The direct genetic encoding of pyrrolysine. Curr Opin Microbiol. 2005 Dec;8(6):706-12.
3. Cronin JR. Origin of organic compounds in carbonaceous chondrites. Adv Space Res. 1989;9(2):59-64.
4 .Cleaves HJ 2nd. The origin of the biologically coded amino acids. J Theor Biol. 2010 Apr 21;263(4):490-8.
5. Cheng RP, Gellman SH, DeGrado WF. beta-Peptides: from structure to function. Chem Rev. 2001 Oct;101(10):3219-32.
6. Cleaves HJ 2nd. The origin of the biologically coded amino acids. J Theor Biol. 2010 Apr 21;263(4):490-8.
7. Higgs PG, Pudritz RE. A thermodynamic basis for prebiotic amino acid synthesis and the nature of the first genetic code. Astrobiology. 2009 Jun;9(5):483-90.
8. Meierhenrich UJ, Muñoz Caro GM, Bredehöft JH, Jessberger EK, Thiemann WH. Identification of diamino acids in the Murchison meteorite. Proc Natl Acad Sci U S A. 2004 Jun 22;101(25):9182-6.
9. Zaia DA, Zaia CT, De Santana H. Which amino acids should be used in prebiotic chemistry studies? Orig Life Evol Biosph. 2008 Dec;38(6):469-88.
10. Fournier GP, Alm EJ. Ancestral Reconstruction of a Pre-LUCA Aminoacyl-tRNA Synthetase Ancestor Supports the Late Addition of Trp to the Genetic Code. J Mol Evol. 2015 Apr;80(3-4):171-85.
11. Freeland S. Undefining life's biochemistry: implications for abiogenesis. J R Soc Interface. 2022 Feb;19(187):20210814.
12. Makarov M, Sanchez Rocha AC, Krystufek R, Cherepashuk I, Dzmitruk V, Charnavets T, Faustino AM, Lebl M, Fujishima K, Fried SD, Hlouchova K. Early Selection of the Amino Acid Alphabet Was Adaptively Shaped by Biophysical Constraints of Foldability. J Am Chem Soc. 2023 Mar 8;145(9):5320-5329.
13. Tretyachenko V, Vymětal J, Neuwirthová T, Vondrášek J, Fujishima K, Hlouchová K. Modern and prebiotic amino acids support distinct structural profiles in proteins. Open Biol. 2022 Jun;12(6):220040.