植物轉錄活化區域的鑑定
Identification of plant transcriptional activation domains
植物轉錄活化區域的鑑定
Identification of plant transcriptional activation domains
在 Arabidopsis thaliana 中,基因表現受逾 1,900 種轉錄因子(TFs)調控,然而其活化結構域(activation domains, ADs)的存在、定位與功能仍鮮為人知。本研究透過酵母文庫策略,於蛋白質體層級鑑定 Arabidopsis 的 AD,發現超過半數 TFs 含有 AD,並註解出 1,553 個,其中大多為首次揭示。基於此數據集,研究人員建構神經網路模型,能精確預測 AD 並解析其驅動共活化子招募的序列特徵,進一步揭示六種具代表性的序列組合可賦予轉錄活化功能。此外,在古老的生長素反應因子(ARF)家族中亦鑑定出保守的 AD 定位。
此研究不僅建立了完整的 AD 資源與預測模型,也為探討轉錄活化與內在無序區域的功能提供關鍵框架。
轉錄因子(Transcription Factors, TFs)是發育調控及對環境刺激反應的核心元件。
它們的功能依賴於兩個基本能力:(1) 與特定 DNA 序列結合; (2) 招募轉錄共激活因子 (coactivators) 或共抑制因子 (corepressors)。
由於轉錄因子的 DNA 結合域 (DNA-binding domains, DBDs) 結構保守且明確,我們對其分子作用機制已有深入理解,且多項大規模研究已描繪了 TF 結合位點。然而,對於轉錄因子如何招募多樣化的共激活或共抑制複合體,其分子交互作用仍存在諸多未知,尤其是在植物中。
活化域(Activation Domains, ADs)是負責招募共激活複合體以促進轉錄的效應域。
ADs 通常位於蛋白質的天然無序區 (Intrinsically Disordered Regions, IDRs),缺乏明確的三維結構,且序列保守性低,這使得 AD 的研究極具挑戰性。由於缺乏有效識別方法,迄今僅少數植物轉錄因子的 AD 被注釋,限制了研究者對 TF 活性、基因調控網路重建及合成生物工具開發的進展。
PADI 與 TADA:植物活化結構域的高通量鑑定與預測
此研究中,Nicholas Morffy 等人提出了一種基因組尺度的實驗方法 -
植物活化域鑑定(Plant Activation Domain Identification, PADI),此高通量測試策略, 可直接鑑定植物轉錄因子的 AD。
同時,開發了基於深度學習的轉錄活化域活性網絡 (Transcriptional Activation Domain Activity, TADA),以支援未來 AD 的預測與鑑定。
這些成果,結合基因編輯技術的持續發展與精進,將對合成型 AD 的設計產生革命性影響,使研究者能夠精準控制轉錄活化的強度與時機。
流式細胞儀分選技術在全基因組 AD 研究中的關鍵應用
在 PADI 高通量實驗中,流式細胞儀(Flow Cytometry)尤其是 FANS(Fluorescence-Activated Nuclei Sorting)技術,為實驗帶來重要的影響力:
高通量篩選與定量 : FANS 可在單核層級精確測定螢光信號,分析數十萬細胞或核,快速篩選出具有活性的 AD。
解析異質性與分子特徵 : FANS 透過核層級分選與量化,能精確描繪 AD 活性分布,提供高解析度數據,用於深度學習模型(TADA)訓練。
提高重現性與可比較性 : FANS 能標準化核分選條件,控制轉染效率、細胞大小及螢光增益,降低生物變異,提高跨實驗的數據可比性。
支持大規模基因組研究 : PADI 實驗中,每個分選批次至少分析數十萬至數十萬個細胞或核,FANS 使得全基因組範圍內 AD 鑑定成為可能。
Citation:
Morffy, Nicholas, et al. "Identification of plant transcriptional activation domains." Nature 632.8023 (2024): 166-173.