无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

增強子與啟動子的分子機制及其在腫瘤中的作用

0
分享至

四個未解之謎

請記住四個問題。本文后續的所有機制、技術、腫瘤案例,本質上都是科學界嘗試回答它們的過程。帶著這些問題閱讀,會發現每一個看似零碎的分子事件,其實都在向某個謎題靠近。

特異性之謎。 人類基因組里大約有 100 萬個增強子,而功能性的啟動子只有約 2 萬個。一個增強子憑什么知道要去激活某個特定啟動子,而不是路過的其他啟動子?它怎樣在密集的基因座里找到對的對象?

距離之謎。 增強子和它調控的啟動子,在線性 DNA 上常常相隔幾十 kb 到幾個 Mb。這種距離意味著兩段 DNA 真正接觸的概率非常低、時間也很短。可基因表達卻能穩定輸出。增強子到底是必須親自跑去接觸啟動子,還是可以遠程指揮?

強度之謎。 同樣是增強子,為什么少數被稱為超級增強子的家伙能驅動定義細胞身份的關鍵基因(如干細胞的 OCT4、神經母細胞瘤的 MYCN),而其他普通增強子只能維持基礎表達?這種從量變到質變的閾值效應,機制上是什么?

致癌之謎。 過去三十年的腫瘤研究主要聚焦在編碼區突變(比如 TP53、KRAS)。但越來越多的證據表明,大量驅動突變其實發生在增強子和啟動子等非編碼調控元件上,有些癌癥甚至完全沒有典型的驅動突變,卻被異常的轉錄程序綁架。為什么癌細胞會對 BRD4、CDK7 這類看似全局性的通用因子表現出高度依賴,一抑制就死?

下面開始鋪墊機制,每一節都在悄悄回答這些謎題的某一面。

一、增強子的分子機制 1. 定義、典型增強子與超級增強子

增強子本身就是一段 DNA 序列(不是蛋白質,也不是 RNA),位于基因組非編碼區,能在遠距離上調啟動子的轉錄活性,通常具有方向無關性。

打個比方,如果把基因組想象成一座城市,啟動子就像每棟大樓門口的開關,決定樓里的燈(基因)亮不亮;增強子則像市里某處的調光控制器,可以遠程撥動這個開關、調節亮度。控制器和大樓之間不需要相鄰,可以隔著幾條街甚至更遠,只要城市的道路系統(也就是染色質的三維折疊)把它們帶到一起就能起作用。控制器倒過來裝也能用,這就是方向無關性的直觀含義。

典型增強子(typical enhancer)長度約 200 到 2000 bp。bp 是堿基對(base pair),DNA 的最小長度單位,1 bp 即一對堿基。作為參照,人類基因組全長約 30 億 bp,一個典型基因平均長度數萬 bp,所以一個增強子相當于一個基因的幾十分之一到幾百分之一長。在染色質上它攜帶兩個標志性的化學修飾:H3K4me1 和 H3K27ac,具體含義稍后解釋。

超級增強子(super-enhancer, SE)是 Whitehead 研究所 Richard Young 實驗室在 2013 年提出的新概念。它本質上不是單個增強子,而是一連串密集排列、被極強信號修飾的增強子簇。研究者用一種叫 ROSE(Rank Ordering of Super-Enhancers)的算法,把所有增強子按 H3K27ac 或 BRD4 等關鍵蛋白的結合強度排序,會發現絕大多數增強子信號平平,只有少數幾百個增強子的信號陡峭飆升,這些信號金字塔頂端的就是 SE。SE 通常長度超過 8 到 20 kb(1 kb = 1000 bp),是普通增強子的 10 到 20 倍,蛋白結合密度也高出數量級。

更關鍵的是,SE 優先驅動定義細胞身份的關鍵基因:胚胎干細胞中的 OCT4、SOX2、NANOG;T 細胞急性淋巴細胞白血病(T-ALL)中的 RUNX1、TAL1;神經母細胞瘤中的 MYCN、PHOX2B、GATA3、HAND2。這種少數 SE 驅動決定命運的少數基因的格局,是細胞身份穩定性的基礎,也是腫瘤研究里反復出現的關鍵線索,對應開篇的強度之謎與致癌之謎。

2. 染色質特征:活性增強子長什么樣

要理解增強子如何工作,先要解釋組蛋白修飾這個概念。DNA 在細胞核里并不是裸露的,它纏繞在一種叫核小體的蛋白顆粒上,核小體的核心是 8 個組蛋白(histone)分子。組蛋白的尾巴會被各種酶貼上化學標簽(甲基、乙酰基等),不同的標簽組合就像路標,告訴細胞內的轉錄機器:這段 DNA 是開放的還是關閉的、是激活的還是沉默的。這套標簽系統就是組蛋白修飾。

命名法很簡單。例如 H3K4me1,H3 表示組蛋白 H3,K4 表示這個蛋白的第 4 位賴氨酸,me1 表示在這個位置加了一個甲基。H3K27ac 就是 H3 的第 27 位賴氨酸上有一個乙酰基。

活性增強子的標志性指紋是 H3K4me1 與 H3K27ac 同時存在。

H3K4me1(組蛋白 H3 第 4 位賴氨酸單甲基化)由 MLL3(KMT2C)和 MLL4(KMT2D)這兩個酶催化沉積,標記著這附近的 DNA 是一個增強子。僅有這個標記還不足以證明它正在工作,可能只是處于待命狀態。

H3K27ac(H3 第 27 位賴氨酸乙酰化)由 CBP/p300 這兩個組蛋白乙酰轉移酶催化,這是增強子真正開機的標志。乙酰基中和了賴氨酸的正電荷,削弱了組蛋白與負電的 DNA 之間的吸引力,染色質變得松散,轉錄機器更容易接近。

活性增強子在結構上還有幾個特點。中央有一段核小體缺失區(nucleosome-depleted region, NDR),好像把核小體擠開了一塊空地,留給轉錄因子結合;兩側的核小體上則成對放置著 H3K4me1 標記;DNA 甲基化水平很低,被 TET 蛋白主動脫甲基;并且常富含 H2A.Z 和 H3.3 這兩種組蛋白變體,它們使核小體更不穩定、更易被推開。

還有一類有趣的半激活增強子叫預備態增強子(poised enhancer),同時攜帶 H3K4me1(激活標簽)和 H3K27me3(抑制標簽,由 PRC2 復合物中的 EZH2 催化)。這種踩著剎車的油門狀態,在干細胞和分化早期細胞中常見,意味著這個增強子已經被標記出來但還未啟動,只待一個合適的信號就能被切換為激活或永久沉默。

最后值得一提的是一個最近被顛覆的認識:MLL3/MLL4 的酶活與其支架功能可以解耦。這兩個酶雖然負責沉積 H3K4me1 標記,但對增強子的真正貢獻,可能更多來自它們作為分子腳手架的角色,招募 p300、招募 RNA Pol II,而不是 H3K4me1 標記本身(Dorighi 等,Mol Cell 2017;Local-Chen 等 2023)。這提醒我們:修飾標簽往往是結果而非原因,這是表觀遺傳學一個反復出現的教訓。

3. eRNA

人們曾經以為增強子只是一段沉默的 DNA,被動地被結合、被激活。直到 GRO-seq 等技術出現,研究者發現增強子本身也在被轉錄。

增強子產生的 RNA 被稱為增強子 RNA(enhancer RNA, eRNA),由 RNA Pol II 在增強子區域雙向轉錄產生,通常缺乏 5′ 帽完整性、沒有 poly(A) 尾、半衰期只有幾分鐘,產生后很快被核外泌體降解。乍一看像是轉錄噪音,但研究逐漸揭示 eRNA 遠不只是副產物,而是承擔著多個具體功能。

第一,穩定增強子與啟動子之間的染色質環。eRNA 可以直接結合 cohesin 和 Mediator 這兩個蛋白復合物,它們都是把增強子和啟動子拉到一起的關鍵繩索。eRNA 像粘合劑一樣讓這個三維結構更穩定。

第二,釋放暫停的 RNA Pol II。在很多基因的啟動子下游 30 到 60 nt(nt 即核苷酸,RNA 的最小長度單位)處,RNA Pol II 會被暫時卡住,機制后面講。eRNA 可以充當 NELF 這個暫停因子的誘餌 RNA,誘使 NELF 離開 Pol II,讓 Pol II 重新跑起來。

第三,捕獲并穩定轉錄因子。eRNA 可以增加 YY1(Yin Yang 1,一種廣泛表達的鋅指型轉錄因子蛋白)、BRD4(bromodomain-containing protein 4,含溴結構域蛋白 4,后面詳述)等關鍵蛋白在調控元件上的停留時間。

第四,調控染色質修飾反饋環。eRNA 可激活 CBP 的乙酰轉移酶活性,促進 H3K27ac 的沉積;同時抑制 PRC2 中 EZH2 的活性,阻止抑制性的 H3K27me3 沉積。eRNA 幫助增強子保持激活態。

第五,作為凝聚體的組分。eRNA 可以通過多價、弱相互作用,參與轉錄凝聚體的形成與維持。這一點在第 6 節深入討論。

eRNA 的發現極大地拓展了我們對增強子的認知。它不是一段靜止的 DNA 標簽,而是一個主動產生 RNA 的、活躍的功能單元。

4. 轉錄因子與共激活因子的招募

增強子要發揮作用,必須招募一支工作團隊。

先頭部隊是序列特異性轉錄因子(transcription factor, TF),一類能識別 DNA 上特定序列(像識別鑰匙的鎖眼)的蛋白質。每種 TF 有自己識別的序列偏好,這就解釋了為什么不同細胞、不同狀態下激活的增強子集合是不同的,因為不同的細胞表達不同的 TF。

TF 不是單打獨斗,它們的活性區(activation domain)往往是一段內稟無序區(intrinsically disordered region, IDR)。IDR 是沒有固定三維結構、靈活松散的蛋白質段,后面會反復出現,因為它是相分離機制的核心。

TF 招來的工人包括幾個核心角色。

Mediator(中介復合物)是由約 26 個亞基組成的巨型蛋白復合物,分為 Head、Middle、Tail 和 Kinase 四個模塊。TF 通過激活區直接結合 Mediator 的 Tail 模塊(主要是 MED1、MED14、MED15 這幾個亞基);Mediator 再向下游伸出手臂,聯系 RNA Pol II 和其他通用轉錄因子。它是一個總承包商,把上游的 TF 信號翻譯成下游轉錄機器能聽懂的指令。

CBP/p300 是一對功能高度相似的組蛋白乙酰轉移酶,負責催化 H3K27ac。它們既識別 TF、又給 TF 本身加上乙酰修飾,還把組蛋白尾巴改造得更開放。

BRD4 是一個明星蛋白分子。它有兩個 bromodomain(簡稱 BD1、BD2),專門識別已經被乙酰化的賴氨酸,無論是組蛋白上的還是 TF 上的。所以 BRD4 像一個乙酰化雷達,一旦增強子被 H3K27ac 標記,BRD4 就被招來。BRD4 的 C 端還有一段 P-TEFb 互作結構域,可以把 P-TEFb(positive transcription elongation factor b,正性轉錄延伸因子 b,由 CDK9 激酶和 Cyclin T1 組成的蛋白復合物)拉到現場。P-TEFb 是負責啟動 RNA Pol II 真正開始干活的鑰匙,詳見第二章關于啟動子近端暫停。

把這一連串關系串起來:TF 識別增強子 DNA,招來 CBP/p300 把組蛋白和 TF 自己都乙酰化,BRD4 通過 bromodomain 鎖定這些乙酰化標簽,再把 P-TEFb 拉過來,P-TEFb 釋放被卡住的 Pol II,轉錄開始。

此外,MLL4(KMT2D)和譜系決定 TF 是搭檔關系。TF 把 MLL4 帶到增強子,MLL4 沉積 H3K4me1/2 標簽,同時招募 p300、Mediator、Pol II。各種共激活因子之間是相互勾連的網絡,而不是依次到場的單兵。

5. 增強子與啟動子的遠距離對話

現在可以正面回答開篇的距離之謎:增強子和啟動子相隔數十 kb 甚至幾個 Mb,它們怎樣建立聯系?

Cohesin 與環擠出機制

想象 DNA 是一根長長的繩子。Cohesin 是一個環形蛋白復合物,由 SMC1、SMC3、RAD21、STAG1/2 幾個亞基組成,形狀真的就像一個戒指。Cohesin 由 NIPBL/MAU2 蛋白裝載到 DNA 上,由 WAPL 蛋白卸下。它做的事可以這樣想象:像吸管吸面條,用 ATP 提供能量,沿著染色質雙向擠出一個 DNA 環。環越來越大,直到撞到某個路障才停下來。這個過程叫環擠出(loop extrusion)。

那么路障是什么?是 CTCF(CCCTC-binding factor)這個蛋白。CTCF 結合在 DNA 上特定的序列上,像沿途插著方向性的路標。Cohesin 沿 DNA 滑行時,只有遇到方向收斂(兩個 CTCF 頭對頭)的兩個位點才會被卡住。這一卡,就形成了一個穩定的染色質環。

由這種機制大量產生的染色質環集合,在 Hi-C 實驗中表現為一個個自相互作用頻率高的方塊,被稱為拓撲關聯結構域(topologically associating domain, TAD)。TAD 內部的 DNA 段彼此頻繁接觸,而跨越 TAD 邊界的接觸則被強烈抑制。

這一機制對增強子與啟動子對話的意義是什么? Cohesin 的環擠出過程會在 TAD 內部反復掃描,把原本相距數百 kb 的增強子和啟動子拉到一起的概率大大提高。CTCF 設定的邊界則像絕緣墻,保證增強子不會誤激活另一個 TAD 里的基因。事實上即使只有一個 CTCF 位點,也足以阻止增強子的劫持(Hemming/Bernstein, Mol Cell 2024)。急性敲除 RAD21 或 NIPBL,遠距離增強子驅動的轉錄會迅速衰減,這是 cohesin 環擠出機制因果性的有力證據。

這套機制的核心(cohesin 形成環 + CTCF 路障)已被 2019 年的單分子熒光實驗直接觀察證實(Davidson 等、Kim 等,Science 2019),目前是領域共識;不過擠出速率、cohesin 包繞 DNA 的具體拓撲形式等細節仍在精細化研究中。

下圖示意整個過程:



圖 1:Cohesin 環擠出機制示意 接觸模型與通信模型

經典的接觸模型(contact model)認為增強子必須與啟動子物理接觸才能起效,就像必須按下開關燈才會亮。但近年來活細胞單分子成像給出了讓人困惑的數據:物理上的鄰近與轉錄爆發并不嚴格同步。即使增強子和啟動子已經被拉得很近,基因也不一定立刻表達;有時它們短暫分開,基因卻繼續表達。

這催生了通信模型(communication model)或 hub/凝聚體模型:增強子可能不需要持續物理接觸啟動子,而是通過形成局部的分子云(凝聚體),把轉錄所需的所有材料富集到一個區域,啟動子只需進入這個云區附近即可被激活。

最新的整合模型(Mach 等 2025)給出了一個調和的答案:cohesin 環擠出制造稀少但延長的接觸機會,轉錄因子凝聚體在這個機會窗口里捕獲啟動子,觸發轉錄爆發。換句話說接觸是必要的但不是持續的,凝聚體把短暫接觸放大為有效信號。這正好對應開篇的距離之謎,答案不是近或遠二選一,而是兩種機制的協奏。

6. 相分離與轉錄凝聚體

接下來講一個近七年來最革命性的概念。

什么是液–液相分離(liquid-liquid phase separation, LLPS)? 用一個家常的比方,沙拉醬里油和醋會分層,這就是相分離。在細胞內,某些蛋白質和 RNA 在合適濃度下也會自發凝聚成液滴,與周圍的核漿界限分明,但內部分子仍能自由流動。這種液滴不是細胞器(沒有膜),卻能富集特定分子、加速反應,可以想象成沒有圍墻的廚房,把所有炊具和食材集中在一塊小空間里。

Sabari、Boija、Cho 等(Cell 2018;Science 2018)的關鍵發現是 BRD4 和 MED1(Mediator 的核心亞基)的 IDR 可以在超級增強子上形成液滴狀的轉錄凝聚體(transcriptional condensate),富集 RNA Pol II、P-TEFb 以及 TF 的激活區。

為什么 IDR 能驅動相分離? IDR 像一段段靈活的魔術貼,它們之間能形成大量弱的、多價的相互作用,包括 π–π 堆積、電荷–π 作用、芳香環疏水互作。任何一對相互作用都很弱、很短暫,但當幾百幾千個這樣的弱相互作用同時發生,整體效果就足以把這些分子粘成一團液滴。

RNA Pol II 的 C 端結構域(CTD)本身就是一段經典的 IDR,人類 RNA Pol II 的 CTD 含有 52 個 YSPTSPS 七肽重復。這段 IDR 的 Ser5 到 Ser2 磷酸化梯度引導 Pol II 從啟動子凝聚體遷移到 mRNA 加工凝聚體,這是一個分子在不同液滴間換工位的精妙過程。

BRD4 的故事更精彩。它有長短兩種異構體(BRD4L 和 BRD4S),兩者形成不同性質的凝聚體(Han 等,Nat Struct Mol Biol 2020)。BRD4 通過雙 bromodomain 錨定乙酰化的 H3K27ac,把凝聚體牢牢綁定在 SE 上。

這個模型完美解釋了多個觀察現象。SE 比普通增強子強這么多,是因為 SE 上 BRD4/MED1 濃度足夠高,能夠觸發相分離的臨界濃度閾值,形成凝聚體;普通增強子達不到這個閾值,只能進行低強度的招募。這正是開篇強度之謎的答案。SE 表現出閾值效應、一旦破壞就崩塌,是因為相分離本身就是非線性的,濃度剛過閾值就突然成相,剛過不了就完全不成相。BET 抑制劑(JQ1)對癌細胞如此致命,是因為它把 BRD4 從乙酰化染色質上踢下來,凝聚體隨即解體,SE 驅動的致癌程序整個崩潰。

凝聚體模型是理解癌癥轉錄依賴性(transcriptional addiction)的關鍵鑰匙,這一點在第四章深入展開。

7. 增強子的鑒定與功能驗證

講到這里已經理解了增強子的工作原理,現在來看實驗上怎么找到它們、怎么驗證它們的功能。

鑒定活性增強子的標準做法是 H3K27ac 的 ChIP-seq,在全基因組范圍掃描這一活性標簽的分布,然后用 ROSE 算法把信號排序,挑出超級增強子。H3K4me1 ChIP-seq 幫助區分預備態與活性態,ATAC-seq 或 DNase-seq 檢測染色質開放區域(暗示有蛋白結合)。

eRNA 的檢測則需要專門捕捉短半衰期、不穩定 RNA 的技術,如 GRO-seq(global run-on sequencing)、PRO-seq(precision run-on sequencing)、CAGE(cap analysis gene expression)。這些技術能看到正在被 RNA Pol II 轉錄的位點,是判斷增強子是否活躍的金標準之一。

TF 與共激活因子的占據可以用各自的 ChIP-seq 來定位,BRD4、MED1、p300、各種主導 TF 的 ChIP-seq 既鑒定增強子位置,也用于 SE 排序。

三維基因組學是最近的突破方向。Hi-C 給出全局拓撲圖;ChIA-PET 和 HiChIP(尤其 H3K27ac HiChIP)富集特定蛋白介導的染色質環;Capture Hi-C 對感興趣的啟動子做高分辨率放大調研;Micro-C 把分辨率推到約 200 bp。這些方法讓我們能直接看見增強子和啟動子的三維擁抱。最近的工具如 HiC-DC+ 還能做差異接觸分析。

RNA 鄰近捕獲技術從 DNA-DNA 接觸擴展到 RNA 介導的接觸。Hi-C 系列回答的是哪兩段 DNA 在空間上鄰近,但忽視了 RNA 在染色質組織中的角色。前面講過 eRNA、lncRNA 都參與穩定增強子–啟動子環、參與凝聚體形成。要直接捕獲 RNA 介導的空間互作,需要一類全新的技術。

RIC-seq(RNA In situ Conformation sequencing,RNA 原位構象測序)由薛愿超實驗室在 2020 年的 Nature 論文中首次報道。原理是在細胞核內原位連接兩條空間上鄰近的 RNA 分子,然后建庫測序。它與 Hi-C 的關鍵區別是:Hi-C 捕捉 DNA-DNA 接觸,RIC-seq 捕捉 RNA-RNA 在原位的空間鄰近。這讓研究者第一次能直接看見某個 eRNA 與它調控的靶基因 mRNA 是不是真的在三維空間里相遇。在腫瘤研究中,RIC-seq 已被用來揭示癌癥中 eRNA / lncRNA 介導的異常染色質互作,以及 eRNA-mRNA 互作如何影響轉錄爆發。

GRID-seq(Global RNA Interactions with DNA by deep sequencing)捕捉 RNA 與 DNA 的全局互作圖譜,反向告訴我們某個 RNA 占據了基因組的哪些位置。RADICL-seq、ChAR-seq、MARGI 是同類原理的變體,各自有不同的連接策略與分辨率特征,共同構成 RNA-染色質互作組工具箱。

這些 RNA 鄰近捕獲技術之所以重要,是因為它們提供了 Hi-C 無法給出的關鍵信息:某個非編碼 RNA 是不是真的親臨現場參與了一對增強子-啟動子的功能性偶聯。這對驗證 eRNA 功能假說、研究 lncRNA 介導的致癌機制(如 HOTAIR、CCAT1 等)是不可替代的工具。

功能驗證則需要擾動實驗。CRISPRi-FlowFISH(用 dCas9-KRAB 沉默候選增強子,然后用 FISH 檢測下游基因表達變化)、CRISPR knockout(直接刪除增強子序列)、MPRA(massively parallel reporter assay,大規模并行報告基因實驗)等。僅有共定位的相關性不夠,功能性的因果證據才是定論。

二、啟動子的分子機制 1. 結構與核心元件

啟動子和增強子一樣本身就是一段 DNA 序列。如果增強子是遠程調光器,啟動子就是大樓門口的開關,直接決定基因從哪里開始轉錄、轉錄多頻繁。

啟動子按距離轉錄起始位點(transcription start site, TSS)的遠近,可分為三層。核心啟動子(core promoter)位于 TSS 周圍約 ±40 bp 的區域,負責招募 RNA Pol II 與通用轉錄因子,是轉錄起始的反應中心。近端啟動子(proximal promoter)位于 TSS 上游約 ?250 bp 內,常含有特異 TF 的結合位點。遠端調控元件包括增強子、絕緣子、沉默子等,從功能上又回到了增強子的話題。

核心啟動子內部有一些標志性序列元件,像蓋樓時埋的地基榫卯,標識開關的位置。

TATA box,共識序列 TATAWAAR,位于 ?25/?31 區域,由 TBP(TATA-binding protein,TATA 結合蛋白)識別。約 10 到 20% 的人類啟動子有 TATA box,常見于誘導型、組織特異型基因。

Inr(initiator,起始元件)共識序列 YYANWYY,A 在 +1(也就是 TSS 上)。由 TFIID 復合物中的 TAF1/TAF2 亞基識別,可以獨立啟動 PIC,也可與 TATA 協同。

DPE(downstream promoter element)共識序列 RGWYV,位于 +28/+32。它與 Inr 嚴格協同(距離不能變),常見于無 TATA 的果蠅啟動子。

MTE、BRE、TCT 等是其他較少見的核心元件,各有專門的識別因子。

CpG island(CpG 島)約覆蓋 60 到 70% 的人類啟動子。它們是富含 CG 二核苷酸的區段,通常沒有 TATA box,但富含 GC box(被 Sp1 等 TF 識別),并且呈現雙向轉錄特性。最近還發現一種叫 CGCG element 的 CpG 島核心元件(共識 TCTCGCGAGA),可能是 CGI 啟動子的方向性激活因子。

2. PIC 組裝

前起始復合物(pre-initiation complex, PIC)是 RNA Pol II 啟動轉錄前必須組裝的多組分機器。讓我把這場組裝過程用畫面化的方式描述出來。

想象一段 DNA 上有個 TATA box 等待被識別。組裝開始。

第一位到場的是 TFIID,一個由 TBP 加 13 個 TAF 蛋白組成的龐大復合物。TBP 像一只手以反常的方式彎折 DNA,不讓 DNA 進入自己的凹槽,而是騎跨在 DNA 上把它彎曲約 90 度。這個戲劇性的彎折是后續一切組裝的幾何基礎。TFIID 不只識別 TATA,也通過 TAF 亞基識別 Inr、DPE、MTE。

第二位到場的是 TFIIA,工作很簡單:穩定 TBP 與 DNA 這個易碎的彎折結構,防止它在后續步驟里散架。

接著 TFIIB 上場扮演橋梁工,一頭接 TBP 一頭接即將到來的 RNA Pol II,確定 Pol II 的方向(讓它面向下游而不是上游)。

RNA Pol II 與 TFIIF 一起進場,TFIIF 的作用是抓穩 Pol II,讓它正確就位在彎折的 DNA 上。

TFIIE 加入,招呼下一位嘉賓。

TFIIH 是最后一位也是最忙的玩家,包含兩個關鍵活性。一個是 XPB 解旋酶,消耗 ATP 強行把 DNA 雙鏈拉開約 11 到 13 bp,形成所謂的轉錄泡(transcription bubble),讓 Pol II 接觸到模板鏈。另一個是 CDK7 激酶(也叫 CAK 模塊),磷酸化 Pol II CTD 的 Ser5 殘基,這個磷酸化是 Pol II 離開啟動子、開始向下游延伸的發車信號。

到此 PIC 組裝完成,但故事還沒結束。Mediator 復合物作為總管穿梭在整個組裝過程中,通過 Tail 模塊接收上游 TF 的激活信號,通過 Head 和 Middle 模塊聯系 PIC 各組件,把上游決定翻譯成下游行動。Mediator 還有一個可拆卸的 Kinase 模塊(包含 CDK8/19、CCNC、MED12/13),能可逆地阻止 Mediator 與 PIC 結合,這是一個微妙的調控開關,在腫瘤治療中后面會再次出現。

整個 PIC 組裝過程是 Patrick Cramer、Steve Hahn、Eva Nogales 等結構生物學家通過冷凍電鏡近十年解析出來的。冷凍電鏡讓我們第一次看見了這場分子之舞。

3. 啟動子與增強子的兼容性

回到開篇的特異性之謎:增強子怎么知道該激活哪個啟動子?研究提出幾個層次的機制。

生化兼容性方面,不同的啟動子對不同的共激活因子(p300 vs Mediator vs MLL)有不同偏好。果蠅實驗發現 TATA-containing 啟動子和 DPE-containing 啟動子分別響應不同類型的增強子,哺乳動物中也存在類似的啟動子-增強子類型匹配。

空間架構方面,TAD 內部接觸概率高、跨 TAD 概率低,這是幾何學層面的過濾器。

染色質狀態匹配方面,帶 H3K27ac 的活性增強子優先與 CpG 島啟動子配對;被 Polycomb 沉默的啟動子對增強子無響應。

凝聚體兼容性方面,同一相分離 hub 內的 IDR 必須性格相投(化學相容性)才能共存,這是生物物理層面的過濾。

最新模型支持序列編碼的特異性與三維兼容性互補,它們不是非此即彼而是協同工作。

4. 啟動子近端暫停

這里有一個反直覺的事實:RNA Pol II 啟動后并不會一路狂奔,而是會在轉錄起始位點下游 30 到 60 nt 處被卡住,形成所謂的啟動子近端暫停(promoter-proximal pausing)。

為什么細胞要讓 Pol II 暫停? 進化生物學的答案是這給了細胞一個最后的速率調控點:已經投入資源啟動轉錄,但要不要真正生產 mRNA,還可以臨場決定。

讓 Pol II 暫停的關鍵因子有兩個。NELF(negative elongation factor,負性延伸因子)是一個由 NELF-A/B/C/E 組成的四聚體蛋白復合物,把暫停態穩定下來,NELF-E 通過一個堿性螺旋結構接觸下游 DNA,把 Pol II 釘在原地。DSIF 由 SPT4 和 SPT5 組成,與 NELF 協同穩定暫停態。Pol II 下游的第一個核小體(稱為 +1 核小體)也充當物理屏障。

釋放暫停的鑰匙是 P-TEFb。P-TEFb 經 BRD4 或 SEC(super elongation complex,超級延伸復合物,含 AFF1/AFF4、ELL、ENL、AF9 的蛋白復合物)招募到基因座,做三件事。第一,磷酸化 Pol II CTD 的 Ser2,這是開始真正延伸的信號(對照 Ser5 是啟動子逃逸信號)。第二,磷酸化 DSIF 的 SPT5 CTR 結構域,把 DSIF 從負性因子改造成正性延伸因子,同一個分子在被改造后角色翻轉。第三,磷酸化 NELF-E 使 NELF 解離,釋放 Pol II。經過這三步 Pol II 進入生產性延伸態,真正開始合成 mRNA。

P-TEFb 自身也受調控。大部分 P-TEFb 被一個叫 7SK snRNP 的核糖核蛋白復合物(由 7SK RNA 加 HEXIM1/2、LARP7、MePCE 幾個蛋白組成)隔離起來,處于待命狀態。當細胞需要轉錄時 7SK 釋放 P-TEFb,后者被 BRD4 或 SEC 捕獲到基因座。這套層層調控讓 P-TEFb 成為一個精密的流量閥。

值得一提的是 NELF 僅存在于后生動物。這意味著 CDK9 抑制劑的效應在不同物種、甚至不同細胞背景下有別。NELF 陽性的細胞在 CDK9 抑制下整體關閉轉錄,而 NELF 缺失的細胞繼續生成非生產性轉錄(Aoi 等,Nat Commun 2023)。

5. 啟動子的表觀遺傳調控

CpG island 甲基化是腫瘤中的一個核心機制。正常情況下 CGI 啟動子保持低甲基化,在腫瘤中 DNMT3A/3B(DNA 甲基轉移酶)通過 PWWP 結構域被招募到 H3K36me3 標記的區域,在那里發動新發(de novo)甲基化。被甲基化的 CGI 啟動子招募 MBD 蛋白家族,后者再招募 HDAC 和 PRC2,導致基因永久沉默。

這就是為什么很多抑癌基因(tumor suppressor gene, TSG)在腫瘤中是通過啟動子高甲基化沉默的,而不是序列突變。MLH1 是錯配修復基因,高甲基化導致 MSI-H(微衛星不穩定)結腸癌、子宮內膜癌。CDKN2A/p16 是細胞周期抑制因子,高甲基化讓腫瘤跳過衰老屏障。BRCA1 是同源重組修復基因,高甲基化造成同源重組缺陷型乳腺癌。MGMT 是 DNA 修復酶,高甲基化使膠質瘤對替莫唑胺敏感。VHL 是抑癌基因,高甲基化是腎癌發生的早期事件。

啟動子的活性標簽是 H3K4me3(注意與增強子的 H3K4me1 區別:三甲基 vs 單甲基),由 SET1A/B 與 MLL1/MLL2 催化。

發育基因常處于一種叫雙價(bivalent)的狀態,同時攜帶激活的 H3K4me3 和抑制的 H3K27me3。這就像同時踩著油門和剎車,只待分化信號一來就快速被切換為完全激活或完全沉默。這個機制讓胚胎干細胞擁有發育多能性。

6. 啟動子的轉錄與雙向性

回到一個根本問題:啟動子本身是否被轉錄? 答案是肯定的。啟動子就是 RNA Pol II 轉錄起始的位置。事實上啟動子的轉錄在結構上與增強子的轉錄高度對稱。

經典視角下我們以為啟動子只產生 mRNA,但 Andersson 等(Nature 2014)的研究改變了這個認識。在啟動子的中心 NDR 上,RNA Pol II 實際上是雙向起始的。沿基因方向產生 mRNA,反向則產生一類叫 PROMPT(promoter upstream transcript,啟動子上游轉錄本)或 uaRNA(upstream antisense RNA,上游反義 RNA)的轉錄本,通常被外泌體快速降解。

啟動子轉錄與增強子轉錄的初始事件幾乎相同,真正的差別在下游加工。沿基因方向的 RNA 攜帶剪接位點和 poly(A) 信號,被剪接和加尾保護、穩定輸出為 mRNA;反方向的 PROMPT 缺乏這些信號,與 eRNA 一樣命短,被外泌體清除。

約 11% 的人類基因頭對頭分布在 1 kb 以內的共享啟動子區,常常是 CGI 啟動子,這種結構稱為雙向啟動子(bidirectional promoter),其兩端都驅動穩定 mRNA。

這一對稱性正是 Andersson 模型把啟動子與增強子統一起來的基礎:所有順式調控元件本質上都是雙向轉錄起點,差別只在于產物的穩定性和功能性。增強子的 eRNA 與啟動子的 PROMPT 是同源現象,只是命名不同。

三、增強子-啟動子相互作用的整合理解 1. 接觸模型與通信模型再討論

經典接觸模型(Bulger & Groudine, 2011)主張增強子必須與啟動子物理接觸才能激活轉錄,證據是 Hi-C 和 3C 實驗顯示活性 E-P 對在三維空間中頻繁接觸。

修正后出現了兩種模型。Hub/瞬時模型認為 E 與 P 的接觸是短時多元的,不是穩定的二者牽手,多個增強子和啟動子可能形成一個小社區彼此動態接觸。凝聚體/遠程通信模型認為 E 不需要持續接觸 P,而是通過形成凝聚體把轉錄材料富集起來,P 進入凝聚體附近即被激活。

最新的整合模型(Mach 等 2024,基于活細胞成像)認為 cohesin 環擠出制造罕見但壽命較長的接觸機會,凝聚體在這個機會窗口里捕獲兩端,觸發轉錄爆發(burst)。增強子主要影響 burst frequency(爆發頻率)而不是 burst size(爆發幅度),讓基因更頻繁地開火,但每次開火釋放的 mRNA 量相對恒定。

2. 特異性如何決定

把上面所有討論合成一個分層模型。

第一層是空間過濾:cohesin 環擠出在 TAD 內部掃描,把 E 和 P 的接觸概率從基線提升至顯著水平,TAD 邊界 CTCF 限制范圍。第二層是序列過濾:E 上 TF 與 P 上 GTF/Pol II 的兼容性,比如 TATA 啟動子和 DPE 啟動子分別響應不同增強子。第三層是染色質狀態過濾:核小體定位、H3K27ac、eRNA 的存在與否決定哪些潛在接觸對能產生功能信號。第四層是凝聚體過濾:IDR 兼容性決定 E 和 P 能否共存于同一相分離 hub。

每一層都是過濾器,層層下來最終形成的特異 E-P 配對就是穩定的轉錄信號。

3. eRNA 在 E-P 互作中的作用

如前所述,eRNA 既穩定 cohesin/Mediator 介導的染色質環,也參與凝聚體的多價相互作用。它把序列特異性轉化為生物物理協調性,是連接基因組學層面與生物物理層面的重要橋梁。

4. TF 凝聚體介導的 E-P 通信

Mediator-SE-Pol II 凝聚體可以被理解為 E 和 P 的會面艙。E 端 TF 通過 IDR 招募 BRD4/MED1,引發凝聚體形成;P 端 Pol II 通過 CTD(本身是 IDR)進入同一相;結果是 E 和 P 即使沒有持續物理接觸,也能通過共享同一個凝聚體而功能耦合。

這個模型解釋了 SE 的魯棒性、閾值效應,也解釋了為什么 BET、CDK7 抑制能過敏感地崩潰癌細胞 SE 程序,因為它們瓦解的是這個凝聚體本身。

5. 染色質重塑復合物

要讓增強子和啟動子被識別,首先它們必須暴露,也就是核小體得讓開。這個工作由染色質重塑復合物(chromatin remodelers)完成,它們是利用 ATP 推動核小體的多亞基蛋白復合物。

SWI/SNF(也叫 BAF)家族最為重要,有三個亞型。cBAF 含 ARID1A/1B、SMARCA4/2(BRG1/BRM)、SMARCB1、DPF 等。PBAF 含 ARID2、PBRM1、BRD7、PHF10 等。ncBAF/GBAF 含 BRD9、GLTSCR1 等。BAF 的主要功能是維持譜系特異性增強子的可及性和 H3K27ac。BAF 缺失會讓 H3K27ac 全面降低,導致譜系增強子塌陷,這一點在腫瘤中尤其重要。

ISWI、CHD、INO80 家族輔助完成核小體的精細定位,如 +1 核小體的精確放置。

NuRD/CoREST 復合物則反過來,含 HDAC1/2 和 LSD1 介導基因沉默。一個有趣的現象是 BRD4 在某些情況下可以與 LSD1/NuRD 聯合,形成抑制性的反向 SE,這是乳腺癌耐藥的一個機制。

四、增強子/啟動子在腫瘤中的作用機制

終于可以正面回答開篇的致癌之謎:為什么調控元件異常會驅動腫瘤? 為什么癌細胞表現出轉錄依賴? 癌細胞通過多種途徑綁架增強子/啟動子系統,讓它們持續輸出錯誤的轉錄程序,下面分門別類講解。

1. 致癌增強子劫持

正常情況下某個強增強子驅動它附近的某個基因。如果發生染色體重排(易位、缺失、倒位、擴增),這個增強子可能被搬到另一個原本不該被它調控的基因(通常是致癌基因)旁邊,這就叫 enhancer hijacking(增強子劫持)。結果是致癌基因被錯誤地強力激活。

T-ALL 中 TAL1 的異常激活

TAL1 本來是在造血干細胞和紅系前體中表達的轉錄因子,在淋巴祖細胞中應該是關閉的。但在 T 細胞急性淋巴細胞白血病中 TAL1 被異常激活,這是 T-ALL 的一個標志性事件。

激活 TAL1 的機制至少有三種,每種都涉及一個不同形式的增強子操縱。SIL-TAL1 缺失約占 30% 病例,約 90 kb 的缺失把 TAL1 直接置于上游 SIL 基因的普遍激活調控元件下。TCR-TAL1 易位約占 10%,TCR(T 細胞受體)位點的強增強子被劫持到 TAL1 旁。MuTE 突變(Mutation of TAL1 Enhancer)約占 5% 病例,這是最精彩的案例:在 TAL1 上游約 7.5 kb 處僅插入 2 個核苷酸(GT),就創造出一個全新的 MYB 轉錄因子結合位點。這個位點招募 MYB-CBP-TAL1-GATA3-RUNX1-LMO1/2 復合物,形成一個 de novo 超級增強子,驅動 TAL1 高表達(Mansour 等 Science 2014)。兩個核苷酸的插入引發一個超級增強子的誕生,再驅動整個 T-ALL 的轉錄程序,這是非編碼區調控元件突變可以驅動腫瘤最經典的證據之一。

值得一提的是 TAL1 復合體進一步異常激活了進化保守的 MYCN 遠端增強子(enhMYCN),誘導 MYCN 的轉錄,使 T-ALL 對甲羥戊酸(mevalonate)通路抑制劑敏感(Leukemia 2023)。這是個連鎖反應的精彩例子。

MYC 增強子劫持的多種形式

MYC 是細胞增殖和代謝的主開關,幾乎在所有癌癥中都有異常表達。它的增強子被劫持有多種典型形式。

Burkitt 淋巴瘤中,t(8;14)(q24;q32) 易位把 MYC 重排到 IGH(免疫球蛋白重鏈)位點的內含子或 3′ 調控區,使 MYC 在 B 細胞的體細胞超突變(SHM)和類別轉換重組(CSR)期間被 IgH 3′ 調控區持續激活,見于 85% 的 BL 病例。機制基礎是 AID(activation-induced cytidine deaminase,激活誘導脫氨酶)介導的 DNA 雙鏈斷裂。

多發性骨髓瘤中近 50% 的患者存在 MYC 重排,把 MYC 置于 IGH/IGL/IGK 或非 Ig 超級增強子(NSMCE2、TXNDC5、FAM46C 等)旁。

急性髓細胞白血病(AML)中,8q24 距離 MYC 1.7 Mb 處有一個由 9 個增強子模塊組成的 BENC(Blood ENhancer Cluster,血液增強子簇)。AML 中常見 BENC 的焦點擴增,把它轉化為 MYC 的超級增強子(Bahr/von Paleske et al., Nature 2018)。

前列腺癌中 8q24 基因荒漠區(gene desert)含 GWAS 風險變異(rs6983267、rs72725854),這些變異位于雄激素響應增強子內,經 FoxA1/AR/SPDEF 介導加強與 MYC、PVT1、PCAT1 的環式接觸。

髓母細胞瘤中的 GFI1/GFI1B 劫持

Northcott/Pfister 等(Nature 2014)發現 Group 3/4 髓母細胞瘤中 6.6% 病例存在 9q34 焦點重排,缺失/倒位/復制把 GFI1 或 GFI1B 編碼區并置于強 SE 旁,產生互斥性 GFI1 或 GFI1B 高表達,與 MYC 協同驅動腫瘤。缺失獲得功能是這個案例的關鍵悖論:通常我們認為缺失意味著丟失,但這里缺失把基因帶到了不該去的增強子旁。

更廣泛的結構變異與 ecDNA 介導的劫持

HiChIP 和 H3K27ac HAPI 算法系統識別 34 種癌細胞系中的 enhancer hijacking,涉及 MYC、CCND1、ETV1、CRKL、ID4 等。

特別值得提及的是 ecDNA(extrachromosomal DNA,染色體外環狀 DNA)。這種環狀 DNA 上常攜帶致癌基因和它們的增強子,多條 ecDNA 之間還能彼此交換增強子(MYC-ERBB2 嵌合 ecDNA),形成一種調控元件的黑市(Wu 等 Nature 2019)。由于 ecDNA 沒有 CTCF 邊界,它的增強子-基因互作幾乎不受拓撲限制,可以創建超級活躍的 hub。

2. 超級增強子驅動癌細胞身份

癌細胞和正常細胞一樣,身份由 SE 驅動的核心調控環路(CRC)決定,但癌細胞往往篡奪了這個環路。

多發性骨髓瘤中 IgH-MYC 易位把 IgH 3′ SE 嫁接到 MYC 上,SE 還驅動 BCL-xL、IRF4 等的表達。BRD4/Mediator 在這些 SE 上密度極高,JQ1 能引發 MYC 一過性的快速抑制(Lovén/Bradner Cell 2013),這是超級增強子概念的奠基性研究之一。

小細胞肺癌(SCLC)基于譜系定義 TF 分為 4 個亞型。SCLC-A 由 ASCL1 驅動,SCLC-N 由 NEUROD1 驅動,SCLC-P 由 POU2F3 驅動,SCLC-Y/I 由 YAP1 或炎癥型驅動。每一亞型由各自 TF 的 SE 驅動,核心調控環路相互正反饋。MYC 高表達常驅動從 SCLC-A 到 SCLC-N 的轉化。

DLBCL(彌漫大 B 細胞淋巴瘤)中的 BCL6 SE:GCB-DLBCL 中 BCL6 被強 SE 驅動,BCL6 招募 SMRT/NCoR-HDAC3 抑制分化基因,把生發中心(GC)的暫停狀態變成永久狀態。EZH2 Y641 突變(22% GCB-DLBCL,7% FL)使 PRC2 的 H3K27me3 沉積獲得 Tyr/Phe switch 功能,把暫時性沉默升級為永久性沉默,鎖定 GC 狀態驅動淋巴瘤化(Béguelin/Melnick Cancer Cell 2013)。

3. 啟動子區甲基化異常

如前所述 CpG 島高甲基化沉默抑癌基因(MLH1、CDKN2A、BRCA1、MGMT、VHL 等)。CIMP(CpG island methylator phenotype)表型常關聯 BRAF V600E、IDH1/2 突變(2-HG 抑制 TET 脫甲基酶);MAFG/BACH1/CHD8/DNMT3B 復合體把 BRAF 突變信號串聯到 MLH1 沉默。

相反,全基因組低甲基化常發生在重復元件、增強子、Polycomb 區域。腫瘤中可解鎖原本沉默的增強子,激活致癌基因表達,并導致基因組不穩定。

4. 轉錄因子的異常激活與轉錄放大

MYCN 在神經母細胞瘤:2p24 的 MYCN 擴增是高危神經母細胞瘤的標志。MYCN 與 SE 驅動的 PHOX2B、HAND2、ISL1、GATA3、TBX2 形成 adrenergic-CRC,作為轉錄放大器全局放大基因表達。視黃酸治療能在另一個 RA-CRC 中重塑 SE 景觀,把 PHOX2B/GATA3 SE 解構、激活 MEIS1/SOX4(Durbin 等,Nat Genet 2018)。

SOX2、OCT4 等多潛性 TF 在 SE 上自我反饋,癌干細胞依賴類似機制。

5. 染色質重塑因子突變

SWI/SNF(BAF)亞基突變累計存在于約 20% 的人類腫瘤中。

SMARCB1 雙等位失活導致惡性橫紋肌樣瘤(MRT)、ATRT,這是典型的超低突變率單基因癌癥。SMARCA4(BRG1)失活導致小細胞肺癌、SCCOHT(卵巢小細胞癌的去分化型)、GIST;在 NSCLC 中,SMARCA4-mutant 腫瘤的增強子圖譜缺陷致免疫冷表型,免疫治療響應差。ARID1A 突變常見于卵巢透明細胞癌(>50%)、子宮內膜樣癌、胃癌、肝細胞癌;ARID1B 部分代償,雙失活致命,這是合成致死靶點。PBRM1 突變多見于腎透明細胞癌(40%)。BRD9(ncBAF)在滑膜肉瘤中,SS18-SSX1 融合保持 ncBAF 功能性。

機制層面 BAF 缺失減少增強子可及性、降低 H3K27ac、促進 Polycomb 沉默,導致譜系增強子塌陷,異常分化或重編程。

6. 表觀調控因子的異常突變

EZH2 Y641X(Y646X)GOF 突變(DLBCL 22%、FL 7%)減少單/二甲基化但增加三甲基化活性,導致 H3K27me3 蓄積。KMT2D(MLL4)共突變進一步增強 GC 狀態停滯,這是 tazemetostat 的分子靶點。

DOT1L 在 MLL 重排白血病中:MLL-AF4/AF9/ENL 等融合蛋白通過 SEC 招募 DOT1L 至原本不甲基化的 MLL 靶基因(HOXA、MEIS1),異位 H3K79me2/3 觸發腫瘤維持轉錄。這些 H3K79me 標記還定義了 MLL-r 白血病中一類新型增強子(KEEs)。EPZ-5676(pinometostat)對此有針對性。

EP300/CBP 突變(DLBCL 約 30%,FL 約 40%,SCLC,膀胱癌)多為單等位 LOF 截短或 HAT 域 missense,導致 BCL6 靶基因和 H3K27ac 減少,免疫信號下降;HDAC3 抑制劑可作為合成致死。

KMT2D/MLL4 與 KMT2C/MLL3 突變(FL/DLBCL/膀胱、肺癌)使 H3K4me1 與協同 p300 招募下降,enhancer commissioning(增強子啟用)缺陷。

NSD1/NSD2/MMSET(H3K36me2)、KDM6A/UTX(H3K27me3 demethylase)也常突變。

7. eRNA 在腫瘤中的作用

BL 細胞中 IGH 區 AL928768.3 eRNA 調節 MYC 表達、影響化療敏感性。eRNA 如 PSA-eRNA、CCAT1-eRNA 在前列腺癌、結直腸癌中促進 AR/MYC 靶基因轉錄。總體上 eRNA 可作為活躍癌癥增強子的生物標志,也是潛在的 ASO/siRNA 治療靶點。

8. 三維基因組重構

癌癥不只改變了 DNA 序列,還改變了 DNA 的三維折疊方式,這是腫瘤研究中最迷人的領域之一。

IDH 突變膠質瘤中,IDH1/2 GOF 突變催化產生 2-HG(2-羥基戊二酸),抑制 TET 和 KDM,導致 G-CIMP(高甲基化表型)。CTCF 結合位點的甲基化破壞 PDGFRA TAD 邊界,使其外部增強子激活 PDGFRA(Flavahan/Bernstein Nature 2016)。這是 TAD 邊界破壞致癌的經典案例。

SDH-deficient GIST 中,SDH(琥珀酸脫氫酶)缺失導致琥珀酸蓄積,抑制 TET,造成全基因組高甲基化。FGF3/FGF4 與 ANO1 之間的 CTCF 絕緣子甲基化使 ANO1 SE 跨邊界激活 FGF4(Flavahan 等 Nature 2019)。該 PDX 模型對 FGFR 加 KIT 聯合抑制劑敏感。

染色質易位與 ecDNA 重排創造 neo-TAD/neo-loop。ecDNA 因缺少 CTCF 邊界形成超活躍 hub,MYC/EGFR 在其上以 SE 嫁接形式被多重激活。

9. 轉錄凝聚體在腫瘤中的作用

最后講一個最前沿的腫瘤機制:致癌融合蛋白形成異常凝聚體。

尤文肉瘤的 EWS-FLI1:t(11;22) 易位把 EWS 蛋白的 SYGQ-rich LCD(low complexity domain,低復雜度結構域)與 FLI1 的 DNA 結合域融合。EWS-FLI1 在 GGAA 微衛星(尤其 ≥10× GGAA 重復)上以多體形式結合,LCD 介導 LLPS 形成異常的轉錄凝聚體,招募 BAF、Mediator、Pol II,創建 de novo enhancer(如 NR0B1 啟動子區 25× GGAA 重復處)。這些異常增強子驅動 SOX2、IGF1R、ID2、NKX2-2 等致癌程序。最新研究還提示 EWS-FLI1 加速凝聚體老化為纖維狀(condensate aging),為 LLPS 解構劑提供潛在靶點。

白血病的 NUP98 fusion:NUP98 N 端的 FG-repeats LCD 與 HOXA9/NSD1/KDM5A/PRRX1/PHF23/LNP1 等融合。FG repeats 與 DNA 結合域共同驅動 LLPS(同型與異型互作),在 HOX cluster 形成核小體凝聚體,招募 CRM1、MLL1/menin、CBP/p300,觸發 HOX、MEIS1 等異常轉錄。凝聚體重組 3D 基因組,產生新染色質環與 TAD 重排(Ahn 等 Nature 2021;Terlecki-Zaniewicz 等 Nat Struct Mol Biol 2021;Cell Rep 2023)。

其他融合驅動的凝聚體包括 SS18-SSX(滑膜肉瘤,通過 BAF 重塑)、BCR-ABL、MLL-fusions、TAF15/FUS-CHOP(粘液樣脂肪肉瘤)等,都涉及 IDR 介導的異常凝聚體。

這一系列發現的核心意義在于揭示了致癌融合蛋白的物理本質。很多融合蛋白獲得功能不是因為它們獲得了新的酶活,而是因為 IDR 讓它們能形成新的凝聚體,把轉錄機器異位富集到不該激活的基因座。這從根本上改變了我們對癌基因的理解,癌癥某種程度上是生物物理學的疾病。


五、靶向增強子/啟動子的腫瘤治療策略

理解了致病機制,治療策略就有了方向。靶向轉錄依賴性已成為腫瘤治療的新范式。

1. BET 抑制劑

JQ1 是首個 BET BD1/BD2 雙競爭性拮抗劑(Filippakopoulos 等 Nature 2010),直接坐進 BRD4 的乙酰賴氨酸識別口袋,使 BRD4 從染色質上脫離。在 NUT 中線癌、MM、AML、Burkitt 中顯著抑制 MYC,但藥代動力學差,主要是科研工具。

臨床推進的化合物包括 OTX015 / birabresib(MK-8628),可口服,Phase Ib 在 AML/ALL 顯示活性(NCT01713582),多項實體瘤(GBM、NMC)在試驗中。I-BET762(GSK525762)、I-BET151 也在進展中。BD2-選擇性抑制劑 ABBV-744 減少血液系統毒性。BET PROTAC(dBET6、ARV-825 等)不只阻斷,而是降解 BRD4,效果更深。

主要瓶頸包括單藥效力有限、譜系性骨髓抑制、獲得性耐藥(LSD1/NuRD 重塑、WNT 反饋)。

2. CDK7 / CDK9 抑制劑

THZ1(Gray 實驗室,2014)是共價 CDK7 抑制劑,靶向 Cys312 遠端半胱氨酸。它優先殺傷超級增強子驅動的腫瘤,包括 T-ALL(RUNX1)、MYCN-amp 神經母細胞瘤(Cell 2014, Chipumuro 等)、TNBC、SCLC、ATC、卵巢癌。這類腫瘤對 SE 程序高度依賴,稍微一抑制就崩潰。衍生物已進入臨床:SY-1365(mevociclib)、SY-5609(選擇性,口服)、CT7001(samuraciclib)。

CDK9/P-TEFb 抑制劑包括 flavopiridol/alvocidib、AZD4573;非選擇性 CDK 抑制劑 dinaciclib(CDK1/2/5/9)在 CLL/MM 顯示活性;選擇性 CDK9 PROTAC 正在開發。

CDK12/13 抑制劑(THZ531)破壞 DNA 修復基因轉錄,與 PARP 抑制劑協同。

3. EP300/CBP 抑制劑

A-485 是 CBP/p300 HAT 域催化抑制劑,降低 H3K27ac、抑制 MYC/CCND1、AR 靶基因表達,在 AML、MM、NHL、CRPC 臨床前有效。CBP30、GNE-049、CCS1477(inobrodib)是 bromodomain 抑制劑,CCS1477 已在 CRPC、AML I 期臨床。

4. EZH2 抑制劑

Tazemetostat(Tazverik / EPZ-6438)是 SAM 競爭性 EZH2 抑制劑,2020 年 FDA 加速批準用于 INI1 陰性上皮樣肉瘤、EZH2-mutant R/R FL,在 SMARCB1 缺失 MRT、DLBCL 也有活性。注意 2025 年因 SYMPHONY 試驗(R2 ± tazemetostat)出現繼發性血液惡性腫瘤的安全信號,Ipsen 自愿撤回 FDA 適應癥,治療組停藥繼續隨訪。

Valemetostat 是 EZH1/2 雙抑制劑,在 ATLL、外周 T 淋巴瘤獲得日本批準。第二代 EZH2 PROTAC 正在開發。

5. DOT1L 抑制劑

EPZ-5676 / Pinometostat 是 SAM 競爭性,在 MLL-r AML/ALL 臨床數據有限但有活性,為聯合治療策略奠定基礎(與 menin 抑制劑 revumenib/SNDX-5613 協同)。

Menin-MLL 抑制劑如 revumenib 在 NPM1-mut 與 KMT2A-r AML 中已顯示重要療效,這是近年來白血病治療的重要進展。

6. Mediator 與其他靶點

CDK8/CDK19(Mediator kinase)抑制劑如 senexin B、SNX631、BCD-115/RVU120 等(NCT04021368、NCT05052255)在 AML/CMML、TNBC、HER2+ 乳腺癌、卵巢透明細胞癌、CRC 中評估,機制是抑制轉錄重編程、克服靶向治療耐藥。

MED12 突變(子宮平滑肌瘤、甲狀腺癌)目前暫無直接小分子。

Cohesin/CTCF 拓撲靶向尚處于概念階段,但 STAG2 失活的合成致死(STAG1 依賴)正在開發肽抑制劑。

針對凝聚體的策略目前以 1,6-hexanediol 作為工具性證據,臨床前研究探討 IDR/condensate 形成性藥物;某些 BET 抑制劑、DRB 類與 LLPS 解構相關。

注意事項與開放問題

讀完整篇文章應該已經能從某些角度回答開篇的四個謎題。但科學研究永遠在進行中,以下是幾個值得警惕的開放問題。

超級增強子是定量定義而非生化劃界。ROSE 排序的拐點是經驗性的,SE 與典型增強子在生化機制上多為程度差異;不同 ChIP 標記會得出不同 SE 列表。

接觸與通信的爭議未平息。活細胞成像挑戰了 E-P 必須緊密接觸才能轉錄的傳統觀念,凝聚體模型尚需更多內源性證據;1,6-hexanediol 的特異性受到質疑。

MLL3/4 與 H3K4me1 的因果關系。近期 CRISPR 催化死亡(catalytic-dead)實驗提示 H3K4me1 的存在并非增強子激活的必要充分條件,MLL3/4 更多通過支架功能起作用。修飾標簽往往是結果而非原因。

eRNA 功能爭議。部分研究認為 eRNA 僅是轉錄副產物,其特異調控功能取決于具體基因座、細胞類型與 eRNA 二級結構,仍需更多定量、單分子數據。

泛 BET 抑制劑的脫靶與耐藥。JQ1/OTX015 的臨床效益單藥有限;短半衰期、骨髓毒性、腸道毒性、脫靶 BRD2/3 都是問題;BET 阻斷后細胞通過 LSD1/NuRD 的 SE 重塑產生耐藥。

Tazemetostat 撤市。2025 年 4 月 Ipsen 因 SYMPHONY 數據(繼發血液惡性)自愿撤回 FDA FL/ES 適應癥,臨床應用受限;新一代 EZH 抑制劑(EZH1/2 雙抑制劑、PROTAC)正在替代。

CDK 抑制劑(尤其 CDK7/9)的治療窗口問題。由于 RNA Pol II CTD 磷酸化的全局性,選擇性窗口取決于細胞對 SE-驅動基因的依賴,腫瘤特異性需精準患者篩選。

凝聚體模型推斷的臨床轉化。很多關于 EWS-FLI1、NUP98 凝聚體功能的結論建立在過表達系統(如 mESC、HEK293)中,內源水平、原位組織水平的驗證仍在推進。

3D 基因組學的解釋多為統計性。Hi-C/HiChIP 是群體測量,單細胞 Hi-C 數據稀疏,提到的環和 hub 通常是統計性平均;接觸頻率與轉錄功能的因果鏈需 CRISPRi/dCas9 與 Region Capture Micro-C 等高分辨率工具進一步驗證。

Enhancer hijacking 判定標準不一。HAPI、Neoloop、PANGEA、CESAM 等算法各有偏倚,候選基因優先級需要結合 H3K27ac HiChIP、表達相關性、CRISPRi 功能驗證三重證據。

前瞻性陳述的臨床現實。本文提到的部分前瞻性內容(某些 PROTAC、condensate-modifying drugs)目前仍處于臨床前或早期探索階段,臨床轉化效果未有定論。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
看完日本2-2絕平荷蘭,產生四大不可思議,世界杯死亡之組變亂了

看完日本2-2絕平荷蘭,產生四大不可思議,世界杯死亡之組變亂了

侃球熊弟
2026-06-15 06:36:47
臺媒集體炸鍋,直呼臺灣海峽沒了

臺媒集體炸鍋,直呼臺灣海峽沒了

果媽聊娛樂
2026-06-14 18:45:19
中央氣象臺發布暴雨黃色預警、強對流天氣藍色預警,廣東沿海局地有特大暴雨

中央氣象臺發布暴雨黃色預警、強對流天氣藍色預警,廣東沿海局地有特大暴雨

界面新聞
2026-06-14 18:10:21
“史上最小參賽國”庫拉索踢進世界杯首球!中國老板娘在當地請球迷吃燒烤,進球時刻街頭轟動

“史上最小參賽國”庫拉索踢進世界杯首球!中國老板娘在當地請球迷吃燒烤,進球時刻街頭轟動

極目新聞
2026-06-15 10:59:08
央視新聞:包括足協主席在內的多名伊朗代表團成員美簽再遭拒

央視新聞:包括足協主席在內的多名伊朗代表團成員美簽再遭拒

懂球帝
2026-06-15 10:36:30
站在近五年A股解禁史的坐標上:影石創新的400億壓力測試

站在近五年A股解禁史的坐標上:影石創新的400億壓力測試

功夫財經
2026-06-11 09:35:01
Jessica中國機場被臭到干嘔?當場急捂口鼻快閃,她解釋反遭轟

Jessica中國機場被臭到干嘔?當場急捂口鼻快閃,她解釋反遭轟

星野娛樂天地
2026-06-14 13:46:31
小米工程師稱怕某些公司“比情懷搞捆綁”,疑似暗諷盤古大模型

小米工程師稱怕某些公司“比情懷搞捆綁”,疑似暗諷盤古大模型

三言科技
2026-06-14 15:48:00
1300萬全款買的大平層,為何說“花這個錢很不值”?她蹲下來一處處指點……

1300萬全款買的大平層,為何說“花這個錢很不值”?她蹲下來一處處指點……

北青網-北京青年報
2026-06-15 08:52:19
10萬印度人申請中國簽證,駐印徐大使發文祝賀,評論區一片擔憂!

10萬印度人申請中國簽證,駐印徐大使發文祝賀,評論區一片擔憂!

譚談社會
2026-06-14 20:48:57
可憐的法國,邀請不到中國,連沙特都不給面子了

可憐的法國,邀請不到中國,連沙特都不給面子了

虛聲
2026-06-14 20:13:51
立即結束戰爭!美伊達成和平協議!油價跳水,黃金、白銀、美股指期貨全線拉升

立即結束戰爭!美伊達成和平協議!油價跳水,黃金、白銀、美股指期貨全線拉升

證券時報
2026-06-15 07:30:05
日本2:2逼平荷蘭,黃種人奪得世界杯短期內基本上是南柯一夢

日本2:2逼平荷蘭,黃種人奪得世界杯短期內基本上是南柯一夢

李廣專業體育評論
2026-06-15 06:03:13
一地雞毛啊!成都女子放棄60萬年薪丈夫,如今相親市場無人問津

一地雞毛啊!成都女子放棄60萬年薪丈夫,如今相親市場無人問津

火山詩話
2026-06-15 07:09:09
原來他們用的是藝名啊!新規要求演員必須署真名,這回是藏不住了

原來他們用的是藝名啊!新規要求演員必須署真名,這回是藏不住了

上官晚安
2026-06-14 20:16:04
月薪從2.6萬驟降到700!4S店大崩盤:超10萬人離場 傳統渠道徹底涼了

月薪從2.6萬驟降到700!4S店大崩盤:超10萬人離場 傳統渠道徹底涼了

快科技
2026-06-14 14:05:12
數億煤礦1200萬賤賣,法官套現千萬:河南這出“吃干抹凈”的局

數億煤礦1200萬賤賣,法官套現千萬:河南這出“吃干抹凈”的局

有戲
2026-06-12 10:48:18
日本2-2絕平荷蘭!名嘴黃健翔精準點評,亞洲足球展現頂級韌性!

日本2-2絕平荷蘭!名嘴黃健翔精準點評,亞洲足球展現頂級韌性!

田先生籃球
2026-06-15 06:26:27
利津縣水利局黨組成員、副局長李國瑋接受紀律審查和監察調查

利津縣水利局黨組成員、副局長李國瑋接受紀律審查和監察調查

閃電新聞
2026-06-15 10:34:50
同學聚會,發現一個扎心的現實:年過40的女同學中,1/3沒有工作,1/3做著低薪但沒前途工作,剩下的1/3基本都在體制內

同學聚會,發現一個扎心的現實:年過40的女同學中,1/3沒有工作,1/3做著低薪但沒前途工作,剩下的1/3基本都在體制內

品讀時刻
2026-06-13 09:03:28
2026-06-15 11:15:00
岳醫生 incentive-icons
岳醫生
泌尿外科執業醫師,醫學博士
38文章數 252關注度
往期回顧 全部

科技要聞

外媒體驗新版Siri:蘋果AI危機暫時緩過來了

頭條要聞

山東近3億重點工程現"脆皮"底座 承建方承認不達標

頭條要聞

山東近3億重點工程現"脆皮"底座 承建方承認不達標

體育要聞

8年8隊奪冠,鄧肯那句話,現在還給了馬刺

娛樂要聞

要求演員必須用原名,誰最尷尬!

財經要聞

日系巨頭要為中國品牌代工了

汽車要聞

帶激光雷達海鷗勇闖城中村 比亞迪天神之眼B智駕真能兜底?

態度原創

房產
健康
藝術
游戲
旅游

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

老人、小孩、孕婦,吃粽子有啥風險

藝術要聞

218米!建行最大的獨棟辦公樓,和農行長得一模一樣!

魔獸世界:60版本公認實力最強的綠色飾品,水準直達天花板!

旅游要聞

北京環球度假區“酷爽夏日”活動啟動

無障礙瀏覽 進入關懷版