RNA測序是生物醫學研究的標配工具,但它一直有個繞不開的缺點:你測到的讀段再多,也不等于樣品里真有那么多分子。并且系統誤差在不同實驗室、不同批次之間悄悄積累,常規質控指標往往把這些偏差都掩蓋過去,因此而導致數據很難進行橫向的比較。
近日,中國計量科學研究院董蓮華團隊聯合復旦大學石樂明教授團隊在《自然·通訊》發表了一項研究,試圖從根本上解決這個問題。他們做出來一套叫TranScale的仿生RNA標準品,并用同位素稀釋質譜法給每一份標準品標定了可追溯至國際單位制的絕對濃度,再用這些“標尺”去校正整個RNA測序流程。中國計量科學研究院的副研究員張瑜、研究生楊炳文、復旦大學副教授郁穎為論文的共同第一作者。中國計量科學研究院的董蓮華研究員、方向研究員及復旦大學的石樂明教授為本文的共同通訊作者。
![]()
他們一共設計了100條RNA轉錄本,長度從500個堿基到3800個堿基不等,GC含量也壓在40%到50%這個范圍里,跟人類基因組的樣子差不多。這批標準品里有野生型的序列,也有可變剪接體、單核苷酸變異和融合基因,都是臨床上大家最關心的那幾種變異類型。
為了避免干擾真實樣本的數據分析,他們特意用了人類基因的反向鏡像序列。這樣一來,標準品在建庫和測序的時候行為跟普通RNA一樣,到了比對那一步又不會跟人類基因組撞上。
為了保證濃度值要拿到真正靠譜的,團隊就得用同位素稀釋質譜這種基準級的測量方法。兩個操作員各自做了四輪酶解消化,每個轉錄本重復測了12次,相對標準偏差全都控制在10%以內。最后團隊配出來的Mix1和Mix2兩個混合標準品,擴展相對不確定度分別不超過16%和18%,動態范圍差不多有400倍。
![]()
在使用的時候,TranScale直接跟生物樣本混在一起,一起建庫一起測序。每個文庫都能得到一條很直的校準線,決定系數R2超過了0.97。團隊為了驗證這套東西在不同平臺上的表現,他們在三種實驗室、兩種建庫方法和兩種測序平臺上一共跑了12個批次。沒校準的時候,主成分分析圖上的樣本幾乎全按批次抱成一團,腫瘤和正常組織根本分不出來。用TranScale一校準,樣本終于按照真實的生物學身份聚到了一起。中位變異系數從85%以上掉到了25%以下,生物信號跟噪聲的比值從接近零一下子躥到了7.9,比常用的ComBat算法還好一些。
那么,在有了絕對定量的能力后,他們開始試著做一些以前很難做的比較。原癌基因MET的轉錄本數量,比它下游的接頭蛋白GRB2低了大約150倍,這個結果跟數字PCR對得上。在另一類腫瘤細胞里,挨在一起的ERBB2和GRB7這兩個基因,轉錄本數量差不多是一比一。他們還模擬了一下臨床診斷,拿ERBB2的表達量當判讀指標。沒校準的時候,不同批次的結果來回變,陽性和陰性判斷老出錯。用了TranScale之后,所有批次的判斷都跟數字PCR這個金標準完全一致。這套標準品現在已經對外開放了。
READING
BioPeers
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.