在生物制藥行業中,中國倉鼠卵巢(CHO)細胞是重組治療蛋白生產的核心宿主細胞,全球超70%的單克隆抗體、凝血因子、促紅細胞生成素等高端生物制品,均依托CHO細胞培養體系制備。在工藝開發過程中,如何同步實現蛋白高產(高滴度)與穩定可控的糖基化修飾,是長期困擾行業的核心技術難題。傳統實驗設計(DoE)模式,面對培養基組分、工藝參數構成的高維、非線性復雜體系,存在實驗量大、效率低下的短板,且無法有效平衡產量與產品質量的多重約束目標。
![]()
近日,新加坡科技研究局聯合日本味之素的跨國科研團隊發布重磅研究成果,搭建了業內首個端到端、機器學習驅動的CHO補料分批培養工藝優化工作流。該技術方案突破傳統工藝局限,僅依托初始培養基配方與基礎工藝參數,即可精準預測最終蛋白滴度與糖基化修飾水平,徹底規避了傳統方案中繁瑣、耗時的廢培養基檢測分析工作。經實驗驗證,該智能優化體系成功實現「降低不良甘露糖基化、提升蛋白產量」的雙向優化,為生物制藥工藝智能化升級提供了成熟可行的新路徑。
一、行業痛點:傳統工藝優化的 "維度詛咒"
CHO細胞最核心的應用優勢,是可完成接近人體的蛋白翻譯后修飾,其中糖基化修飾是決定治療性蛋白藥效、安全性與體內代謝特性的關鍵質量屬性。具體而言,高甘露糖型糖基化修飾會加速藥物在人體內的清除速率,縮短藥效半衰期;而低巖藻糖修飾的抗體蛋白,抗體依賴性細胞介導的細胞毒性(ADCC)活性顯著提升,直接影響藥物抗腫瘤、抗病毒療效。因此,精準調控糖基化譜是生物藥工藝開發的核心核心目標。
但糖基化調控機制極為復雜,受體系內40余種培養基營養組分(氨基酸、維生素、金屬離子、碳源等)和多項核心工藝參數(pH值、溶解氧、補料速率等)的共同調控。各變量之間存在強烈的非線性耦合作用,微小的培養條件波動,都可能引發糖基化模式和蛋白產量的大幅偏差,給工藝穩定性與優化工作帶來極大挑戰。
傳統DoE工藝優化方法(響應面法、正交試驗等)僅適用于少量變量的簡單體系,當優化因素超過3-5個時,實驗量呈指數級增長、優化效率大幅衰減,且依賴固定多項式模型,無法精準擬合細胞培養復雜的生物學調控規律。同時,現有多數機器學習優化方案,高度依賴培養過程中的廢培養基代謝數據分析,難以直接落地到初始培養基配方設計與工藝參數設定,工程應用價值受限。
二、創新方法:端到端機器學習工作流
為破解行業技術瓶頸,研究團隊搭建了專屬CHO細胞糖基化優化的高精度數據集。該數據集依托Ambr48生物反應器完成104組14天補料分批培養實驗,覆蓋36組差異化實驗條件,系統性調控76個核心輸入特征(44種營養物濃度+3項關鍵工藝參數),全程動態監測蛋白滴度、甘露糖基化、巖藻糖基化、半乳糖基化四大關鍵質量屬性(CQAs),為模型訓練和工藝優化提供了全面、真實的工業化實驗數據支撐。
基于自建高質量數據集,研究團隊構建了一套「模型訓練-特征篩選-智能優化」三步式機器學習工藝優化工作流,全程高效、精準、可落地:
多算法融合模型訓練:對比評估PLSR、LASSO、隨機森林、XGBoost、多層感知器(MLP)等主流機器學習算法,篩選出適配小樣本、高維生物數據的穩健模型,保障預測精度與泛化能力。
人機結合精準特征篩選:創新融合SHAP模型可解釋性算法與行業文獻經驗,摒棄純數據驅動的盲目篩選模式,從76個變量中精準篩選出20個高影響力核心因子,為后續工藝驗證和參數優化縮小實驗范圍。
模擬退火多目標智能優化:以訓練完成的高精度模型為代理模型,結合模擬退火算法開展主動學習優化,在高維參數空間中智能遍歷海量培養基與工藝組合,精準匹配「高蛋白滴度、低甘露糖基化、巖藻糖/半乳糖基化穩定」的工業化最優工藝方案。
三、核心結果:精準預測與雙重優化1. 模型預測性能卓越
該研究最大的技術突破是無需過程性廢培養基檢測,僅通過培養初始的培養基組分與工藝參數,即可實現對最終產品質量的精準預測。最優模型對蛋白滴度的預測擬合度R2高達0.94,對半乳糖基化、甘露糖基化、巖藻糖基化的預測R2分別達到0.95、0.85、0.81。這一結果證實:培養初始輸入參數已包含決定最終產品產量與糖基化質量的核心信息,徹底簡化了生物工藝預測與優化流程。
表1 不同模型在不同特征集上的測試 R2 性能總結
![]()
2. 發現 15 個關鍵調控靶點
研究團隊對篩選得到的20個核心因子開展單因素對照實驗驗證,最終確認15個可直接落地的工藝調控靶點。其中錳離子(Mn2?)、脯氨酸、培養pH、補料百分比四大變量,可同時顯著調控蛋白滴度與多項糖基化指標,是工藝優化的核心關鍵參數。
同時,該研究挖掘出多項全新調控機制:首次證實脯氨酸、酪氨酸、天冬酰胺等氨基酸對甘露糖基化的調控作用;且Mn2?、核黃素、葉酸等組分,可在無需額外補充核苷酸糖(傳統糖基化調控核心靶點)的條件下,有效調節細胞糖基化修飾水平。該發現極大拓展了CHO細胞工藝優化的調控維度,為工藝人員提供了全新的優化思路與技術工具。
![]()
圖1 單因素驗證實驗結果數值通過該次運行中對照的平均參考值進行歸一化。每個實驗條件都標注了雙側 t 檢驗的絕對 t 統計量。點離虛線參考線越遠,實驗條件對目標 CQA 產生影響的可能性就越大。
3. 主動學習實現雙重優化
傳統工藝優化中普遍存在「高產必然伴隨不良糖基化升高」的矛盾,是制約高品質生物藥量產的核心痛點。本研究通過模擬退火算法智能遍歷高維參數空間,篩選出最優培養基與工藝組合方案。經實驗驗證,該優化方案可實現甘露糖基化降低10.5%、蛋白滴度同步提升6.3%,成功破解產量與質量相互制約的行業難題,實現雙向協同優化。
![]()
圖2 模擬退火探索的特征空間與最優解小提琴圖顯示了每個特征探索的模擬值分布與基線值的對比。底部散點圖顯示了探索點(橙色)和實際數據點(藍色)的預測滴度和甘露糖基化。綠色框突出顯示了低甘露糖基化和高滴度的理想區域。
4. 代謝機制解析
研究團隊通過主成分分析(PCA)深度解析代謝調控機制,明確了培養過程中早期氨積累是誘發高甘露糖基化的核心誘因,而培養后期的氨含量變化對細胞產能、蛋白產量無顯著負面影響。這一機制發現為工藝精細化調控提供了明確方向:通過精準控制培養前期的氨代謝水平,即可在不損耗蛋白產量的前提下,有效優化糖基化修飾質量,提升產品安全性與有效性。
![]()
圖3 關鍵 CQAs、CPPs 和代謝物的 PCA 圖顯示了第 14 天 CQAs、第 7 天和第 14 天代謝物,以及工藝參數(pH、DO、補料百分比)之間的關系。載荷向量已統一放大 6 倍以提高清晰度。
四、意義與展望
本研究構建的全流程機器學習優化體系,首次實現了基于初始參數的CHO細胞培養工藝智能化優化,將傳統數百次實驗、數月周期的工藝開發工作,壓縮至數周完成,大幅提升生物制藥工藝迭代效率。該方案的核心創新與行業價值體現在三大維度:
無需廢培養基分析,大幅降低了實驗成本和時間
發現了多個新的糖基化調控靶點,擴展了工藝調控工具箱
證明了機器學習 + 主動學習在高維生物制造設計空間中的巨大優勢
未來研究可通過整合時序代謝組學數據、融合機理模型與數據驅動模型,搭建更精準的混合優化框架,結合多輪主動學習迭代持續收斂最優工藝參數。該智能化工藝優化模式,有望徹底革新傳統生物制藥「試錯式」工藝開發體系,大幅縮短新藥產業化周期、降低研發與生產成本,為高品質生物藥的規模化、標準化生產提供核心技術支撐。
識別微信二維碼,添加抗體圈小編,符合條件者即可加入
抗體微信群!
請注明:姓名+研究方向!
本公眾號所有轉載文章系出于傳遞更多信息之目的,且明確注明來源和作者,不希望被轉載的媒體或個人可與我們聯系(cbplib@163.com),我們將立即進行刪除處理。所有文章僅代表作者觀不本站。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.