網易首頁 > 網易號 > 正文申請入駐

西安交通大學嚴如強教授團隊：面向機械故障診斷的大模型：研究進展與未來方向| CJME論文推薦

2026-05-28 17:51:09　來源: 機械工程學報

北京舉報

分享至

引用論文

Ruqiang Yan, Jiaxin Ren, Jingcheng Wen, Chang Guo, Zhibin Zhao, Xuefeng Chen, Large Models for Machinery Fault Diagnosis: Current Advances and Future Directions, Chinese Journal of Mechanical Engineering, Volume 39, 2026, 100277, https://doi.org/10.1016/j.cjme.2026.100277.

(戳鏈接，下載全文)

關于文章

行業現狀

在制造業、能源和航空航天等關乎國計民生的關鍵領域，機械系統的可靠性是確保安全生產的基石。隨著人工智能技術的飛速演進，機械故障診斷已經從傳統統計學習轉向深度學習，并正邁入大模型驅動的新紀元。早期的機器學習方法依賴手工特征工程，而隨后的深度學習模型實現了從原始監測信號到健康狀態的端到端映射，極大地減少了人工干預。如今，隨著人工智能的爆發，研究已邁入全新的大模型(LMs)時代。GPT、DeepSeek、Qwen 等大型語言和多模態模型展現出了強大的特征提取與決策潛力。它們通過小樣本甚至零樣本學習，大幅減少了人工干預，并能夠融合聲學、振動、文本等跨模態信息，為故障診斷提供了更全面、智能的解決方案，成為智能運維最前沿的發展方向。

智能診斷中的大模型技術

圖 1. 從基礎到應用：智能故障診斷中的大模型

大模型的定義與核心：

大模型通常基于 Transformer 架構，包含數億至數千億個參數，并通過海量數據集進行自監督預訓練。Transformer 的核心是用自注意力機制取代傳統的循環計算結構，從而實現高效的并行訓練和長距離依賴建模。

大模型在 MFD 中的應用：

目前大模型在 MFD 中的應用主要分為兩個互補的視角：面向機械故障診斷的大模型(LM for MFD)和機械故障診斷專用大模型 (LM of MFD)。前者側重于通過設計不同的機制或微調策略，對現有通用大模型進行適配以處理故障特征；后者則強調從頭開始設計和訓練專門針對 MFD 領域異構數據特點的大模型架構。

面向機械故障診斷的大模型(LM for MFD)：

從適配機制上，面向故障診斷的大模型可分為基于上下文學習、基于微調和基于檢索增強生成（RAG）的三類。

1）基于上下文學習(ICL)的大模型：在提示詞（Prompt）中提供故障診斷示例，使大模型無需更新自身參數即可學習如何處理特定的 MFD 任務。

優缺點：無需額外訓練，對新任務靈活且可快速更新；但其性能對提示詞設計和上下文長度極度敏感，在不同專業領域的表現不夠穩定。

2）基于微調的大模型：利用全參數微調或參數高效微調（PEFT，如 LoRA、Prompt tuning 等）顯式調整大模型的權重，使其對機械故障特征更加敏感，適配下游任務。

優缺點：具有較高的任務特定準確性，能深度適應各種復雜的 MFD 場景；但不可避免地存在 MFD 領域與預訓練模型之間的知識差距，且有過度擬合或災難性遺忘的風險。

圖2 常見的大模型微調方法

3）基于檢索增強生成(RAG)的大模型：將外部設備知識庫、維護手冊或歷史故障記錄與大模型相結合，在推理時動態檢索相關信息，從而增強模型表征與生成結果的事實依據。

優缺點：能夠引入知識增強的故障特征，顯著降低模型生成“幻覺”的風險；但外部知識源有時缺乏清晰的物理故障機理，且該架構缺乏對設備底層信號的實時監測能力。

機械故障診斷專用大模型 (LM of MFD)：

此類方法強調構建與工業數據內在特征對齊的架構，依據輸入模態可分為基于語言、基于多模態和基于時間序列的大模型。

1）基于語言的大模型：將時間序列信號映射為語言或專用的結構化 Token 表示，以實現基于語言邏輯的推理過程。

優缺點：具備強大的語義理解能力，能產生具有極高人類可解釋性的輸出；但需要額外的信號-文本轉換步驟，這通常會導致原始監測信號中的部分關鍵物理信息丟失。

2）基于多模態的大模型：將文本、圖像（如熱圖或頻譜圖）、振動信號和操作日志等異構數據源集成到一個統一的架構中，支持跨模態特征對齊與深度理解。

優缺點：能提供全面和穩健的設備狀態感知，大幅減少單一模態帶來的感知偏差；但其計算成本極高，對硬件要求苛刻，且大規模高質量的多模態工業數據集獲取困難。

3）基于時間序列的大模型：將監測信號直接作為標記化（Tokenized）序列進行處理，使模型能夠在沒有中間轉換的情況下原生捕獲時間模式和故障演變特征。

優缺點：可直接對原始信號進行直接序列建模，充分利用海量的工業監測數據；但目前仍缺乏能夠提取統一特征的標準化架構，且向高層級維護決策任務的泛化能力較差。

難點或瓶頸

盡管大模型為機械故障診斷領域注入了前所未有的潛力，并有望從根本上重塑傳統的診斷范式，但要跨越從理論探索到工業級大規模部署的鴻溝，依然面臨著重重挑戰。深度學習向大模型范式的轉變，并沒有消除原有的數據獲取和泛化難題；相反，大模型龐大的參數量、對高質量數據的極度渴求，以及其內部復雜的決策黑盒，在真實且對安全性要求極高的工業環境中被進一步放大。這些瓶頸極大地限制了其在實時監控和資源受限場景下的廣泛應用。

總的來說，目前智能運維大模型還存在以下難點：

1）數據異構性與高質量標注匱乏：盡管工業數據集的絕對數量在增加，但這些數據通常來自不同的機器、工況和傳感器模式，導致格式、質量和標簽標準存在顯著差異。缺乏充足且高質量的標注數據，使得在真實工業場景中訓練和微調大型模型變得既耗時又昂貴。

2）高昂的計算成本與邊緣部署困難：大型模型的預訓練和全面微調需要海量的計算資源，這使得普通學者或資源受限的工業企業難以承擔。此外，大模型龐大的參數量導致其很難直接部署在存儲、內存和算力均受限的工業邊緣設備上，難以滿足異常檢測等任務的實時性要求。

3）“黑盒”特性與解釋性缺失：大模型內部隱藏的決策過程導致其缺乏透明度。在有限的故障數據下，模型容易陷入偽相關性，這在需要清晰推理以確保信任和安全操作的高風險工業應用中，嚴重削弱了診斷結果的可靠性。

4）跨場景的泛化能力受限：由于真實的工業設備長期處于動態運行環境中，經常會出現新發故障或分布外(OOD)數據。目前的深度學習和大模型在面對未見過的數據分布、跨機器或復雜運行條件時，仍容易出現性能退化。

趨勢與展望

圖 3 故障診斷大模型范式的轉變：從單純感知邁向工業智能

大模型在機械故障診斷中的角色正在跨越單純的“感知驅動”，向著更高層級的決策制定和自主適應的“工業智能”大步邁進。未來的診斷大模型將不再僅僅是被動地將傳感器數據分類為健康或故障狀態，它們將演化為具備類人邏輯思維的智能代理，不僅能精準識別系統狀態，還能深刻推演底層的故障機制，并自主規劃主動性的維護策略。為實現這一從純數據驅動到知識融合、決策導向的跨越，未來的研究預計將沿著以下幾個相輔相成的前沿方向展開：

（1）推理驅動的診斷方法：通過利用大型模型的涌現推理能力，處理復雜和不確定的故障模式。通過引入思維鏈(CoT)或思維樹(ToT)等結構化搜索和強化微調機制，模型可以實現多步邏輯推理，從而提供高度可解釋和自適應的診斷路徑。

（2）知識增強的可靠性提升：將領域專業知識（如機械知識圖譜）深度嵌入大模型的預訓練和推理階段。這不僅能確保模型生成的推理鏈符合物理機制，減少幻覺輸出，還能極大提升診斷結果的可解釋性和信任度。

（3）多模態融合策略：整合振動、聲學、熱成像以及操作日志和文本等異構數據源，以實現對設備健康狀態的全面監測與感知。

（4）智能代理賦能的自主運維：通過賦予大模型使用外部工具、任務分解以及反思的能力，如 Reason-and-Act 模式或多代理協作，系統將能夠執行閉環的自主監控、交互式診斷和自適應維護規劃。

（5）持續學習機制：為了應對不斷變化的運行條件、設備老化和新型故障模式，整合經驗回放或知識蒸餾等持續學習機制，可確保診斷模型在不斷學習新知識的同時，有效克服災難性遺忘。

（6）面向邊緣部署的輕量化優化：運用模型壓縮、網絡剪枝、知識蒸餾和模型量化等技術，在大幅降低計算和存儲成本的同時保持診斷精度，從而滿足大模型在資源受限的工業現場進行高效、低延遲部署的需求。

總結

從早期的統計機器學習到深度學習，再到如今大模型驅動的工業智能診斷，機械故障診斷領域正經歷著技術范式的深刻演進。大模型在邏輯推理、多模態知識表征和少樣本學習等方面展現出的卓越能力，為打破傳統深度學習在數據稀缺條件下面臨的泛化瓶頸提供了前所未有的可能。本文系統梳理了大模型在機械故障診斷領域的演進脈絡，并勾勒出下一代智能診斷的技術藍圖。

關于作者

作者介紹

嚴如強，西安交通大學機械工程學院教授、博士生導師，國際機械中心主任。從事重大裝備智能運維相關的理論方法與工程應用研究，主持科技部重點研發計劃項目和基金委自然科學基金重點項目等。國際電氣與電子工程師協會會士(IEEE Fellow)、美國機械工程師協會會士(ASME Fellow)、享受國務院政府特殊津貼、國家級領軍人才、獲 2023 年國家技術發明二等獎、2020 年陜西省技術發明一等獎和教育部自然科學一等獎、IEEE 儀器與測量學會 2019 年科技獎和 2022 年杰出服務獎, 牽頭制定 IEEE國際標準 1 項。目前為 IEEE 儀器與測量學會杰出講座學者，《IEEE Systems Journal》主編和《機械工程學報》英文版副主編，曾任國際期刊《IEEE Transactions on Instrumentation and Measurement》主編。

研究方向

（1）可解釋人工智能運維方法。

（2）機電系統狀態監測、故障診斷與剩余壽命預測。

（3）人工智能與智能制造、制造服務融合。

（4）生物醫學信號檢測與處理。

近兩年團隊發表文章

[1] Yan R, Zhou Z, Shang Z, et al. Knowledge driven machine learning towards interpretable intelligent prognostics and health management: Review and case study[J]. Chinese Journal of Mechanical Engineering, 2025, 38(1): 5.

[2] Ren J, Liu X, Wang T, et al. PHM–GPT: A Large Language Model for Prognostics and Health Management[J]. Engineering, 2025.

[3] Ren J, Wen J, Zhao Z, et al. Uncertainty-aware deep learning: A promising tool for trustworthy fault diagnosis[J]. IEEE/CAA Journal of Automatica Sinica, 2024, 11(6): 1317-1330.

[4] Zhou Z, Li Y, Yan R. Invertible transfer function informed neural ODE to learn stable latent dynamics for degradation process modeling and remaining useful life prediction[J]. Journal of Manufacturing Systems, 2025, 83: 494-504 .

[5] Wei Z, Wang H, Zhao Z, et al. Gearbox fault diagnosis based on temporal shrinkage interpretable deep reinforcement learning under strong noise[J]. Engineering Applications of Artificial Intelligence, 2025, 139: 109644 .

作者：嚴如強

責任編輯：杜蔚杰

責任校對：向映姣

審核：張強

JME學院簡介

JME學院是由《機械工程學報》編輯部2018年創建，以關注、陪伴青年學者成長為宗旨，努力探索學術傳播服務新模式。

歡迎各位老師掃碼添加小助理-暖暖為好友，由小助理拉入JME學院官方群！

歡迎關注JME學院視頻號~

尋覓合作伙伴

有一種合作叫做真誠，有一種發展可以無限，有一種伙伴可以互利共贏，愿我們合作起來流連忘返，發展起來前景可觀。關于論文推薦、團隊介紹、圖書出版、學術直播、招聘信息、會議推廣等，請與我們聯系。

感謝關注我們！《機械工程學報》編輯部將努力為您打造一個有態度、有深度、有溫度的學術媒體！

本文為《機械工程學報》編輯部原創內容，歡迎轉載！

在公眾號后臺留言需要轉載的文章題目及要轉載的公眾號ID以獲取授權!

聯系人：暖暖

電話：010-88379909

E-mail：jme@cmes.org

網址：http://www.cjmenet.com.cn

官方微信號：jmewechat

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機 / 數碼

房產 / 家居

西安交通大學嚴如強教授團隊：面向機械故障診斷的大模型：研究進展與未來方向| CJME論文推薦