德克薩斯大學阿靈頓分校研發(fā)：讓AI替你操控工程仿真軟件

2026-06-09 21:44:33　來源: 科技行者

北京舉報

分享至

這項由德克薩斯大學阿靈頓分校聯(lián)合倫斯勒理工學院共同完成的研究，以arXiv預印本形式于2026年5月28日發(fā)布，論文編號為arXiv:2606.00138v1，感興趣的讀者可通過該編號檢索完整論文。

有沒有想過，工程師在電腦前對著一堆復雜軟件發(fā)呆的畫面？那種軟件叫做有限元分析軟件，是現(xiàn)代工程設計里不可缺少的"虛擬實驗室"。當一座橋梁還沒有建成，工程師就能用它模擬這座橋在各種壓力下會不會斷裂；當一款手機外殼還在設計階段，工程師就能用它預測摔落時會不會開裂。問題在于，這類軟件極其難以掌握，需要多年的專業(yè)訓練，稍有不慎還可能產(chǎn)生完全錯誤卻看起來沒問題的結果，釀成真實事故。

現(xiàn)在，這項研究帶來了一個新思路：既然大型語言模型（也就是ChatGPT這類AI）已經(jīng)能夠理解人類說話的意思，為什么不讓AI來充當這個"虛擬工程助手"，幫普通人甚至經(jīng)驗不足的學生直接操控這套復雜軟件呢？這個系統(tǒng)被稱為AbaqusAgent，其中Abaqus是全球工業(yè)界使用最廣泛的有限元分析軟件之一，而Agent則是"代理人"的意思——它代替你完成所有繁瑣的專業(yè)操作。

一、工程仿真軟件到底難在哪里

要理解這項研究的價值，得先理解那個問題有多棘手。有限元分析，英文縮寫FEA，誕生于上世紀五十年代，是一種把復雜結構切分成無數(shù)小塊、分別計算再拼合的數(shù)值方法。你可以把它理解成這樣：當你想知道一塊不規(guī)則形狀的橡皮泥被捏壓后會如何變形，直接用公式算幾乎不可能，但如果你把橡皮泥切成成千上萬個微小方塊，每個方塊的變形都能用簡單公式算出來，再把所有方塊的結果拼在一起，就能得到整體變形的圖像。這就是有限元的核心思想。

問題在于，要讓這套計算正確運行，使用者必須精確定義一大堆參數(shù)：結構的幾何形狀要怎么描述、材料的力學性質是什么、哪些地方固定住不能動（邊界條件）、哪些地方受到了力（載荷條件），以及最后要提取哪些計算結果。任何一個參數(shù)定義錯誤，計算都可能順利完成但結果完全不對——軟件本身不會告訴你物理上是否合理，只會按照你給的參數(shù)算出答案。就像你拜托一個非常勤快但不思考的助手幫你烤蛋糕，你如果把糖的用量寫錯了，他會嚴格按照錯誤配方烤出一個根本不能吃的成品，還信心滿滿地遞給你。

正因為如此，有限元分析在全球工程教育和工業(yè)應用中都面臨著巨大的"入門門檻"。這項研究指出，在真實工程問題中運用有限元分析，通常需要多年的實際工作經(jīng)驗積累。

二、AbaqusAgent是怎么工作的

研究團隊設計AbaqusAgent的方式，就像打造一個由六名不同專長成員組成的工作小組，每個成員負責整個流程中的一個環(huán)節(jié)，彼此配合完成從"用戶說了什么"到"仿真結果呈現(xiàn)在屏幕上"的全過程。

這個小組的第一位成員叫做"解讀員"（Interpreter Agent）。當用戶用自然語言描述自己的工程問題時，解讀員的任務是檢查這段描述是否完整。它會核查五個關鍵要素是否都提到了：幾何形狀的描述、材料的力學性質、邊界條件（哪里固定）、加載條件（施加什么力），以及需要提取什么結果。如果有遺漏，它會提示用戶補充，而不是自己腦補一個可能出錯的假設。同時，它還會把用戶的原始描述重新改寫成更規(guī)范的工程語言，方便后續(xù)成員處理。

第二位成員是"架構師"（Architect Agent）。它的任務是從一個預先建好的案例庫里，找到與用戶當前問題最相似的參考案例。這個案例庫就像一個包含了104個經(jīng)典工程題目的"題庫"，每道題都有詳細的問題描述和對應的Abaqus輸入文件。架構師通過一套精密的搜索算法，在這個題庫里找到最合適的參考，作為后續(xù)生成文件的模板。

第三位成員是"代碼生成員"（Input Writer Agent）。Abaqus軟件的核心是一個后綴名為.inp的輸入文件，這個文件用特定的關鍵詞語法描述了整個仿真模型——節(jié)點坐標、單元連接關系、材料參數(shù)、邊界條件、載荷、輸出請求，一行都不能少，格式必須精確。代碼生成員的任務就是以架構師找到的參考案例為語法模板，以用戶的實際需求為物理內容，生成這個完整的輸入文件。

第四位成員是"執(zhí)行員"（Runner Agent）。它把生成的輸入文件提交給Abaqus求解器運行，等待計算完成后收集結果文件，包括那個包含了所有應力、應變、位移數(shù)據(jù)的.odb結果文件。

如果計算失敗了怎么辦？這時候第五位成員"審查員"（Reviewer Agent）就登場了。Abaqus在運行失敗時會生成錯誤日志文件，審查員會仔細分析這些錯誤信息，判斷是哪里出了問題，并提出修改建議，再把任務交回給代碼生成員重新生成修正后的輸入文件，重新提交運行。這個循環(huán)可以最多進行十五次，大多數(shù)問題在這個過程中都能被逐步修正解決。

第六位成員是"可視化員"（Visualization Agent）。當計算成功后，它會自動提取變形數(shù)據(jù)和應力云圖，生成直觀的圖片和數(shù)據(jù)文件，讓用戶能直接看到仿真結果。

這六位成員協(xié)同工作的整個流程，從用戶輸入一段自然語言描述開始，到屏幕上出現(xiàn)彩色的仿真云圖結束，完全不需要用戶具備任何Abaqus的專業(yè)知識。

三、那個"題庫"是怎么建成的

AbaqusAgent里這個叫做RAG（檢索增強生成）的案例庫，是整個系統(tǒng)最關鍵也最費心思的部分之一。RAG是"Retrieval-Augmented Generation"的縮寫，通俗地說就是"先查資料再回答"，而不是讓AI憑空想象一個答案。

為什么這個題庫這么重要？因為Abaqus是商業(yè)軟件，它的官方案例和代碼并不像開源軟件那樣在網(wǎng)上唾手可得。研究團隊花費了大量精力，從Abaqus官方基準手冊中整理了71個經(jīng)典案例，再自行開發(fā)了33個教材風格的習題，合計104個案例構成了整個知識庫。每個案例都包含三層信息：案例的基本標簽（名稱、分析類型、結構類別、材料類型），自然語言的問題描述，以及完整可運行的Abaqus輸入文件。

這104個案例覆蓋了固體力學的五大類問題。靜力分析有35個案例，是基礎中的基礎，研究結構在穩(wěn)定載荷下的變形和應力。動力分析有26個案例，涉及時間相關的運動和沖擊問題。非線性材料有19個案例，包括金屬塑性變形、接觸摩擦、斷裂等復雜行為。結構屈曲有14個案例，研究細長結構在壓力下突然失穩(wěn)的現(xiàn)象，就像用力按壓一根細長的木棍時它會突然彎折。復合材料與層合板有10個案例，針對碳纖維增強復合材料這類各方向性質不同的特殊材料。

在搜索算法上，研究團隊設計了一套兩階段的混合檢索策略。第一階段使用Facebook開發(fā)的FAISS向量搜索庫，把用戶的問題描述和題庫中的所有案例都轉換成高維數(shù)字向量，通過計算向量之間的距離找出語義上最相似的15個候選案例。第二階段則進行精細篩選：首先按照分析類型做嚴格過濾（比如用戶問的是動力問題，就只保留動力類案例），然后對剩余候選案例按照三個維度打分：案例名稱的相似度占30%的權重，案例類別的相似度占60%的權重，材料類型的相似度占10%的權重，綜合得分最高的那個案例就成為參考模板。經(jīng)過多次試驗，研究團隊確認這套權重分配能讓檢索準確率達到最優(yōu)。

四、實際測試的成績單

研究團隊用50個工程問題對AbaqusAgent進行了全面測試。這50個問題的構成頗為講究：40個來自RAG題庫內部但做了參數(shù)修改（比如把材料換掉、把幾何尺寸改變、把邊界條件調整），另外10個是完全來自題庫之外的新問題。這樣的設計是為了同時考察系統(tǒng)在"見過類似題目"和"從沒見過"兩種情況下的表現(xiàn)。

總體結果是86%的成功率——50道題里，43道成功完成了仿真并得到了正確結果。這個數(shù)字意味著什么？可以參考一下其他同類系統(tǒng)的成績：同樣針對工程仿真的ALL-FEM系統(tǒng)，在39道測試題上的最高成功率是71.79%，而且那還是用了專門微調過的大型語言模型才達到的；MooseAgent系統(tǒng)在9道測試題上達到了93%，但測試規(guī)模小得多；MechAgents系統(tǒng)只成功演示了兩個案例。AbaqusAgent在50個案例這個相對大的測試規(guī)模上實現(xiàn)86%，是一個相當有競爭力的成績。

在題庫內部40道修改題上，系統(tǒng)的案例檢索準確率達到了85%，仿真成功率和結果準確率都是92.5%。對比之下，題庫之外10道全新題目的成功率降到了60%，這個對比直觀說明了題庫的價值：有參考案例時，系統(tǒng)表現(xiàn)明顯更好。

效率上的差異同樣明顯。有題庫參考的成功案例平均消耗28761個token（可以粗略理解為AI處理文字的計量單位）、耗時157秒；沒有題庫參考的成功案例平均消耗48200個token、耗時312秒。有題庫參考的情況下，token消耗降低了約40%，時間縮短了約50%。這意味著題庫不僅提高了準確率，還顯著降低了計算成本。

五、從簡單拉伸到高速沖擊，都能搞定

研究展示了AbaqusAgent在各種復雜程度問題上的表現(xiàn)，最令人印象深刻的是那些高度非線性的動力學問題。

其中一個測試案例模擬的是銅棒高速撞擊剛性墻壁的過程——這是經(jīng)典的泰勒沖擊棒實驗。銅棒以227米每秒的初速度（約等于一顆步槍子彈的速度）撞上固定的剛性壁面，整個過程持續(xù)80微秒。這類問題涉及極大的塑性變形、材料的動態(tài)響應以及顯式動力學求解，屬于有限元分析中難度很高的一類。AbaqusAgent成功生成了正確的軸對稱模型，施加了正確的初始速度和對稱邊界條件，并捕捉到了銅棒棒頭在撞擊后因慣性展開的"蘑菇狀"變形演化過程。

另一個案例是模擬金屬圓棒的頸縮失效——就是拉伸金屬棒時它會在某一位置越來越細直至斷裂的那個過程。這個過程涉及幾何非線性（大變形）和材料非線性（彈塑性），同樣需要大量專業(yè)設置才能正確求解。AbaqusAgent正確打開了大變形選項，定義了彈塑性材料模型，并輸出了位移云圖、應力云圖和等效塑性應變云圖，清晰展示了頸縮區(qū)域的局部化變形。

在幾何多樣性方面，研究展示了針對同一道開孔板拉伸問題，系統(tǒng)能夠處理圓孔、橢圓孔和方孔三種不同幾何形狀。其中圓孔的案例在題庫中有參考，而橢圓孔和方孔是在沒有直接參考的情況下根據(jù)用戶描述生成的，三種情況都成功得到了正確的應力集中分布圖像。

六、各個設計決策的有效性驗證

研究團隊專門做了一套"去掉某個部件看看會怎樣"的對照實驗，用20個測試案例評估了三種不同配置的效果。

當RAG題庫和審查員都正常工作時，案例檢索準確率80%、仿真成功率90%、結果準確率90%，token消耗634690，用時3518秒。當保留審查員但去掉RAG時，系統(tǒng)沒有了參考案例可查，成功率降到80%，同時token消耗暴增至2203778，用時7758秒——成功率降低了，代價卻增加了約3.5倍。當保留RAG但去掉審查員時，成功率從90%驟降到45%——幾乎一半的問題因為第一次生成的代碼有錯誤而無法自我修復。這兩個對比清晰地說明了兩件事：題庫讓系統(tǒng)又快又好，審查員讓系統(tǒng)具備了從錯誤中恢復的能力，兩者缺一不可。

研究還對比了兩種不同大型語言模型作為底層引擎時的表現(xiàn)差異。使用Anthropic公司的Claude Opus 4.6時，仿真成功率90%、結果準確率90%；使用OpenAI的GPT-5.2時，成功率降至65%、準確率降至45%。這個差距在一個具體案例中體現(xiàn)得淋漓盡致：用戶要求模擬一根圓柱形金屬軸受扭轉載荷的情況，Opus 4.6生成的是正確的圓柱體模型，而GPT-5.2生成的是一根方形截面的棱柱體，幾何形狀就已經(jīng)完全錯了，后續(xù)結果自然也無從驗證。這說明底層語言模型對幾何描述的理解能力直接影響了整個系統(tǒng)的可靠性。

此外，提示詞質量對結果的影響也被專門展示出來。針對同一個圓孔板拉伸問題，第一個提示詞只是粗略地描述了問題，沒有說明網(wǎng)格劃分方式，結果系統(tǒng)自動生成的網(wǎng)格在圓孔附近出現(xiàn)了嚴重的幾何失真，孔的形狀都不圓了，應力結果當然也不對。第二個提示詞明確指定了以圓孔為中心的輻射狀結構化網(wǎng)格、每個象限10個徑向分區(qū)和8個周向分區(qū)，結果網(wǎng)格非常精細規(guī)整，應力集中區(qū)域的計算結果也準確得多。這提示用戶，盡管系統(tǒng)大大降低了使用門檻，但對于幾何復雜的問題，越詳細的描述仍然意味著越好的結果。

七、用數(shù)學公式檢驗了答案的準確性

研究團隊還專門選取了一道有精確理論解的經(jīng)典問題，用來驗證AbaqusAgent生成的仿真結果是否在數(shù)值上也是正確的。這道題是簡支矩形薄板在單軸壓縮下的屈曲臨界載荷計算——通俗地說，就是一塊四邊被簡單支撐住的薄板，在面內壓力作用下會在多大載荷時突然彎折失穩(wěn)。

理論公式（基于兩百年前發(fā)展起來的經(jīng)典薄板理論）給出的答案是每毫米寬度承受2.0675牛頓的壓力時薄板會屈曲。AbaqusAgent生成的仿真給出的答案是2.1026牛頓每毫米，兩者之間的誤差僅為1.7%，也就是98.3%的準確率。這個小小的差距完全屬于有限元方法本身因為網(wǎng)格離散化帶來的正常誤差，而不是建模錯誤。這個驗證說明系統(tǒng)不僅能夠跑通仿真，給出的物理結果也是可信的。

說到底，AbaqusAgent這項研究要回答的是這樣一個問題：那些真正有價值的專業(yè)工具，是否可以因為AI的存在而變得人人可及？從測試結果來看，答案是"相當程度上，是的"。86%的成功率、覆蓋五大類固體力學問題、從簡單線彈性到高速沖擊的跨度，已經(jīng)證明這個系統(tǒng)的實用性遠超"演示品"的級別。

對于工程教育來說，這意味著學生可以更快進入"做仿真"的階段，而把更多精力放在理解物理現(xiàn)象本身，而不是花大量時間啃軟件手冊。對于工程實踐來說，這意味著當優(yōu)化算法或材料表征流程需要反復調用仿真時，這類循環(huán)可以更容易地自動化。

當然，研究團隊也坦誠地指出了當前的局限：系統(tǒng)還不支持多物理場耦合仿真（比如同時考慮熱和力的相互影響），也不支持用戶自定義網(wǎng)格導入的場景，這些都是未來要解決的方向。另外，題庫目前只有104個案例，當用戶的問題與題庫中任何案例都差距較大時，成功率會明顯下降，題庫的擴充是提升系統(tǒng)能力最直接的途徑之一。

感興趣的讀者可以通過arXiv:2606.00138這個編號找到完整論文，研究團隊也已將代碼開源，地址是github.com/LIRAM-LIN/AbaqusAgent，有編程基礎的讀者可以直接嘗試。

Q&A

Q1：AbaqusAgent需要用戶自己安裝Abaqus軟件嗎？

A：是的，AbaqusAgent目前只支持本地運行模式，用戶需要在自己的計算機上安裝并擁有合法授權的Abaqus軟件，AbaqusAgent相當于一個操控Abaqus的智能助手，而不是替代Abaqus本身的計算引擎。Abaqus學習版是免費的，但限制模型節(jié)點數(shù)不超過1000個；完整授權版本無節(jié)點數(shù)限制，適合復雜工程仿真。

Q2：AbaqusAgent在沒有找到相似案例時還能正常工作嗎？

A：可以工作，但效果會明顯下降。測試數(shù)據(jù)顯示，題庫內部案例的成功率是92.5%，而題庫之外全新案例的成功率降至60%。沒有參考案例時，系統(tǒng)仍會嘗試從頭生成仿真文件，但消耗的token會增加約40%，耗時也會增加約一倍，而且出錯概率更高，需要審查員進行更多輪次的修正才能成功。

Q3：提示詞寫得越詳細結果越好嗎？

A：對于幾何形狀復雜的問題，是的。研究對比了兩個針對圓孔板的提示詞，詳細指定網(wǎng)格劃分方式的提示詞生成的模型，其網(wǎng)格質量和應力計算結果都明顯優(yōu)于只做粗略描述的版本。不過對于簡單規(guī)則的幾何形體，系統(tǒng)通常能自動做出合理的默認選擇，不一定需要非常詳細的網(wǎng)格說明。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.