![]()
這項由德克薩斯大學阿靈頓分校聯(lián)合倫斯勒理工學院共同完成的研究,以arXiv預印本形式于2026年5月28日發(fā)布,論文編號為arXiv:2606.00138v1,感興趣的讀者可通過該編號檢索完整論文。
有沒有想過,工程師在電腦前對著一堆復雜軟件發(fā)呆的畫面?那種軟件叫做有限元分析軟件,是現(xiàn)代工程設計里不可缺少的"虛擬實驗室"。當一座橋梁還沒有建成,工程師就能用它模擬這座橋在各種壓力下會不會斷裂;當一款手機外殼還在設計階段,工程師就能用它預測摔落時會不會開裂。問題在于,這類軟件極其難以掌握,需要多年的專業(yè)訓練,稍有不慎還可能產(chǎn)生完全錯誤卻看起來沒問題的結果,釀成真實事故。
現(xiàn)在,這項研究帶來了一個新思路:既然大型語言模型(也就是ChatGPT這類AI)已經(jīng)能夠理解人類說話的意思,為什么不讓AI來充當這個"虛擬工程助手",幫普通人甚至經(jīng)驗不足的學生直接操控這套復雜軟件呢?這個系統(tǒng)被稱為AbaqusAgent,其中Abaqus是全球工業(yè)界使用最廣泛的有限元分析軟件之一,而Agent則是"代理人"的意思——它代替你完成所有繁瑣的專業(yè)操作。
一、工程仿真軟件到底難在哪里
要理解這項研究的價值,得先理解那個問題有多棘手。有限元分析,英文縮寫FEA,誕生于上世紀五十年代,是一種把復雜結構切分成無數(shù)小塊、分別計算再拼合的數(shù)值方法。你可以把它理解成這樣:當你想知道一塊不規(guī)則形狀的橡皮泥被捏壓后會如何變形,直接用公式算幾乎不可能,但如果你把橡皮泥切成成千上萬個微小方塊,每個方塊的變形都能用簡單公式算出來,再把所有方塊的結果拼在一起,就能得到整體變形的圖像。這就是有限元的核心思想。
問題在于,要讓這套計算正確運行,使用者必須精確定義一大堆參數(shù):結構的幾何形狀要怎么描述、材料的力學性質是什么、哪些地方固定住不能動(邊界條件)、哪些地方受到了力(載荷條件),以及最后要提取哪些計算結果。任何一個參數(shù)定義錯誤,計算都可能順利完成但結果完全不對——軟件本身不會告訴你物理上是否合理,只會按照你給的參數(shù)算出答案。就像你拜托一個非常勤快但不思考的助手幫你烤蛋糕,你如果把糖的用量寫錯了,他會嚴格按照錯誤配方烤出一個根本不能吃的成品,還信心滿滿地遞給你。
正因為如此,有限元分析在全球工程教育和工業(yè)應用中都面臨著巨大的"入門門檻"。這項研究指出,在真實工程問題中運用有限元分析,通常需要多年的實際工作經(jīng)驗積累。
二、AbaqusAgent是怎么工作的
研究團隊設計AbaqusAgent的方式,就像打造一個由六名不同專長成員組成的工作小組,每個成員負責整個流程中的一個環(huán)節(jié),彼此配合完成從"用戶說了什么"到"仿真結果呈現(xiàn)在屏幕上"的全過程。
這個小組的第一位成員叫做"解讀員"(Interpreter Agent)。當用戶用自然語言描述自己的工程問題時,解讀員的任務是檢查這段描述是否完整。它會核查五個關鍵要素是否都提到了:幾何形狀的描述、材料的力學性質、邊界條件(哪里固定)、加載條件(施加什么力),以及需要提取什么結果。如果有遺漏,它會提示用戶補充,而不是自己腦補一個可能出錯的假設。同時,它還會把用戶的原始描述重新改寫成更規(guī)范的工程語言,方便后續(xù)成員處理。
第二位成員是"架構師"(Architect Agent)。它的任務是從一個預先建好的案例庫里,找到與用戶當前問題最相似的參考案例。這個案例庫就像一個包含了104個經(jīng)典工程題目的"題庫",每道題都有詳細的問題描述和對應的Abaqus輸入文件。架構師通過一套精密的搜索算法,在這個題庫里找到最合適的參考,作為后續(xù)生成文件的模板。
第三位成員是"代碼生成員"(Input Writer Agent)。Abaqus軟件的核心是一個后綴名為.inp的輸入文件,這個文件用特定的關鍵詞語法描述了整個仿真模型——節(jié)點坐標、單元連接關系、材料參數(shù)、邊界條件、載荷、輸出請求,一行都不能少,格式必須精確。代碼生成員的任務就是以架構師找到的參考案例為語法模板,以用戶的實際需求為物理內容,生成這個完整的輸入文件。
第四位成員是"執(zhí)行員"(Runner Agent)。它把生成的輸入文件提交給Abaqus求解器運行,等待計算完成后收集結果文件,包括那個包含了所有應力、應變、位移數(shù)據(jù)的.odb結果文件。
如果計算失敗了怎么辦?這時候第五位成員"審查員"(Reviewer Agent)就登場了。Abaqus在運行失敗時會生成錯誤日志文件,審查員會仔細分析這些錯誤信息,判斷是哪里出了問題,并提出修改建議,再把任務交回給代碼生成員重新生成修正后的輸入文件,重新提交運行。這個循環(huán)可以最多進行十五次,大多數(shù)問題在這個過程中都能被逐步修正解決。
第六位成員是"可視化員"(Visualization Agent)。當計算成功后,它會自動提取變形數(shù)據(jù)和應力云圖,生成直觀的圖片和數(shù)據(jù)文件,讓用戶能直接看到仿真結果。
這六位成員協(xié)同工作的整個流程,從用戶輸入一段自然語言描述開始,到屏幕上出現(xiàn)彩色的仿真云圖結束,完全不需要用戶具備任何Abaqus的專業(yè)知識。
三、那個"題庫"是怎么建成的
AbaqusAgent里這個叫做RAG(檢索增強生成)的案例庫,是整個系統(tǒng)最關鍵也最費心思的部分之一。RAG是"Retrieval-Augmented Generation"的縮寫,通俗地說就是"先查資料再回答",而不是讓AI憑空想象一個答案。
為什么這個題庫這么重要?因為Abaqus是商業(yè)軟件,它的官方案例和代碼并不像開源軟件那樣在網(wǎng)上唾手可得。研究團隊花費了大量精力,從Abaqus官方基準手冊中整理了71個經(jīng)典案例,再自行開發(fā)了33個教材風格的習題,合計104個案例構成了整個知識庫。每個案例都包含三層信息:案例的基本標簽(名稱、分析類型、結構類別、材料類型),自然語言的問題描述,以及完整可運行的Abaqus輸入文件。
這104個案例覆蓋了固體力學的五大類問題。靜力分析有35個案例,是基礎中的基礎,研究結構在穩(wěn)定載荷下的變形和應力。動力分析有26個案例,涉及時間相關的運動和沖擊問題。非線性材料有19個案例,包括金屬塑性變形、接觸摩擦、斷裂等復雜行為。結構屈曲有14個案例,研究細長結構在壓力下突然失穩(wěn)的現(xiàn)象,就像用力按壓一根細長的木棍時它會突然彎折。復合材料與層合板有10個案例,針對碳纖維增強復合材料這類各方向性質不同的特殊材料。
在搜索算法上,研究團隊設計了一套兩階段的混合檢索策略。第一階段使用Facebook開發(fā)的FAISS向量搜索庫,把用戶的問題描述和題庫中的所有案例都轉換成高維數(shù)字向量,通過計算向量之間的距離找出語義上最相似的15個候選案例。第二階段則進行精細篩選:首先按照分析類型做嚴格過濾(比如用戶問的是動力問題,就只保留動力類案例),然后對剩余候選案例按照三個維度打分:案例名稱的相似度占30%的權重,案例類別的相似度占60%的權重,材料類型的相似度占10%的權重,綜合得分最高的那個案例就成為參考模板。經(jīng)過多次試驗,研究團隊確認這套權重分配能讓檢索準確率達到最優(yōu)。
四、實際測試的成績單
研究團隊用50個工程問題對AbaqusAgent進行了全面測試。這50個問題的構成頗為講究:40個來自RAG題庫內部但做了參數(shù)修改(比如把材料換掉、把幾何尺寸改變、把邊界條件調整),另外10個是完全來自題庫之外的新問題。這樣的設計是為了同時考察系統(tǒng)在"見過類似題目"和"從沒見過"兩種情況下的表現(xiàn)。
總體結果是86%的成功率——50道題里,43道成功完成了仿真并得到了正確結果。這個數(shù)字意味著什么?可以參考一下其他同類系統(tǒng)的成績:同樣針對工程仿真的ALL-FEM系統(tǒng),在39道測試題上的最高成功率是71.79%,而且那還是用了專門微調過的大型語言模型才達到的;MooseAgent系統(tǒng)在9道測試題上達到了93%,但測試規(guī)模小得多;MechAgents系統(tǒng)只成功演示了兩個案例。AbaqusAgent在50個案例這個相對大的測試規(guī)模上實現(xiàn)86%,是一個相當有競爭力的成績。
在題庫內部40道修改題上,系統(tǒng)的案例檢索準確率達到了85%,仿真成功率和結果準確率都是92.5%。對比之下,題庫之外10道全新題目的成功率降到了60%,這個對比直觀說明了題庫的價值:有參考案例時,系統(tǒng)表現(xiàn)明顯更好。
效率上的差異同樣明顯。有題庫參考的成功案例平均消耗28761個token(可以粗略理解為AI處理文字的計量單位)、耗時157秒;沒有題庫參考的成功案例平均消耗48200個token、耗時312秒。有題庫參考的情況下,token消耗降低了約40%,時間縮短了約50%。這意味著題庫不僅提高了準確率,還顯著降低了計算成本。
五、從簡單拉伸到高速沖擊,都能搞定
研究展示了AbaqusAgent在各種復雜程度問題上的表現(xiàn),最令人印象深刻的是那些高度非線性的動力學問題。
其中一個測試案例模擬的是銅棒高速撞擊剛性墻壁的過程——這是經(jīng)典的泰勒沖擊棒實驗。銅棒以227米每秒的初速度(約等于一顆步槍子彈的速度)撞上固定的剛性壁面,整個過程持續(xù)80微秒。這類問題涉及極大的塑性變形、材料的動態(tài)響應以及顯式動力學求解,屬于有限元分析中難度很高的一類。AbaqusAgent成功生成了正確的軸對稱模型,施加了正確的初始速度和對稱邊界條件,并捕捉到了銅棒棒頭在撞擊后因慣性展開的"蘑菇狀"變形演化過程。
另一個案例是模擬金屬圓棒的頸縮失效——就是拉伸金屬棒時它會在某一位置越來越細直至斷裂的那個過程。這個過程涉及幾何非線性(大變形)和材料非線性(彈塑性),同樣需要大量專業(yè)設置才能正確求解。AbaqusAgent正確打開了大變形選項,定義了彈塑性材料模型,并輸出了位移云圖、應力云圖和等效塑性應變云圖,清晰展示了頸縮區(qū)域的局部化變形。
在幾何多樣性方面,研究展示了針對同一道開孔板拉伸問題,系統(tǒng)能夠處理圓孔、橢圓孔和方孔三種不同幾何形狀。其中圓孔的案例在題庫中有參考,而橢圓孔和方孔是在沒有直接參考的情況下根據(jù)用戶描述生成的,三種情況都成功得到了正確的應力集中分布圖像。
六、各個設計決策的有效性驗證
研究團隊專門做了一套"去掉某個部件看看會怎樣"的對照實驗,用20個測試案例評估了三種不同配置的效果。
當RAG題庫和審查員都正常工作時,案例檢索準確率80%、仿真成功率90%、結果準確率90%,token消耗634690,用時3518秒。當保留審查員但去掉RAG時,系統(tǒng)沒有了參考案例可查,成功率降到80%,同時token消耗暴增至2203778,用時7758秒——成功率降低了,代價卻增加了約3.5倍。當保留RAG但去掉審查員時,成功率從90%驟降到45%——幾乎一半的問題因為第一次生成的代碼有錯誤而無法自我修復。這兩個對比清晰地說明了兩件事:題庫讓系統(tǒng)又快又好,審查員讓系統(tǒng)具備了從錯誤中恢復的能力,兩者缺一不可。
研究還對比了兩種不同大型語言模型作為底層引擎時的表現(xiàn)差異。使用Anthropic公司的Claude Opus 4.6時,仿真成功率90%、結果準確率90%;使用OpenAI的GPT-5.2時,成功率降至65%、準確率降至45%。這個差距在一個具體案例中體現(xiàn)得淋漓盡致:用戶要求模擬一根圓柱形金屬軸受扭轉載荷的情況,Opus 4.6生成的是正確的圓柱體模型,而GPT-5.2生成的是一根方形截面的棱柱體,幾何形狀就已經(jīng)完全錯了,后續(xù)結果自然也無從驗證。這說明底層語言模型對幾何描述的理解能力直接影響了整個系統(tǒng)的可靠性。
此外,提示詞質量對結果的影響也被專門展示出來。針對同一個圓孔板拉伸問題,第一個提示詞只是粗略地描述了問題,沒有說明網(wǎng)格劃分方式,結果系統(tǒng)自動生成的網(wǎng)格在圓孔附近出現(xiàn)了嚴重的幾何失真,孔的形狀都不圓了,應力結果當然也不對。第二個提示詞明確指定了以圓孔為中心的輻射狀結構化網(wǎng)格、每個象限10個徑向分區(qū)和8個周向分區(qū),結果網(wǎng)格非常精細規(guī)整,應力集中區(qū)域的計算結果也準確得多。這提示用戶,盡管系統(tǒng)大大降低了使用門檻,但對于幾何復雜的問題,越詳細的描述仍然意味著越好的結果。
七、用數(shù)學公式檢驗了答案的準確性
研究團隊還專門選取了一道有精確理論解的經(jīng)典問題,用來驗證AbaqusAgent生成的仿真結果是否在數(shù)值上也是正確的。這道題是簡支矩形薄板在單軸壓縮下的屈曲臨界載荷計算——通俗地說,就是一塊四邊被簡單支撐住的薄板,在面內壓力作用下會在多大載荷時突然彎折失穩(wěn)。
理論公式(基于兩百年前發(fā)展起來的經(jīng)典薄板理論)給出的答案是每毫米寬度承受2.0675牛頓的壓力時薄板會屈曲。AbaqusAgent生成的仿真給出的答案是2.1026牛頓每毫米,兩者之間的誤差僅為1.7%,也就是98.3%的準確率。這個小小的差距完全屬于有限元方法本身因為網(wǎng)格離散化帶來的正常誤差,而不是建模錯誤。這個驗證說明系統(tǒng)不僅能夠跑通仿真,給出的物理結果也是可信的。
說到底,AbaqusAgent這項研究要回答的是這樣一個問題:那些真正有價值的專業(yè)工具,是否可以因為AI的存在而變得人人可及?從測試結果來看,答案是"相當程度上,是的"。86%的成功率、覆蓋五大類固體力學問題、從簡單線彈性到高速沖擊的跨度,已經(jīng)證明這個系統(tǒng)的實用性遠超"演示品"的級別。
對于工程教育來說,這意味著學生可以更快進入"做仿真"的階段,而把更多精力放在理解物理現(xiàn)象本身,而不是花大量時間啃軟件手冊。對于工程實踐來說,這意味著當優(yōu)化算法或材料表征流程需要反復調用仿真時,這類循環(huán)可以更容易地自動化。
當然,研究團隊也坦誠地指出了當前的局限:系統(tǒng)還不支持多物理場耦合仿真(比如同時考慮熱和力的相互影響),也不支持用戶自定義網(wǎng)格導入的場景,這些都是未來要解決的方向。另外,題庫目前只有104個案例,當用戶的問題與題庫中任何案例都差距較大時,成功率會明顯下降,題庫的擴充是提升系統(tǒng)能力最直接的途徑之一。
感興趣的讀者可以通過arXiv:2606.00138這個編號找到完整論文,研究團隊也已將代碼開源,地址是github.com/LIRAM-LIN/AbaqusAgent,有編程基礎的讀者可以直接嘗試。
Q&A
Q1:AbaqusAgent需要用戶自己安裝Abaqus軟件嗎?
A:是的,AbaqusAgent目前只支持本地運行模式,用戶需要在自己的計算機上安裝并擁有合法授權的Abaqus軟件,AbaqusAgent相當于一個操控Abaqus的智能助手,而不是替代Abaqus本身的計算引擎。Abaqus學習版是免費的,但限制模型節(jié)點數(shù)不超過1000個;完整授權版本無節(jié)點數(shù)限制,適合復雜工程仿真。
Q2:AbaqusAgent在沒有找到相似案例時還能正常工作嗎?
A:可以工作,但效果會明顯下降。測試數(shù)據(jù)顯示,題庫內部案例的成功率是92.5%,而題庫之外全新案例的成功率降至60%。沒有參考案例時,系統(tǒng)仍會嘗試從頭生成仿真文件,但消耗的token會增加約40%,耗時也會增加約一倍,而且出錯概率更高,需要審查員進行更多輪次的修正才能成功。
Q3:提示詞寫得越詳細結果越好嗎?
A:對于幾何形狀復雜的問題,是的。研究對比了兩個針對圓孔板的提示詞,詳細指定網(wǎng)格劃分方式的提示詞生成的模型,其網(wǎng)格質量和應力計算結果都明顯優(yōu)于只做粗略描述的版本。不過對于簡單規(guī)則的幾何形體,系統(tǒng)通常能自動做出合理的默認選擇,不一定需要非常詳細的網(wǎng)格說明。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.