網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

美軍推進(jìn)大語言模型軍事化應(yīng)用研究：作戰(zhàn)能力提升與現(xiàn)實(shí)困境

2025-11-25 09:53:30　來源: 藍(lán)德智庫

北京舉報(bào)

分享至

美國軍方正積極推進(jìn)大語言模型(Large Language Model，LLM)的軍事化應(yīng)用，核心戰(zhàn)略目標(biāo)是獲取“決策優(yōu)勢(shì)”。在現(xiàn)代沖突中，美軍期望比對(duì)手更快、更準(zhǔn)確地處理海量信息、生成預(yù)測(cè)模型并輔助決策。這種對(duì)“機(jī)器速度”決策的追求，預(yù)示著未來作戰(zhàn)將從以人為中心向人工智能輔助甚至人工智能驅(qū)動(dòng)的節(jié)奏轉(zhuǎn)變，其中速度成為關(guān)鍵因素。美國國防部(Department of Defense，DoD)將人工智能(Artificial Intelligence，AI)視為在數(shù)字化競爭世界中保持軍事優(yōu)勢(shì)的關(guān)鍵要素，尤其在應(yīng)對(duì)大力投資人工智能的對(duì)手時(shí)。國防部的人工智能戰(zhàn)略強(qiáng)調(diào)以合法、負(fù)責(zé)任和可問責(zé)的方式利用人工智能，使其符合國家價(jià)值觀和戰(zhàn)爭法。

1.ScaleAI：軍事大語言模型發(fā)展的基石伙伴

Scale AI自2016年成立以來，一直致力于構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的人工智能基礎(chǔ)設(shè)施，并迅速將技術(shù)優(yōu)勢(shì)擴(kuò)展到美國國防與情報(bào)領(lǐng)域。該公司與美國國防數(shù)字和人工智能辦公室(Chief Digital and Artificial Intelligence Office,CDAO)簽署了其他交易協(xié)議(Other Transaction Agreement,OTA)，為聯(lián)合部隊(duì)提供數(shù)據(jù)策劃和標(biāo)注服務(wù)，助力AI原型從實(shí)驗(yàn)室邁向前線部署。在安全與可控性方面，Scale AI組建了“安全、評(píng)估與對(duì)齊實(shí)驗(yàn)室”(SEAL)，匯聚紅隊(duì)攻防和強(qiáng)化學(xué)習(xí)人類反饋(Reinforcement Learning from Human Feedback,RLHF)專家，對(duì)大型語言模型進(jìn)行系統(tǒng)級(jí)測(cè)試和威脅評(píng)估，確保模型在極端環(huán)境下的穩(wěn)定性和可控性。

在此背景下，多諾萬平臺(tái)(Donovan)應(yīng)運(yùn)而生，成為Scale AI面向政府與軍工客戶推出的端到端AI代理管理與部署解決方案。Donovan具備大規(guī)模文檔攝取和實(shí)時(shí)情報(bào)分析能力，可在數(shù)分鐘內(nèi)處理超過10萬頁的命令、態(tài)勢(shì)報(bào)告和開源數(shù)據(jù)，并通過RLHF流水線持續(xù)微調(diào)模型以滿足作戰(zhàn)需求。平臺(tái)內(nèi)置紅隊(duì)工具和定制化評(píng)估基準(zhǔn)，確保所部署的代理在復(fù)雜戰(zhàn)術(shù)場景中既能提供準(zhǔn)確見解，又能遵循國際人道法和國家情報(bào)總監(jiān)辦公室(Office of the Director of National Intelligence，ODNI)的寫作規(guī)范。Donovan已成為首批能夠在分類網(wǎng)絡(luò)上運(yùn)行的大型語言模型基礎(chǔ)設(shè)施之一，支持聯(lián)合作戰(zhàn)計(jì)劃、后勤保障和兵棋推演等關(guān)鍵用例，大幅縮短了“從數(shù)據(jù)到行動(dòng)”的反饋周期。

在Donovan生態(tài)內(nèi)，Defense Llama大語言模型代表了Scale AI與Meta(前Facebook)開源Llama 3模型合作的最新成果。該模型通過Scale的Data Engine進(jìn)行精細(xì)微調(diào)，訓(xùn)練數(shù)據(jù)囊括軍事條令、國際人道法和國防部AI倫理原則，使其能夠在戰(zhàn)術(shù)規(guī)劃、目標(biāo)分析和態(tài)勢(shì)感知等場景中給出符合專業(yè)規(guī)范的響應(yīng)。Defense Llama僅限于在政府專用的、安全受控的系統(tǒng)內(nèi)部署，且始終保持“人類監(jiān)督”機(jī)制，并可與Donovan平臺(tái)無縫銜接，能夠作為智能代理為指揮官提供多域作戰(zhàn)建議和替代行動(dòng)方案評(píng)估。

2.“雷神之錘”項(xiàng)目：整合人工智能以支持作戰(zhàn)規(guī)劃

“雷神之錘”(Thunderforge)是美國國防創(chuàng)新小組(Defense Innovation Unit,DIU)的一項(xiàng)旗艦計(jì)劃，其目的是將人工智能深度整合到軍事作戰(zhàn)和戰(zhàn)區(qū)級(jí)規(guī)劃中，并與先進(jìn)的建模和仿真工具相結(jié)合。該系統(tǒng)的目標(biāo)是加速?zèng)Q策，使規(guī)劃人員能夠快速綜合海量信息，生成多種行動(dòng)方案，并進(jìn)行人工智能驅(qū)動(dòng)的兵棋推演，以預(yù)測(cè)和應(yīng)對(duì)不斷演變的威脅。DIU領(lǐng)導(dǎo)層指出，當(dāng)前的規(guī)劃方法已過時(shí)，無法適應(yīng)現(xiàn)代戰(zhàn)爭的激烈敏捷性和現(xiàn)代化設(shè)備?！袄咨裰N”標(biāo)志著向人工智能驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)戰(zhàn)爭的決定性轉(zhuǎn)變。

“雷神之錘”技術(shù)解決方案將提供人工智能輔助的規(guī)劃能力、決策支持工具和自動(dòng)化工作流程。它利用先進(jìn)的大型語言模型、人工智能驅(qū)動(dòng)的模擬和交互式基于代理的兵棋推演，以增強(qiáng)美國軍方準(zhǔn)備和執(zhí)行作戰(zhàn)的能力。該系統(tǒng)最初將部署到美國印太司令部(United States Indo-Pacific Command,INDOPACOM)和美國歐洲司令部(United States European Command,EUCOM)，以支持關(guān)鍵的規(guī)劃活動(dòng)，包括戰(zhàn)役發(fā)展、全戰(zhàn)區(qū)資源分配和戰(zhàn)略評(píng)估。其跨多個(gè)安全領(lǐng)域的整合確保了人工智能驅(qū)動(dòng)的規(guī)劃能力將安全地嵌入到實(shí)際軍事行動(dòng)中。

“雷神之錘”是一項(xiàng)多方合作的努力，涉及Scale AI(提供代理應(yīng)用、生成式人工智能測(cè)試和評(píng)估專業(yè)知識(shí))、Anduril(提供Lattice建模/仿真軟件平臺(tái))和微軟(提供最先進(jìn)的大型語言模型技術(shù))。該團(tuán)隊(duì)的目標(biāo)是提供一個(gè)統(tǒng)一的規(guī)劃生態(tài)系統(tǒng)，其中人工智能代理可以模擬兵棋推演和規(guī)劃場景，并完善提議的行動(dòng)方案。

微軟作為“雷神之錘”項(xiàng)目的重要技術(shù)伙伴，其提供的大型語言模型技術(shù)是構(gòu)建這一先進(jìn)規(guī)劃生態(tài)系統(tǒng)的核心組成部分。此外，其他公司如Systematic也在國防人工智能項(xiàng)目中探索利用大語言模型，執(zhí)行文檔摘要、翻譯和軍事文檔解釋等任務(wù)，并研究“大語言模型作為評(píng)判者”(LLM-as-a-judge)的技術(shù)，以自動(dòng)化評(píng)估模型表現(xiàn)，確保為國防客戶提供高質(zhì)量的AI產(chǎn)品。

3.戰(zhàn)場環(huán)境下軍事大語言模型的可靠性與安全風(fēng)險(xiǎn)考量

軍事大語言模型在決策支持和情報(bào)分析中雖展現(xiàn)出明顯優(yōu)勢(shì)，但其內(nèi)在缺陷和潛在威脅在實(shí)戰(zhàn)環(huán)境中尤為突出。模型的“幻覺”問題會(huì)導(dǎo)致其在關(guān)鍵戰(zhàn)術(shù)或后勤規(guī)劃中產(chǎn)生不準(zhǔn)確甚至完全錯(cuò)誤的輸出，若憑此做出作戰(zhàn)或資源分配決策，將嚴(yán)重影響部隊(duì)效能和安全。提示注入攻擊能夠繞過現(xiàn)有的安全檢查，誘使模型暴露機(jī)密信息或執(zhí)行惡意指令，一旦發(fā)生機(jī)密泄露或錯(cuò)誤指令下發(fā)，將對(duì)軍事行動(dòng)造成直接威脅。此外，用于模型微調(diào)的敏感軍用數(shù)據(jù)若管理不當(dāng)，既可能侵犯第三方知識(shí)產(chǎn)權(quán)，也會(huì)在訓(xùn)練管道中留下安全漏洞，為對(duì)手提供反向工程和情報(bào)竊取的機(jī)會(huì)。

更為嚴(yán)重的是，大語言模型的決策過程高度依賴“黑箱”算法，缺乏透明度和可解釋性。一旦在行動(dòng)中出現(xiàn)誤判或失誤，難以迅速追蹤問題根源，也難以界定是算法偏差、數(shù)據(jù)質(zhì)量不佳還是人類監(jiān)督不到位所致，從而使責(zé)任歸屬和問責(zé)機(jī)制形同虛設(shè)。Meta雖對(duì)外宣稱禁止將Llama用于軍事活動(dòng)，卻在內(nèi)部為國防承包商和情報(bào)機(jī)構(gòu)開辟例外，使得合規(guī)政策形同擺設(shè)，也為其他國家或非國家行為體復(fù)制使用模式提供了便利，進(jìn)一步增加了技術(shù)擴(kuò)散和濫用的風(fēng)險(xiǎn)。綜上所述，除非在嚴(yán)格的安全加固、持續(xù)的人機(jī)協(xié)同監(jiān)督以及透明的審計(jì)與問責(zé)框架下，否則將大語言模型直接投入戰(zhàn)時(shí)決策支持，難以在高度敏感的國防場景中保證可靠性與合規(guī)性。

4.結(jié)論與未來方向

美軍正加速推進(jìn)大語言模型(LLM)的軍事化應(yīng)用，核心目標(biāo)是奪取“決策優(yōu)勢(shì)”。LLM憑借其“機(jī)器速度”的信息分析能力，大幅縮短“從數(shù)據(jù)到行動(dòng)”的反饋周期，使指揮官能迅速掌握戰(zhàn)場態(tài)勢(shì)并生成精準(zhǔn)預(yù)測(cè)，從而搶占先機(jī)。大語言模型還能與建模仿真技術(shù)的深度融合，為作戰(zhàn)規(guī)劃與兵棋推演提供強(qiáng)大支持，實(shí)現(xiàn)高效地方案生成與威脅模擬，從而指揮官提供關(guān)鍵參考，顯著提升決策制定的效率與速度。

在短期研究與應(yīng)用中，為應(yīng)對(duì)當(dāng)前軍事AI的固有挑戰(zhàn)，美軍將著重提升LLM在魯棒性、安全性與可控性方面的表現(xiàn)。其中包括構(gòu)建嚴(yán)密的測(cè)試驗(yàn)證體系、強(qiáng)化數(shù)據(jù)治理與網(wǎng)絡(luò)防護(hù)，以及貫徹“有意義的人類主控(Meaningful Human Control, MHC)”原則。這些舉措將確保LLM能無縫嵌入現(xiàn)有指揮控制系統(tǒng)，并在關(guān)鍵時(shí)刻由人工暫?；蚣m偏，從而有效抵御“幻覺”誤導(dǎo)、提示注入攻擊和敏感信息泄露，進(jìn)而構(gòu)建高效的人機(jī)協(xié)同操作流程。

從更長遠(yuǎn)的視角看，LLM將深度融入陸、海、空及盟軍聯(lián)合作戰(zhàn)的全流程。在未來戰(zhàn)爭中，LLM不僅具備強(qiáng)大的信息分析與規(guī)劃輔助能力，還有望通過自主學(xué)習(xí)和推理，實(shí)現(xiàn)復(fù)雜環(huán)境下的自適應(yīng)決策與資源優(yōu)化，動(dòng)態(tài)調(diào)整戰(zhàn)術(shù)部署與優(yōu)化后勤鏈路，甚至在網(wǎng)絡(luò)空間中執(zhí)行高階威脅識(shí)別與響應(yīng)。這種深度融合將為指揮官提供前所未有的戰(zhàn)場全局洞察與未來行動(dòng)預(yù)判能力。然而，這種能力擴(kuò)展亦伴隨深層次挑戰(zhàn)，即LLM如何在電磁對(duì)抗和網(wǎng)絡(luò)攻防等嚴(yán)苛環(huán)境中持續(xù)保持其可靠可控性，以及實(shí)現(xiàn)全生命周期的高度透明與責(zé)任可溯。(北京藍(lán)德信息科技有限公司)

參考文獻(xiàn)

Leadership: Artificial Intelligence in Decision-Making | Article | The United States Army, https://www.army.mil/article/286847/leadership_artificial_intelligence_in_decision_making Innovating Defense: Generative AI's Role in Military Evolution ..., https://www.army.mil/article/286707/innovating_defense_generative_ais_role_in_military_evolution The Pentagon is upping its bet on AI. Here's what it means for the military - QZ.com, https://qz.com/pentagon-scale-ai-us-military-china-1851767958

Research Shows Risk in Using LLMs for Military Decision-Making - Techstrong.ai, https://techstrong.ai/articles/research-shows-risk-in-using-llms-for-military-decision-making/us department of defense responsible artificial intelligence strategy ..., https://www.ai.mil/Portals/137/Documents/Resources%20Page/DoD%20Responsible%20AI%20Strategy%20and%20Implementation%20Pathway.pdf

How to Scale AI in Your Business - Oracle, https://www.oracle.com/artificial-intelligence/scale-ai-in-business/

Scale AI: Accelerate the Development of AI Applications, https://scale.com/

Scale AI - Wikipedia, https://en.wikipedia.org/wiki/Scale_AI

Donovan: Empowering the Public Sector with AI Agents | Scale AI, https://scale.com/donovan Scale AI launches Defense Llama - Intelligence Community News, https://intelligencecommunitynews.com/scale-ai-launches-defense-llama/Ethical Principles for Artificial Intelligence, https://www.edinstudy.law.ed.ac.uk/wpcontent/uploads/sites/38/2021/11/US-Ethical-Principles-for-Artificial-Intelligence.pdf

Large Language Models for System Security Engineering Analysis - Army SBIR, https://armysbir.army.mil/topics/large-language-models-system-security-engineering-analysis/Thunderforge Project: Integrating Commercial AI-Powered Decision ..., https://www.diu.mil/latest/dius-thunderforge-project-to-integrate-commercial-ai-powered-decision-making Scale AI awarded Defense Innovation Unit (DIU) Thunderforge contract - OrangeSlices AI, https://orangeslices.ai/introducing-thunderforge-ai-for-american-defense/Transcending weapon systems: the ethical challenges of AI in military decision support systems - Blogs | International Committee of the Red Cross, https://blogs.icrc.org/law-and-policy/2024/09/24/transcending-weapon-systems-the-ethical-challenges-of-ai-in-military-decision-support-systems/Meet Thunderforge—DOD's Latest AI Play - GovCon Wire, https://www.govconwire.com/article/thunderforge-dod-scale-ai-prime-prototype-contract On Large Language Models in National Security Applications (2407.03453v1) - Emergent Mind, https://www.emergentmind.com/articles/2407.03453 CDAO Sponsors Crowdsourced AI Assurance Pilot in the Context of Military Medicine, https://www.defense.gov/News/Releases/Release/Article/4020407/cdao-sponsors-crowdsourced-ai-assurance-pilot-in-the-context-of-military-medici/Rules of Engagement as a Regulatory Framework for Military Artificial Intelligence, https://lieber.westpoint.edu/rules-engagement-regulatory-framework-military-artificial-intelligence/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.