![]()
智東西
作者 佳揚(yáng)
編輯 云鵬
智東西4月9日消息,今日MiniMax稀宇科技發(fā)布MMX-CLI,這是一款面向AI Agent的命令行工具。
官方稱,MMX-CLI支持在Claude Code、OpenClaw等環(huán)境中原生調(diào)用其全模態(tài)模型,涵蓋編程、視頻生成、語音合成和音樂創(chuàng)作等功能,無需額外編寫MCP Server或適配復(fù)雜接口。僅需兩行代碼,即可完成MMX-CLI的安裝和調(diào)用。
MMX-CLI提供全面的多模態(tài)能力,包括多回合文本對話和流媒體輸出、可調(diào)整尺寸和批量生成的圖像、支持異步處理和進(jìn)度跟蹤的視頻生成、多語音文本轉(zhuǎn)語音和流媒體播放、帶歌詞的音樂創(chuàng)作,以及圖像理解和描述功能,幫助AI Agent高效完成創(chuàng)作和分析任務(wù)。
目前,MMX-CLI需要購買Token plan才能使用。Token Plan價(jià)格根據(jù)不同的套餐和使用量而有所不同。官方提供了多檔訂閱方案,用戶可以按月或按年支付,每個(gè)套餐對應(yīng)不同的Token額度和調(diào)用上限。其中標(biāo)準(zhǔn)版Starter套餐每月29元,Plus套餐每月49元,Max套餐每月119元;極速版Plus-極速版每月98元,Max-極速版每月199元,Ultra-極速版每月899元。
![]()
▲Token plan
一、兩行命令完成安裝和調(diào)用
MMX-CLI將MiniMax的多模態(tài)能力通過統(tǒng)一命令行接口開放給Agent,涵蓋文本、圖像、視頻、語音、音樂等核心能力。
·文本處理:支持多回合對話、流式輸出、系統(tǒng)提示詞和JSON格式,使Agent可直接解析和調(diào)用生成內(nèi)容。
·圖像生成:文本轉(zhuǎn)圖像功能支持寬高比調(diào)整和批量生成。
·視頻生成:提供異步處理和進(jìn)度跟蹤。
·語音合成:多語音文本轉(zhuǎn)語音和流媒體播放能力,擁有30多種音色。
·音樂創(chuàng)作:基于文本生成音樂,可自定義歌詞,實(shí)現(xiàn)自動(dòng)化音樂制作與內(nèi)容豐富化。
·圖片理解:圖像描述與識別。
![]()
▲主要功能
官方稱,Agent可通過兩行命令完成安裝和調(diào)用,實(shí)現(xiàn)從文案生成到圖像、語音和視頻輸出的完整自動(dòng)化工作流,大幅提升多模態(tài)任務(wù)效率。
![]()
▲官方安裝代碼
![]()
▲官方文本、圖片、音頻生成代碼
二、針對Agent的專門優(yōu)化
傳統(tǒng)命令行工具主要面向人工用戶,直接讓AI Agent使用往往會(huì)遇到問題,例如輸出信息夾雜干擾內(nèi)容、錯(cuò)誤信息需要人工閱讀判斷、參數(shù)缺失會(huì)導(dǎo)致任務(wù)停滯,以及長時(shí)間運(yùn)行的任務(wù)無法高效管理等。
對此,MMX-CLI針對Agent在非交互式環(huán)境下的使用特點(diǎn)進(jìn)行了底層優(yōu)化:
·純數(shù)據(jù)輸出與隔離:stdout僅輸出文件路徑或JSON數(shù)據(jù),進(jìn)度條和狀態(tài)提示被劃歸stderr,保證Agent解析結(jié)果干凈準(zhǔn)確。
·語義化狀態(tài)碼:不同錯(cuò)誤類型對應(yīng)獨(dú)立Exit Code,Agent無需解析文本即可判斷失敗原因并決定是否重試,包括鑒權(quán)、參數(shù)缺失、超時(shí)和網(wǎng)絡(luò)異常。
·異步與非阻塞設(shè)計(jì):任務(wù)參數(shù)缺失時(shí)直接退出,長耗時(shí)任務(wù)可通過提交后臺執(zhí)行,使Agent能并行處理多個(gè)任務(wù)。
·無縫接入Token Plan:每次生成可直接計(jì)入訂閱配額,方便使用和管理,同時(shí)避免額外付費(fèi)或復(fù)雜授權(quán)流程。
MiniMax官方提供了完整文檔和源碼,開發(fā)者和企業(yè)可在GitHub獲取。
完整文檔與源碼:github.com/MiniMax-AI/cliToken Plan
訂閱:platform.minimaxi.com/subscribe/token-plan
結(jié)語:MiniMax全模態(tài)能力的拓展
MMX-CLI的推出為開發(fā)者提供了一個(gè)輕量入口,讓MiniMax的全模態(tài)能力更容易嵌入現(xiàn)有AI Agent工具鏈中。對于終端重度用戶和需要快速調(diào)用圖像、視頻、語音的場景,它簡化了流程。
目前工具仍處于早期階段,功能覆蓋全面但缺乏大規(guī)模公開性能數(shù)據(jù)。未來隨著迭代,其在Agent生態(tài)中的實(shí)用性值得持續(xù)觀察。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.