今日,國(guó)外社交媒體上,有用戶吐槽國(guó)產(chǎn)模型minimax的表現(xiàn)十分令人失望,甚至可以用垃圾來(lái)形容。
![]()
該用戶表示:玩過(guò)openclaw的都知道m(xù)inimax有多垃圾。
在評(píng)論區(qū),引發(fā)了諸多網(wǎng)友對(duì)此的共鳴。有網(wǎng)友表示:MiniMax像是精神分裂,胡思亂想,胡說(shuō)八道,它把代碼看了,給出的答案都是似是而非。總之問(wèn)完再問(wèn),都不能解決問(wèn)題。這個(gè)可以說(shuō)是中國(guó)AI model最垃圾的一個(gè)。
通過(guò)整理網(wǎng)絡(luò)資料也不難發(fā)現(xiàn),很多用戶在使用MiniMax的確都存在著諸多類似的困惑。
首先,最常被提到的是“幻覺(jué)問(wèn)題”,也就是俗稱的“瞎編”。不少用戶反映,MiniMax 在回答事實(shí)性問(wèn)題時(shí),經(jīng)常會(huì)一本正經(jīng)地給出錯(cuò)誤信息,而且內(nèi)容看起來(lái)還挺像那么回事。例如,它可能會(huì)編造不存在的論文、虛構(gòu)歷史事件細(xì)節(jié)等。如果不去核實(shí),很容易被誤導(dǎo)。雖然這一問(wèn)題在各類大模型中普遍存在,但不少用戶認(rèn)為 MiniMax 在這方面的表現(xiàn)相對(duì)更嚴(yán)重。
其次是“復(fù)讀機(jī)”現(xiàn)象。很多用戶吐槽它的回答又長(zhǎng)又重復(fù),本來(lái)一句話可以說(shuō)清楚的內(nèi)容,它卻反復(fù)換種說(shuō)法來(lái)表達(dá),導(dǎo)致整段回復(fù)顯得冗長(zhǎng)且信息密度不高。簡(jiǎn)單來(lái)說(shuō),就是“看起來(lái)說(shuō)了很多,其實(shí)沒(méi)多大信息量”。
第三個(gè)爭(zhēng)議點(diǎn)來(lái)自安全問(wèn)題,尤其是圍繞其角色扮演產(chǎn)品 Talkie。在2024至2025年間,這款應(yīng)用被曝出對(duì)未成年用戶保護(hù)不足,同時(shí)在部分角色扮演場(chǎng)景中生成了不當(dāng)內(nèi)容,例如涉及暴力或情感操控等。此外,還有媒體報(bào)道稱,一些青少年在與 AI 角色進(jìn)行深度互動(dòng)后出現(xiàn)心理問(wèn)題。這一系列事件引起了監(jiān)管機(jī)構(gòu)的關(guān)注,也對(duì) MiniMax 在海外的口碑造成了較大沖擊。
在實(shí)際使用體驗(yàn)上,很多人還指出 MiniMax 的指令遵循能力不夠穩(wěn)定。比如,用戶明確要求用表格輸出、限制字?jǐn)?shù),或者進(jìn)行角色扮演時(shí),模型經(jīng)常“聽(tīng)不進(jìn)去”,要么不按格式來(lái),要么中途“出戲”。一旦任務(wù)稍微復(fù)雜一些,比如包含多步驟要求,就容易出現(xiàn)漏步驟或順序混亂的問(wèn)題。
在推理能力方面,MiniMax 也常被拿來(lái)與更強(qiáng)的模型進(jìn)行對(duì)比。無(wú)論是邏輯推理、數(shù)學(xué)問(wèn)題還是代碼調(diào)試,它在多步驟推理過(guò)程中容易出現(xiàn)中間出錯(cuò)的情況,一旦某一步偏了,后面的結(jié)果往往就全部錯(cuò)誤。這使得整體可靠性受到影響。
此外,還有用戶質(zhì)疑其“跑分表現(xiàn)與實(shí)際體驗(yàn)不符”。也就是說(shuō),在官方公布的 Benchmark 測(cè)試中,模型成績(jī)看起來(lái)很不錯(cuò),但在真實(shí)使用場(chǎng)景中,表現(xiàn)卻達(dá)不到預(yù)期。一些社區(qū)用戶甚至懷疑模型針對(duì)測(cè)試集做了優(yōu)化,不過(guò)這一點(diǎn)并沒(méi)有確鑿證據(jù),但“體感落差”確實(shí)是普遍反饋。
比較有意思的是,盡管 MiniMax 是國(guó)產(chǎn)模型,但在中文理解上也并非完全穩(wěn)定。例如,成語(yǔ)和歇后語(yǔ)偶爾會(huì)用錯(cuò),對(duì)網(wǎng)絡(luò)梗或雙關(guān)語(yǔ)的理解也不總是準(zhǔn)確,在涉及特定文化背景的內(nèi)容時(shí),有時(shí)也會(huì)出現(xiàn)偏差,這一點(diǎn)讓部分用戶感到意外。
最后,在多模態(tài)方面,其視頻生成產(chǎn)品(如海螺 AI)也經(jīng)歷了“初看驚艷、細(xì)看翻車”的評(píng)價(jià)變化。用戶在深入使用后發(fā)現(xiàn),生成視頻中常見(jiàn)人物一致性較差(同一角色前后長(zhǎng)相變化明顯)、物理規(guī)律不合理(如穿模、重力異常)以及可控性不足等問(wèn)題,難以精確實(shí)現(xiàn)預(yù)期效果。
總體來(lái)看,MiniMax 的模型在技術(shù)展示層面具有一定亮點(diǎn),但在穩(wěn)定性、可靠性和實(shí)際使用體驗(yàn)上,仍存在不少被用戶反復(fù)提及的短板。這些問(wèn)題是否能夠在后續(xù)版本中得到改善,也成為不少人持續(xù)關(guān)注的焦點(diǎn)。
延伸閱讀:
minimax 大肆抄襲kimi!開(kāi)發(fā)者本人吐槽后被光速踢出群聊,怒發(fā)律師函誓要?jiǎng)偟降?/a>
國(guó)產(chǎn)貨真不行!龍蝦用戶吐槽 minimax 是個(gè)巨型垃圾,評(píng)論區(qū)排隊(duì)點(diǎn)贊
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.