无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI生成圖片,哪家強?

0
分享至

AI的滲透正無遠弗屆。正如很多插畫網站,添加“AI生成”標簽已是標配。

從藝術角度看,AI生成的圖片,似乎爭議依然巨大。但不得不承認的是,在工作和學習中,AI圖片生成卻是一個提高效率的好辦法。

目前,多模態大模型領域中,支持文生圖的模型數量正在指數級增長。

為了解決大家的“選擇困難癥”,這次我們選擇了6個模型進行測評。

參賽選手如下:

騰訊混元、智譜CogView-4、通義千問、即夢、可靈和Gemini 2.5 Flash Image。

其中,前段時間在LMarena上爆火的模型nano-Banana,據說吊打一切文生圖模型。

現在也已經“驗明正身”,正是8月27日Google發布的Gemini 2.5 Flash Image。

在測評前,先疊個甲:

對美術方面,實在是一竅不通。

因此,我們不談復雜的理論,也不聊晦澀的美術史。

只是以一個普通人的視角,借助AI給出的評分標準,來評價一下到底“好不好看”。一家之言,僅供參考。

01

第一維度:基礎美學與真實感

考驗目標:AI的基本畫功,好不好看、真不真實。

題目:傍晚陽光下的少女

Prompt: 超寫實照片,一個有雀斑的年輕女子,面帶微笑,在黃金時刻坐在窗邊,溫暖的陽光穿過她的頭發,電影感光線,8K,高細節。

評分標準:

測評結果:

騰訊:人物的皮膚質感過于光滑,僅有微小瑕疵。

智譜:皮膚過于光滑,雀斑形狀和分布過于均勻和刻意,屬于明顯瑕疵。

千問:雙手比例和形態非常不自然,完全沒有寫實感,“一眼AI”,屬于明顯瑕疵。

即夢和可靈:非常出色,接近完美,不愧是“專業畫手”。

Gemini:皮膚質感過于光滑細膩,寫實感還是差了一些。

總體來說,對于人物的塑造,各個AI還是比較拿手的。

雖然有些模型生成的圖片略有瑕疵,但整體觀感不錯。

02

第二維度:想象力與創意

考驗目標:AI的腦洞有多大,對于現實中不存在的事物的創造能力。

題目:星云構成的雄獅

Prompt: 一頭雄偉的獅子,由旋轉的星系和星云雕刻而成,宇宙塵埃構成了它的鬃毛,眼睛是閃爍的恒星,背景是深邃的宇宙。

評分標準:

測評結果:

這一輪的題目看來對AI難度有點高了。

騰訊:第一眼看上去很華麗,很有氣勢,但似乎理解出現了一些偏差。這并非一個由星云構成的生命體,而是一尊宇宙材質的宏偉雕像。

智譜:生成了一個宇宙背景下的實體獅子,完全徹底的概念性跑偏。

千問:“半神半獸”的感覺,實體獅子與星云的混合,離要求還是有一定差距。

即夢:科幻感十足,但獅子身體仍然是實體而不是星云構成的,觀感有一定新意。

可靈:本輪的最佳選手,視覺效果很好,實現了與星云的融合。

Gemini:獅子的實體也是不透明的,不過神韻、氣質和細節都還不錯。

看來,對于現實中不存在的事物,AI出現概念理解錯誤的幾率會大大增加,而想象能力也是目前模型有所欠缺的地方。

可能的原因也比較多,例如訓練數據存在一定的局限性、對物理世界存在路徑依賴或是概念融合能力的欠缺。

03

第三維度:指令理解與執行力

考研目標:AI聽不聽話,能不能正確遵從指令。

題目:水果籃里的數學題

Prompt: 一個木碗里裝著三個紅蘋果和兩個黃香蕉,放在一張白色的桌子上。

評分標準:

測評結果:

這肯定是人類眼中最簡單的一道題,但對AI來說難度可不低。

六個模型中,只有智譜、千問和Gemini正確完成了如此“簡單”的指令。

即夢和可靈都搞錯了蘋果的數量,而混元更是漏洞百出。

根據這一輪的結果,我們也可以得到一個推斷:

AI生圖模型并非按照我們的數學概念和美術流程來工作。

或者說,它并不是按照我們最直接的思路,畫一個蘋果,再畫一個香蕉,直到數目符合要求。

指令中的3這個數字,對AI來說,并不代表一個精確的數量,而是一個需要渲染的“構圖特征”。

而在向量空間中,“三個蘋果”和“四個蘋果”可能是非常接近的。

同時,我們也無法得知提供給上述AI的訓練集到底是什么樣的。

但是,標簽肯定是做不到完全精準的,AI只能長時間在海量但又不完全精確的數據中學習。

AI的最終目標,是讓生成的圖片最接近于它見過的“三個蘋果”,而不是“讓生成的蘋果數量等于3”。

04

第四維度:風格模仿與駕馭力

考驗目標:AI模仿特定的藝術家或藝術流派的能力。

題目:水墨風的機甲

Prompt:一個巨大的中國古代機甲戰士,站立在云霧繚繞的山谷中,中國傳統水墨山水畫風格。

評分標準:

測評結果:

又是一道有點抽象的題目。

表現最好的是Gemini,實打實繪制出了山水畫風格,大體符合要求。

千問生成的機甲看起來確實氣勢磅礴,細節處理也很到位,但很明顯,這是素描而不是水墨風格,只能說是“有形無神”。

即夢生成的圖片也并非水墨畫,而是帶有寫實感的數字繪畫,更像是個游戲的概念設計圖。

可靈則發揮了優秀的拼接能力,在水墨風格的背景中插入了日式機甲,風格完全割裂。

混元和智譜生成的圖片則有些奇怪,水墨畫風格沒實現的同時,也沒理解“機甲戰士”這個主體,畫中人更像是個古代武士,完全偏離了題目要求。

如此看來,AI尚且不具備完全模仿某個藝術家或藝術流派的能力,能夠做到“形似神不似”就實屬不易。

05

第五維度:文化理解與概念表達

考驗目標:AI能否理解特定的文化以及是否能夠表達抽象的概念。

題目:中秋佳節的漢服少女

Prompt:一位美麗的年輕女孩,身穿中國傳統漢服,慶祝中秋節,她手持一個精致的兔子燈籠,身后是明亮的滿月。

評分標準:

測評結果:

Gemini和可靈都拿下了相當高的分數,展現出了較高的文化素養。

對于漢服的概念理解比較深刻,而月亮、燈籠、園林等文化元素也都齊全。

推測其訓練數據中,中國傳統文化的相關素材標注是比較準確的。

兩家模型的算法能夠把“漢服”等關鍵詞正確關聯到視覺特征上。

即夢和千問在美觀度和氛圍塑造上也很成功,不過漢服的結構有些模糊。

盡管這種古風畫作可能意味著AI對于服飾歷史知識的了解程度不夠深刻,但滿足“好看”這一要求仍然不在話下。

智譜生成的則是唯一采用了動漫風格的圖片,對歷史文化的復現程度顯然是太淺了。

混元生圖看似美觀,但在服飾結構上有比較明顯的錯誤,即一定程度上的文化混淆。

因此,AI在文化表現上也是存在“雙刃劍”效應的。

頂級AI具備相當可觀的文化知識,對于傳播、創作優秀傳統文化會有很大的幫助。

而部分AI還存在“刻板印象”,受到低質量數據的影響,反而會加劇大眾的文化誤解。

06

總評

本次測評的總分如下:

Gemini:44分

可靈:40分

即夢:39分

千問:38.5分

智譜:33.5分

騰訊:28.5分

從效果上來看,千問、即夢、可靈和Gemini的文生圖效果都是很不錯的。

尤其是前身為nano-Banana的Gemini 2.5 Flash Image,拿到了最高的分數,證明了它并非浪得虛名。

不過,我們的核心目標還是要透過現象看本質。

人們總是驚嘆于AI的“創造力”,它足夠以假亂真,繪畫水平也超越了大部分人。

但事實上,AI輸出的圖片,并非源于類似人類的靈感或意圖。

AI作畫,并非像一個畫手一樣,從一張白紙開始一筆一筆畫出事物。

而是從一張充滿隨機噪聲點的“混沌畫布”開始,根據提示詞進行降噪。

也就是說,AI作圖并非基于邏輯推理,而是基于概率。

對于蘋果生成數量的錯誤,可能就是因為“構成一幅和諧的水果靜物圖”這個在訓練數據中頻繁出現的指令,其概率權重超過了“3”這個脆弱的數字符號。

對于星云和獅子之間的掙扎,與“獅子”相關的像素模式可能是“實體”和“毛發”,而與“星云”相關的則是“氣體”和“半透明”。AI無法同時滿足兩個相互矛盾的概率分布,因此降噪過程就無法成功。

對于水墨風的機甲,則可能是AI背后的數據庫在發揮作用。如果數據庫中有大量“水墨”、“機甲”等高質量的標簽,降噪過程也會被順利引導至一個高質量的概率空間。

簡單的來說,AI不是在根據指令繪畫,而是根據知識儲備,試圖通過降噪給出最可能符合指令的圖像。

至于錯誤,文生圖是一個很復雜的過程,很遺憾,我們無法確切得知問題出在哪一環節。

也因此,至少目前為止,我們并不是“創作者”,而是“概率的引導者”。

轉載開白 | 商務合作 | 加群交流
請添加微信:cutstill
添加微信請備注姓名公司與來意

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
23歲男子自帶挖掘機為社區修路墜崖身亡 家屬與社區就“工亡”認定未達一致 律師解讀分歧

23歲男子自帶挖掘機為社區修路墜崖身亡 家屬與社區就“工亡”認定未達一致 律師解讀分歧

封面新聞
2026-05-12 20:32:02
天價轉會費+沖金球!阿爾瓦雷斯有望以1.5億歐空降大巴黎?

天價轉會費+沖金球!阿爾瓦雷斯有望以1.5億歐空降大巴黎?

田先生籃球
2026-05-12 22:10:29
超預期!美國,重磅發布

超預期!美國,重磅發布

證券時報
2026-05-12 21:52:07
被Miu Miu拉黑的街道:退貨率超90%,網紅“穿完就退”成產業鏈

被Miu Miu拉黑的街道:退貨率超90%,網紅“穿完就退”成產業鏈

每日經濟新聞
2026-05-12 18:00:09
中國外交部發聲:堅決反對、強烈譴責巴方有關行徑!

中國外交部發聲:堅決反對、強烈譴責巴方有關行徑!

一個有靈魂的作者
2026-05-12 21:21:19
太猖狂!四川凌晨追打事件后續:6人一鍋端,被查女子蠻橫襲警

太猖狂!四川凌晨追打事件后續:6人一鍋端,被查女子蠻橫襲警

奇思妙想草葉君
2026-05-12 16:24:04
特斯拉宣布停產,震驚全網!

特斯拉宣布停產,震驚全網!

財經三分鐘pro
2026-05-12 15:10:58
全球進入北京時間

全球進入北京時間

環球時報國際
2026-05-12 14:44:04
宇樹發布GD01載人變形機甲 定價390萬元起

宇樹發布GD01載人變形機甲 定價390萬元起

財聯社
2026-05-12 12:27:07
出乎眾人預料,中方提前48小時官宣特朗普訪華,高市早苗心愿落空

出乎眾人預料,中方提前48小時官宣特朗普訪華,高市早苗心愿落空

策前論
2026-05-11 18:13:56
突發噩耗!名記曝灰熊29歲悍將突然去世 曾夏聯MVP+入選新秀一陣

突發噩耗!名記曝灰熊29歲悍將突然去世 曾夏聯MVP+入選新秀一陣

驚奇侃球
2026-05-13 02:55:53
12歲男孩確診癌癥晚期!父母透露孩子常把飲料當開水喝 油炸、腌制零食吃起來毫無節制

12歲男孩確診癌癥晚期!父母透露孩子常把飲料當開水喝 油炸、腌制零食吃起來毫無節制

閃電新聞
2026-05-12 18:27:14
上海大學通報“院長蘇某某論文被舉報數據造假”:已成立調查組,啟動調查程序 ,將根據調查情況嚴肅認真處理

上海大學通報“院長蘇某某論文被舉報數據造假”:已成立調查組,啟動調查程序 ,將根據調查情況嚴肅認真處理

魯中晨報
2026-05-12 16:54:06
美媒披露:阿聯酋秘密對伊朗發動軍事打擊

美媒披露:阿聯酋秘密對伊朗發動軍事打擊

參考消息
2026-05-12 20:36:12
網友屏蔽“愛國流量”名人企業,司馬南、華為上榜,評論區太認同

網友屏蔽“愛國流量”名人企業,司馬南、華為上榜,評論區太認同

譚談社會
2026-05-12 16:50:17
貪官末日來了!中央反腐新規5月重磅落地,在職退休一律終身追責

貪官末日來了!中央反腐新規5月重磅落地,在職退休一律終身追責

宏哥談商道
2026-05-12 19:00:03
曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

羅說NBA
2026-05-12 21:43:19
特朗普訪華隨行團名單里,藏著一份重要轉向密碼

特朗普訪華隨行團名單里,藏著一份重要轉向密碼

識局Insight
2026-05-12 19:33:20
遲到清算!江蘇原教育廳長沈健落馬,主導480分高考曾毀多少天才

遲到清算!江蘇原教育廳長沈健落馬,主導480分高考曾毀多少天才

音樂時光的娛樂
2026-05-13 00:11:59
官宣,王勵勤勸了都沒用,樊振東深夜發文戳穿現實:不做工具人

官宣,王勵勤勸了都沒用,樊振東深夜發文戳穿現實:不做工具人

隱于山海
2026-05-13 00:49:15
2026-05-13 05:36:49
硅基星芒AI
硅基星芒AI
錦緞旗下人工智能研究與媒體服務平臺
58文章數 6關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

體育要聞

騎士終于玩明白了?

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

利潤再腰斬 京東干外賣后就沒過過好日子

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

旅游
本地
藝術
游戲
公開課

旅游要聞

故宮擠滿游客,人人撐傘前行:寧愿熱到出汗,也要奔赴紫禁城!

本地新聞

用蘇繡的方式,打開江西婺源

藝術要聞

震驚!他竟用鏡頭看透了所有女人的秘密!

活久見!電棍與香鍋怒噴被擼圈開除后和解,祝Mlxg母親節日快樂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版