无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

菜單上的字終于對了:ChatGPT Images 2.0離人類設(shè)計(jì)師更近一步

0
分享至



兩年前,你讓當(dāng)時(shí)最強(qiáng)的AI圖像模型生成一張餐廳菜單。

菜單出來了,排版漂亮,配色正確,但菜名全部是亂碼。

兩年后,同樣的提示詞交給ChatGPT Images 2.0,生成的菜單可以直接送去印刷。不僅文字正確,價(jià)格合理,連排版間距都像是真正的設(shè)計(jì)師做的。

這兩年之間發(fā)生了什么?OpenAI認(rèn)為過去一直沒有解決的問題叫“意圖鴻溝”(intent gap):用戶腦子里想要的東西,和屏幕上最終出現(xiàn)的東西之間,有一條一直跨不過去的溝。

最新發(fā)布的ChatGPT Images 2.0解決的正是這個(gè)問題,雖然不夠徹底,但已經(jīng)足夠讓一部分人先用起來。

01.這次更新,OpenAI自己怎么定義它?

官方發(fā)布的ChatGPT Images 2.0功能清單是:更快、文字渲染更準(zhǔn)、多語言支持、新增Thinking模式。但如果只說Images 2.0是"更好的圖像生成器"顯然也低估了OpenAI的野心。



OpenAI內(nèi)部對這個(gè)產(chǎn)品的定位,是專門為了彌合AI圖像生成中的“意圖鴻溝”而打造的。所謂意圖鴻溝,是指用戶腦子里想要的東西,和最終生成出來的東西之間,長期存在的那條鴻溝。

這背后有一個(gè)根本性的轉(zhuǎn)變:

以前:你描述→AI生成

Images 2.0:你描述→AI理解你的真實(shí)意圖→AI自主查資料、想布局→AI生成,并在交付前自我審查

中間多出來的那兩步,才是這次發(fā)布真正重點(diǎn)。

02.Thinking模式:它在做什么?

根據(jù)OpenAI的說明,Thinking模式給了模型三種新能力:

聯(lián)網(wǎng)搜索:接到任務(wù)后,模型可以主動檢索相關(guān)參考資料,而不是單純依賴訓(xùn)練數(shù)據(jù)。這意味著它能處理品牌規(guī)范、最新產(chǎn)品信息、時(shí)事相關(guān)的視覺需求。

多方案并行生成:在單次提示詞下生成多達(dá)8張保持"角色與對象一致性"的連貫圖像。這對于漫畫分鏡、社交媒體系列圖、品牌物料的批量生產(chǎn),是一個(gè)實(shí)質(zhì)性的工作流改變。

生成前自我審查:模型會在最終輸出之前檢查自己的草稿是否符合要求。這一步在以前是完全缺失的——AI生成什么就是什么,沒有"質(zhì)檢"環(huán)節(jié)。



三者組合起來,讓整個(gè)工作流程更接近一個(gè)助理設(shè)計(jì)師,而不是一個(gè)“接受指令、照單輸出”的機(jī)械性工具。

Thinking模式目前僅對ChatGPTPlus、Pro 和 Business用戶開放。免費(fèi)用戶使用的是基礎(chǔ)模式,生成邏輯和結(jié)果都有所不同。這一點(diǎn)在很多評測中被混淆,導(dǎo)致對比結(jié)論出入較大。

03.文字渲染:為什么這是最被低估的進(jìn)步?

AI圖像生成發(fā)展了幾年,文字渲染一直是最明顯的短板。原因在于技術(shù)架構(gòu)本身:傳統(tǒng)擴(kuò)散模型(diffusion model)以像素為單位生成圖像,文字信息在訓(xùn)練數(shù)據(jù)中占比極小,模型幾乎沒有機(jī)會“學(xué)會”文字是怎么工作的。

Images 2.0的進(jìn)步之所以顯著,在于它能夠處理以前幾乎不可能完成的任務(wù):

? 餐廳菜單,菜名、價(jià)格、排版全部正確

? 密集的UI截圖還原,文字層次清晰

? 多語言混排的信息圖表,包括中文、日語、韓語、印地語、孟加拉語



這最后一點(diǎn)對咱們中文用戶的意義不言而喻。AI視覺內(nèi)容生產(chǎn)長期存在一條隱性的語言鴻溝:英語世界的用戶可以用AI做精準(zhǔn)的營銷海報(bào)和品牌物料,而非英語用戶面對的往往是錯(cuò)別字和亂碼,被迫放棄或?qū)ふ胰斯ぬ娲?/p>

如果Images 2.0真正穩(wěn)定地解決了這個(gè)問題,它實(shí)際上是在把一種工業(yè)級的視覺生產(chǎn)能力,更平等地交給全球非英語用戶。對東南亞、南亞、東亞市場的設(shè)計(jì)從業(yè)者和中小企業(yè)來說,這將是實(shí)際工作流層面的改變。



當(dāng)然,“顯著進(jìn)步”和“徹底解決”之間仍有差距。測試結(jié)果顯示,非英語語種渲染依然存在不穩(wěn)定性,復(fù)雜排版下的錯(cuò)誤率高于英語。

04.架構(gòu)問題:OpenAI為何不回答?

在發(fā)布前的媒體簡報(bào)會上,OpenAI拒絕回答關(guān)于Images 2.0底層模型架構(gòu)的問題,不說是擴(kuò)散模型,不說是自回歸模型,一概不提。

傳統(tǒng)擴(kuò)散模型的文字渲染能力有其結(jié)構(gòu)性上限,而Images 2.0展示出的文字理解和指令跟隨能力,從表現(xiàn)上看已經(jīng)超出了這個(gè)上限。

一種合理的推測是,Images 2.0 與 GPT-4o的語言模型架構(gòu)存在比DALL-E時(shí)代更深度的集成,視覺輸出能力更接近語言模型的“延伸”,而非一個(gè)獨(dú)立的圖像生成系統(tǒng)。

但這終究是推測。OpenAI選擇不披露,既有商業(yè)競爭的考量,也可能有模型仍在迭代的原因。我們唯一能判斷的是,它在某些任務(wù)上的表現(xiàn),已經(jīng)超出了現(xiàn)有架構(gòu)分類所能預(yù)測的邊界。

05.灰度測試細(xì)節(jié):代號“duct tape”

在正式發(fā)布之前,Images 2.0 以代號“duct tape”(膠帶)的形式,悄悄上線了第三方AI測試平臺LM Arena,公開運(yùn)行了數(shù)周,收集真實(shí)用戶反饋。

這個(gè)細(xì)節(jié)反映了OpenAI產(chǎn)品發(fā)布策略的一個(gè)變化,從“憋大招、一鍵發(fā)布”,轉(zhuǎn)向"先讓真實(shí)用戶用、再正式推出"。這是一種更工程化、風(fēng)險(xiǎn)更可控的節(jié)奏。

“duct tape”這個(gè)代號本身也耐人尋味,膠帶意味著臨時(shí)性的連接,把兩個(gè)不完全匹配的部分強(qiáng)行粘合。這可能只是一個(gè)隨意的內(nèi)部命名,但也可能暗示OpenAI對當(dāng)前這個(gè)版本仍然持有某種謙遜:它是一個(gè)階段性的解決方案,而非終點(diǎn)。

06.競爭格局:真正的對手不是Midjourney

市場上,Google于2026年2月發(fā)布的Gemini 3 Pro Image同樣具備文字嵌入圖像的能力,在部分任務(wù)上與 Images 2.0 互有勝負(fù)。Midjourney 在藝術(shù)風(fēng)格生成上依然有其獨(dú)特優(yōu)勢。

但把這場競爭描述為“圖像生成模型之間的比拼”就完全理解錯(cuò)了。

Images 2.0真正在擠壓的,是另一類工具的市場空間:Canva的模板編輯器、Adobe Express的快速設(shè)計(jì)功能、小型設(shè)計(jì)工作室承接的低復(fù)雜度物料需求。OpenAI自己點(diǎn)名的目標(biāo)應(yīng)用場景是本地化廣告、信息圖表、教育內(nèi)容、品牌物料,這些商業(yè)設(shè)計(jì)的日常基本盤,而非藝術(shù)創(chuàng)作的邊緣地帶。



這個(gè)定位意味著它的潛在用戶,首先不是創(chuàng)意設(shè)計(jì)師,而是每天需要生產(chǎn)大量視覺物料、但沒有專職設(shè)計(jì)資源的人:品牌運(yùn)營、市場專員、內(nèi)容編輯、獨(dú)立創(chuàng)業(yè)者。

07.還沒解決的問題

渲染穩(wěn)定性:非英語語種的文字渲染仍然存在不穩(wěn)定性,英語以外的復(fù)雜排版錯(cuò)誤率仍高于預(yù)期。"有進(jìn)步"和"徹底解決"之間,還有明顯的距離。

數(shù)據(jù)截止日期:模型的訓(xùn)練數(shù)據(jù)截至2025年12月。Thinking模式雖然可以聯(lián)網(wǎng)搜索,但搜索質(zhì)量與最終圖像質(zhì)量之間的銜接機(jī)制,目前仍不透明。對于需要引用最新事件或數(shù)據(jù)的視覺需求,結(jié)果可能出現(xiàn)偏差。

內(nèi)容安全:OpenAI特別強(qiáng)調(diào)了圖像水印和實(shí)時(shí)內(nèi)容監(jiān)控。背景是AI生成視覺內(nèi)容已經(jīng)出現(xiàn)了被用于政治宣傳和虛假信息的案例。更強(qiáng)的生成能力,與更難辨別的濫用風(fēng)險(xiǎn),是同一枚硬幣的兩面。技術(shù)迭代無法獨(dú)自解決這個(gè)問題。

08.結(jié)語

ChatGPT Images 2.0發(fā)布后,社交媒體上流傳最多的,是那些令人驚嘆的演示,完美的菜單、精準(zhǔn)的多語言海報(bào)、連貫的分鏡圖。它們大多是在最優(yōu)條件下、由有經(jīng)驗(yàn)的用戶生成的。所以我們真正使用起來的時(shí)候,可能結(jié)果沒那么穩(wěn)定和精美。

下圖就是作者用小貓照片生成的一張帶有中文字的圖片,它甚至自主給小貓取了中文名:小金。圖中文字去嗯對,沒有錯(cuò)別字。但圖片精致程度和官方照片顯然也差一個(gè)量級。



OpenAI正在解決一個(gè)難而正確的問題。文字渲染從“基本無用”到“可以直接使用”,跨越的是一個(gè)現(xiàn)實(shí)的使用門檻。

“意圖鴻溝”還沒有徹底消失。但它確實(shí)變窄了,窄到一些人可以開始重新思考自己的工作流了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
性張力拉滿,這部尺度新劇拍的太欲了

性張力拉滿,這部尺度新劇拍的太欲了

來看美劇
2026-06-15 19:03:49
死磕純視覺!余承東科普問界M9六激光雷達(dá):40個(gè)傳感器讓盲區(qū)消失

死磕純視覺!余承東科普問界M9六激光雷達(dá):40個(gè)傳感器讓盲區(qū)消失

快科技
2026-06-15 18:57:28
一同事被裁員,立馬退工作群,中午準(zhǔn)備交接時(shí),才發(fā)現(xiàn)所有同事微信好友都被刪了!問題來了,天天一起的打工人,有資格成為朋友嗎?

一同事被裁員,立馬退工作群,中午準(zhǔn)備交接時(shí),才發(fā)現(xiàn)所有同事微信好友都被刪了!問題來了,天天一起的打工人,有資格成為朋友嗎?

品讀時(shí)刻
2026-06-16 09:09:06
劉濱已經(jīng)擔(dān)任扇子藝術(shù)協(xié)會會長,從毛新宇妻子蛻變成女強(qiáng)人

劉濱已經(jīng)擔(dān)任扇子藝術(shù)協(xié)會會長,從毛新宇妻子蛻變成女強(qiáng)人

李昕言溫度空間
2026-06-15 20:54:42
“這飯給你,你吃嗎?”家長給女兒送飯,旁觀者都看不下去了!

“這飯給你,你吃嗎?”家長給女兒送飯,旁觀者都看不下去了!

林林先生
2026-06-16 11:50:05
世界杯爆出大冷門,55萬人口島國佛得角0-0戰(zhàn)平西班牙,40歲門將一夜?jié)q粉超百萬!該國體育場、議會大廈、政府大樓等都是中國援建

世界杯爆出大冷門,55萬人口島國佛得角0-0戰(zhàn)平西班牙,40歲門將一夜?jié)q粉超百萬!該國體育場、議會大廈、政府大樓等都是中國援建

三湘都市報(bào)
2026-06-16 09:16:02
賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機(jī)會

賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機(jī)會

小影的娛樂
2026-06-16 17:05:04
金子終會發(fā)光?為丈夫回歸家庭的董卿近況曝光,父親坦言如今處境

金子終會發(fā)光?為丈夫回歸家庭的董卿近況曝光,父親坦言如今處境

大魚簡科
2026-06-16 09:28:25
2026寬帶電視出新規(guī)!下半年全面調(diào)整,每家辦理業(yè)務(wù)都要留意

2026寬帶電視出新規(guī)!下半年全面調(diào)整,每家辦理業(yè)務(wù)都要留意

復(fù)轉(zhuǎn)這些年
2026-06-15 18:49:17
住建部發(fā)話了:樓齡20年以上的老房子,這一次真輪到咱了!

住建部發(fā)話了:樓齡20年以上的老房子,這一次真輪到咱了!

蜉蝣說
2026-06-12 11:32:10
中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達(dá)44%。

中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達(dá)44%。

流蘇晚晴
2026-06-13 18:21:18
耿同學(xué)又立功了!被他盯上的人,幾乎沒有一個(gè)能全身而退

耿同學(xué)又立功了!被他盯上的人,幾乎沒有一個(gè)能全身而退

周哥一影視
2026-06-16 05:46:25
尼克斯奪冠湖人最尷尬:詹姆斯留隊(duì)與否不重要,東契奇難超哈登

尼克斯奪冠湖人最尷尬:詹姆斯留隊(duì)與否不重要,東契奇難超哈登

姜大叔侃球
2026-06-16 12:33:04
菲律賓國防部長立 “大功” 了!

菲律賓國防部長立 “大功” 了!

阿七說史
2026-06-15 15:29:46
日本的報(bào)應(yīng)來了!中國再一次詮釋了什么叫“不戰(zhàn)而屈人之兵”!

日本的報(bào)應(yīng)來了!中國再一次詮釋了什么叫“不戰(zhàn)而屈人之兵”!

薛小榮
2026-06-16 13:36:04
知名網(wǎng)紅“表妹李KK”破產(chǎn)!未婚生女后掉粉上百萬,轉(zhuǎn)行去賣小吃

知名網(wǎng)紅“表妹李KK”破產(chǎn)!未婚生女后掉粉上百萬,轉(zhuǎn)行去賣小吃

觀察鑒娛
2026-06-16 08:45:38
吃相太難看!開封男童丟5天,多件惡心事發(fā)生,家屬硬剛?cè)栽夤?>
    </a>
        <h3>
      <a href=奇思妙想草葉君
2026-06-15 23:05:41
亂了,日本領(lǐng)土危機(jī)出現(xiàn)!不光是琉球,原來連北海道也不是日本的

亂了,日本領(lǐng)土危機(jī)出現(xiàn)!不光是琉球,原來連北海道也不是日本的

超人強(qiáng)動物俱樂部
2026-06-16 14:24:21
人這一生,最高級的活法:越活越輕

人這一生,最高級的活法:越活越輕

青蘋果sht
2026-06-06 05:10:24
太解氣!揚(yáng)言20天追10個(gè)中國女孩,印度男子來華慘遭全程打臉

太解氣!揚(yáng)言20天追10個(gè)中國女孩,印度男子來華慘遭全程打臉

小徐講八卦
2026-06-15 08:23:06
2026-06-16 18:19:00
強(qiáng)調(diào)Next incentive-icons
強(qiáng)調(diào)Next
關(guān)注科技,與創(chuàng)新企業(yè)共成長
133文章數(shù) 5關(guān)注度
往期回顧 全部

科技要聞

DeepSeek融資500億,梁文鋒牢牢握住控制權(quán)

頭條要聞

青海發(fā)生6.3級地震 多地網(wǎng)友反映有震感

頭條要聞

青海發(fā)生6.3級地震 多地網(wǎng)友反映有震感

體育要聞

身價(jià)5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個(gè)女兒在靈堂內(nèi)茫然失措

財(cái)經(jīng)要聞

2萬億存款去哪兒了?

汽車要聞

smart #6上市后 竟然很少被討論參數(shù)

態(tài)度原創(chuàng)

教育
游戲
家居
手機(jī)
軍事航空

教育要聞

優(yōu)秀的父母和普通的父母差距到底有多大

你支持索尼回歸獨(dú)占嗎?PC玩家的損失還是無所謂

家居要聞

綠意盎然 自然之境

手機(jī)要聞

本月發(fā)布!REDMI K90至尊版開啟預(yù)約:驍龍8E+最強(qiáng)風(fēng)冷

軍事要聞

美伊達(dá)成諒解備忘錄 內(nèi)塔尼亞胡表態(tài)

無障礙瀏覽 進(jìn)入關(guān)懷版