INSIGHT
前幾天 GPT-Image-2 泄露了,試了一下發現非常厲害,但當時只要試一下就不給我生成了。
剛好今天終于發布了,發布以后我搞了不少的玩法。
它有一個非常牛逼的特點:不需要復雜提示詞,隨手幾個字就能出非常好的效果。
互聯網運營圖片
我們在 vibe coding 或者日常在互聯網的工作中,經常需要生成運營圖片。
比如產品更新公告、活動公告等,以前可能需要寫一長串復雜的提示詞。
但現在你只需要告訴它"蘋果風格"、"3D"、"簡潔卡片化"這種你能想到的詞就可以了。
比如下面兩個案例:
蘋果風格宣傳圖:
我跟它說需要一張"產品蘋果風格的中文宣傳圖",然后把介紹網頁發給它。它生成的圖片排版非常精美,而且文字完全沒問題。
提示詞:用 gpt-image-2 為這個產品生成生成蘋果風格的中文卡片宣傳圖:https://github.com/op7418/CodePilot
OpenAI 風格宣傳圖:
我讓它基于 OpenAI 的風格生成宣傳圖,并給了它一個 OpenAI 的更新公告。結果生成的風格確實延續了 OpenAI 以往那種漸變配色、簡潔的設計感。
提示詞:根據這篇文章生成一個產品更新的介紹海報,風格需要符合 OpenAI 以往的設計風格,內容需要簡潔,整體呈現蘋果風、卡片化、高級感:
![]()
以前這種圖至少得占設計師半天,現在從工作流里直接消失了。
知識類卡片
然后就是非常需要世界知識的"知識類卡片",這部分它也做得非常好。
排版非常豐富、內容也多樣,而且不需要多說任何提示詞。
比如第一個案例,我只是讓他用可愛的風格畫一張大語言模型的訓練過程介紹。
提示詞:用可愛的風格畫一張大語言模型的訓練過程科普圖
![]()
第二個案例是這種類似于雜志和科普的內容,你經常在公眾號里看見這種圖片排版。
這種復雜排版用來介紹一些知識和科普信息。
提示詞:用高級雜志感風格畫一張茶葉種類和制作過程的科普圖。
![]()
然后我發現它也能生成超級長的長圖。
比如說,這里讓它生成北京秋季的游覽攻略圖片,它就給了一張很長的圖片。
提示詞:生成北京秋季的游覽攻略圖片
可以看到它把秋天的特色景點、行程,以及美食、交通出行指南和一些其他的提醒都畫上了。
就是你能想到的、你想不到的都在上面,而且排版非常精細優美。
![]()
你不用告訴它該畫什么,它知道一張科普圖該有哪些內容。
游戲概念和 UI 設計
然后就想讓他試一下游戲這種非常復雜的類型。
圖片 UI 也有,可能還有 CG 角色以及一些小字。這種非常復雜的情況,測試結果非常好。
這里先是簡單的測試。
讓他(提示詞)參考《無畏契約》(Valorant)的游戲風格,生成一個以三國為主題、神話風格的 FPS 游戲選人界面 UI 圖片。
可以看到模仿得非常像,就是界面的布局和交互采用了《無畏契約》(Valorant)的選人方式,但是整個氛圍、風格、背景以及角色都變成了三國的這種感覺。
![]()
然后我就在想,再簡單的提示詞它能不能 get 到。比如說,我直接跟它說
提示詞 :生成一個"黑神話武松"的游戲截圖。
可以看到它真的能 get 到,包括 UI 設計、整個界面以及畫面風格,都是《黑神話》的游戲風格。
![]()
在生成游戲界面之后,心動游戲的黃老板演示了一個非常好玩的東西。
他轉發了我的推特,演示了生成的一個 ARPG 游戲截圖:畫面是 3D 的,但是帶有對話的選擇框 UI。
這不就是直接能玩游戲的嗎?我們這種 ARPG 游戲,不就是立繪加上選擇嗎?
![]()
你讓他給你生成一個帶立繪、帶選擇的界面,直接告訴他選哪個,他就能給你畫出下一張圖。這不就是在 GPT 里面玩游戲嗎?太爽了,沒想到真行,我試了一下。
![]()
![]()
之后還換了一些別的游戲類型。比如說,最近我在玩三消游戲。
所以就讓它生成了一個古代探寶風格的三消游戲 UI 截圖。
可以看到這個的文字渲染和 UI 細節就非常的精細和豐富,它甚至連消除以后的特效都給你做出來了。
整個項目不只是 UI,連交互設計和整個界面該有哪些玩法都有了,非常完整。
![]()
說到交互,前幾天非常火的一個測試 MBTI 以這種惡搞的方式火出圈了。
然后我就在想,咱們這個是不是能整點更高級的?
于是我就讓它基于《戰錘 40K》的世界觀為我生成了一套測試題。
然后在結束之后,基于我回答的答案給我生成一個我在《戰錘 40K》里的角色卡片和對應的性格分析。
![]()
結果他給的這個角色分析卡可太對味兒了!
基于我的回答,它給我分配的是一個審判官(異端審判官)。
而且還虛構了身份檔案、人物特征、專長能力,甚至還有角色小傳。
![]()
一張圖加幾句對話,其實就是一個可玩的游戲 demo,游戲原型的門檻又塌了一層。
幫你解釋和介紹論文
前面不是說它能生成長圖嗎?我就在想能不能讓它解釋論文。
我們 AI 圈經常就是看論文,于是就把最近的 Seedance 2.0 的模型卡片(System Card)論文發給了它,沒想到真可以!
提示詞:幫我用高級、有雜志感的排版風格,詳細且圖形化地介紹這篇論文的內容,生成一張長圖圖片來讓我理解它。要求使用中文。
![]()
網頁設計
這是個極端挑戰:我直接從小紅書隨便找了一張汽車的圖片。
提示詞:為這個汽車生成符合其氣質和風格的官網 UI 設計稿。
原圖是一張小米 SU7 的圖片,圖上沒有任何文字,只有一個側面的汽車。
![]()
但是它居然腦補出了這是小米的車,雖然把它猜成了 SU7(也很厲害了,因為它就后背那點不一樣,而且配色都是一樣的)。
它為這張圖生成了一個汽車官網,你們看一下吧,我覺得這個質量太離譜了。
他不知道學了多少。這張關于這輛車的圖片,所有的細節都是對的:
內飾、剖面圖、輪轂、大燈、尾翼、甚至價格。
![]()
然后我又試了一下其他類型的網頁,比如說我們常見的那種 B 端官網。
我直接跟他說:為 B 端廣告投放平臺生成一個官網的 UI 設計稿。
只能說他這個知識和搜索能力是非常的厲害。
他甚至知道這類型的網站上應該有哪些賣點,以及 UI 上應該展示哪些信息。太會了,這玩意兒真是完美設計。
![]()
它不只是會畫,它還知道這行里每個角色該說什么話。
商品宣傳圖
GPT-Image-2 模型甚至能給你隨手拍的任何商品生成非常高級的商品海報。
而且你不需要說更多的提示詞和內容,你只需要說一句:
提示詞:幫我為這個產品生成宣傳圖片,宣傳圖片要符合這個產品的氣質和風格
這是我隨手拍的我的鍵盤,光線非常差,鍵盤上也比較臟。
但是它把這些都處理好了,而且還加上了跟這個鍵盤真的相關的賣點,整個設計風格非常像那么回事。
![]()
然后我又拿來了一盒朋友送的藍莓,還是用的上面那個提示詞,一個字都沒有變。
但是它這次生成的風格完全匹配了農產品這個路數。
商品一致性可以說是非常高了,連藍莓的位置都是對的。
但是藍莓變得更大更飽滿了。我只能說 GPT 你還是太會了。
![]()
一張商品圖該用什么風格、該放什么賣點,這種判斷以前是設計師最值錢的部分。
UI 和 VI 設計
然后是 UI 設計。既然它的網頁設計那么厲害,其實 UI 設計也不會差。
我先是找了一張參考圖。
提示詞:基于參考圖的風格,生成一個健康 App 的 UI 設計稿。
他的還原度非常高,而且參考圖其實跟這個主題沒啥關系,只有一兩個組件。
![]()
![]()
然后我又給了他一張 VI 設計的參考圖
又給了他我用 vibe coding 開發的開源軟件 CodePilot 的 GitHub 頁面。
讓他基于這個圖片的風格和特色,為我的項目設計一套 VI。主要的項目信息在這里:
它在讀取了我的項目信息以后,沒有簡單地照抄參考圖,而是把這些元素都提取出來,跟我本身的產品能力進行了擴展。
![]()
可以看到這套 VI 非常全面,該有的都有了:
色彩與字體、UI 圖與簡單的介紹、圖標貼紙與 Logo 變體、品牌主張與能力映射、宣傳海報與官網示例。
比參考圖原來的內容詳細多了。
原本參考圖里的那些設計元素也都被保留了下來。
![]()
給它一個參考,它能在這個參考上再往前走一大截。
我做了十年設計,說兩句心里話
玩到這里,我越來越覺得這代模型真正變強的地方,是它"知道該畫什么"。
以前設計師值錢的地方有兩層:能畫出來、知道該畫成什么樣。
第一層這兩年早塌了,這次連第二層也開始松動。
你隨手說一句"蘋果風的宣傳圖"、"B 端廣告平臺的官網"、"黑神話風的游戲截圖",它就懂你在說什么。
因為這個行業這些年所有的視覺語言、排版規律、品牌調性,它都吃下去了。
對大部分非設計崗的人來說,這是好消息。
以前卡在"先得找個設計師"那一步的事,現在自己就能往下走。
對我們這行來說,日常那些重復性的商業設計會被收走,剩下還值錢的是原創審美和品牌高度——本來那也只是金字塔尖那一小撮人的事。
再想遠一點,Image V2 出設計稿,GPT-5.5 Pro 還原成代碼,CodeX 串成工作流。
從想法到可交付的東西,OpenAI 在把這條生產線直接打包。
如果你覺得對你有幫助可以幫我點個贊,也可以轉發給你需要的朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.