在做花園可視化工具的時候,我栽進了一個大坑——以為必須把文字提示詞打磨到極致,才能換來能用的結果。花幾天時間反復調整描述,用修修改改的句子去“編程”,挺符合直覺。直到我接觸上下文工程,才發現一個反直覺的事實:別寫提示詞了,直接給幾張示例圖片,告訴它你喜歡什么、討厭什么,效果比咬文嚼字好得多。
不用猜我怎么會拐出這條彎路,直接看對比。
![]()
第一次實驗我只用了純文字描述:“能否給我些思路,把這個區域改造成更好看的花園?別動布局、比例和視角,也別加別的建筑。”得到的畫面確實挺美,問題就出在太美——精致得像園藝雜志封面,卻完全不接地氣。普通屋主看完只會更懵:圖是漂亮,但到底從哪一步動手?顯然這是一張“看起來很好但沒法落地”的效果圖。
接著我換了個策略,放棄在文字上死磕,直接把兩張圖片當作參數喂進去:一張正面示例,一張反面示例。對于正面那張,我告訴它這是風格參照——要那種真實感、整齊又克制的草坪、溫暖日光、居家氛圍,還有簡單但不廉價的家具,別搞花里胡哨。對于反面那張,我特別指出:別學它的不真實感、昂貴家具、完美邊緣和繪本質感。兩張圖并排丟進去,再也沒有多余的文字修修補補。
這下結果就“能用了”。新生成的花園圖像明顯吸收了正面示例的草坪處理、光線、真實度和簡潔的家具搭配,同時又從反面示例那里學會了避開大面積花卉堆砌和昂貴物件。整體看起來仍然有靈感,卻不至于飄在空中,是一種“夠得著”的花園設計建議。成本?不過是多傳兩張圖,省下的是反復調整提示詞的時間。
這個流程跑通之后,我順手寫了個測試腳本,方便隨時換不同版本的圖片去試。比如這段:
npm run test:image-edit -- -i public/images/messy_garden2.png --positive public/images/positive.jpeg --negative public/images/too_perfect.jpg -o scripts/output/test_output
用這種方式,以后想換正反面參考圖,只需改命令行參數,不用再來回改源碼。實驗效率一下子上去,各種風格組合跑起來也不心疼時間。整個思路的核心無非就是:別把提示詞當成暗號去破解,多用示例去對齊“到底想要什么”。這不僅讓我的工具開發進程加快一大截,也讓我重新審視了那些動不動就鼓吹“perfect prompts”的說法——有時候,一張對的圖頂得上一百次咬文嚼字。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.