![]()
之前接了個做古風短劇的單子,對方手里有一部宋朝背景的古風小說,想把原著場景逐段轉成文生圖提示詞,做成分鏡素材,再配合短視頻剪輯出來。
她之前自己試過,跑了十幾張,人物造型每張都不一樣,有的頭發散了,有的服飾變成了明朝款,有的背景莫名出現了玻璃窗,整體看下來根本不是同一部劇。
我看了她原本的指令,問題出在三個地方:
第一沒有建立固定的人物視覺檔案,每次描述人物靠臨時發揮;
第二沒有約束畫面朝代風格,AI默認走它對"古風"最寬泛的理解;
第三沒有規定提示詞的結構,輸出格式有點隨機,不適合批量用。
這三個問題,是古風文生圖指令里最典型的坑,也是最容易被忽視的。
我給她重新做了一套指令,核心思路分享一下:
1. 人物視覺檔案是地基,不是備注。
多人物的古風小說,最難控制的就是人物一致性。你跟AI說:"歐陽春,女主,黑發",AI每次生成對這三個字的理解都不同,發型、服飾、年齡感全靠它自由發揮,跑出來的圖里同一個人可以有五種長相。
解法是在指令最前面強制建立一份人物視覺檔案,格式鎖死到具體參數:年齡、發型款式、發飾、服裝顏色、材質、款式,外貌特征一條不漏。
然后規定一條死命令:只要畫面里出現這個人物,必須在名字后緊鄰位置用括號重新復述一遍完整描述,哪怕上下句只隔一個逗號,也要重復。這不是啰嗦,是給AI每次生成鎖一次視覺坐標,不重復就會飄。
2. 朝代風格約束要落到"禁止清單",不能只靠正向描述。
你在指令里寫"宋朝風格",AI會給你古風,但它對"古風"的理解邊界很模糊,漢唐宋明清可能混著用,偶爾還會串入現代元素。客戶那批圖里出現玻璃窗,就是這個原因。
正向描述告訴AI要什么,但AI在生成時會自動填充它認為"合理"的細節,這些細節往往就是出戲的來源。
所以指令里必須同時加一份硬性禁止清單,把所有可能破壞朝代感的元素逐一列出來,比如現代城市、玻璃、霓虹燈、手機、槍械、科幻光效,明確寫禁止出現,不是"盡量避免"。一旦變成禁令,AI在生成時的自由發揮空間就被壓縮了,出戲概率會明顯降低。
3. 提示詞結構必須標準化,批量使用才能穩定。
古風短視頻的分鏡素材,少則幾十張,多則上百張,如果每張提示詞的結構都不一樣,生成結果的風格一致性就很難控制,后期剪輯也會發現畫面之間銜接感差。
我在指令里定了一個固定句式:人物加括號描述,接具體動作和神態,接時間和光影,接背景環境,最后是鏡頭語言和視角。
每一條提示詞按這個順序走,不斷行、不回車,一段小說內容對應一行輸出。遇到純景物或特寫物品的空鏡頭,開頭強制標記"無人+空鏡頭",和有人物的畫面做區分。結構固定之后,批量跑出來的提示詞在形式上是整齊的,AI處理的規律性也更強,生成結果的風格漂移明顯減少。
客戶用新指令跑了第一批二十張分鏡,發給我看了幾張,歐陽春的發型和服飾在每張圖里是一致的,背景維持在宋朝院落場景,沒有出現朝代錯亂。
她說這是她做這個項目以來,第一次覺得可以批量用,不用逐張去手動修改提示詞。后續她在這套指令基礎上繼續擴展了配角的視覺檔案,跑了第二批,穩定性還在。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.