大家好,我是冷逸。
朋友們,給大家看看我折騰了好幾天整的公眾號寫作神器「Auto-Wechat writing」。
它能做什么?
只需簡單輸入內容主題和創作要求(比如字數、關鍵內容點),就能調用寫作styles一鍵直出公眾號正文、標題、摘要和封面圖,支持自由接入各種模型。
出來的文字,人味很足,朱雀檢測“人工創作特征顯著”,全部文字我放今天的次條了。
![]()
項目已開源,歡迎大家star。
![]()
開源鏈接:https://github.com/lengyi2030/Auto-wechat-writing
目前還只是1.0版本,我會不斷迭代這個項目,后面給它加入寫作風格訓練、寫作類型選擇(不限于公眾號)、自動同步到公眾號后臺以及自動生成文章插圖等功能,希望大家多多三連支持,感謝了。
![]()
開發思路拆解
為什么要做這個東西?一開始主要還是自己需要。
因為我自己的寫作流程就是:
先寫正文,完成框架、觀點和全文,期間配圖也會同步制作。
確定正文后,根據全文來起標題、摘要(AI會加入進來)。
同步,根據標題和摘要制作封面圖。
最后,排版、發布。
![]()
最近,我就在琢磨,看能不能搞一個全自動的寫作工具。剛好智譜這幾天上線了新模型GLM-5.1,看大家的實測,特別擅長長程任務,于是我把它接到Claude Code里開整,也借此測一下這個模型。
我的需求其實蠻多的,用口語描述了一大堆功能。
給我做一個“沃垠AI寫作神器”的全功能網站,可在本地運行。
功能要求:
1、有三個核心功能:正文生成、標題摘要生成(先生成正文后,再根據正文來生成標題和摘要)、封面生成。正文、標題摘要接同一個模型,圖片接另外一個模型。
2、主界面有一個輸入會話框,給到示例模板“幫我寫一篇公眾號文章,主題是xx,字數xx,內容要點有:1.xx,2.xx……”,用戶輸入內容主題和寫作要求后,開始調用大模型進行寫作。
3、輸入會話框設計有“聯網”功能,支持用戶手動打開和關閉聯網功能。
4、輸入會話框還設計有風格1、風格2等可選的寫作風格模板。目前只有一個“風格1:科技媒體評論”,風格控制Prompt見本地文件“風格1:科技媒體評論.txt”。
5、寫作和生圖均支持用戶自行調用大模型。調用接口設計成可視化窗口,用戶只需要輸入模型url、模型key和模型名字,就可以使用。
5、先寫正文,寫完正文后,再批量出一批標題和摘要,供用戶選擇。
6、最后,再根據本文的核心內容提煉2-3個關鍵內容點,并生成封面圖片的文生圖prompt,統一尺寸比例2.35:1,用戶選定某個prompt后,調用生圖模型一鍵生成封面圖片。
7、正文和標題摘要,都設計有復制按鈕,支持用戶一鍵復制文本。封面圖片,設計有下載按鈕,支持用戶下載到本地。
先給我設計網站開發的產品需求文檔。待我確認產品需求文檔后,再進行具體的開發。整體要求架構清晰、功能完整,網站真實可用,代碼安全。
如果你直接讓大模型one shot去做一個成品,這大概率是做不出來的……所以,我們先讓它寫一份PRD(產品需求文檔)。
![]()
我拿到PRD后,微調了一下,讓它根據定稿版PRD進行開發。
![]()
這是一個前后端都有的輕量級項目,先簡單過一下架構。
![]()
主要就三層:后端用Express服務入口,負責啟動服務器、加載中間件和掛載路由;前端用原生HTML+JS,加載速度快,開發成本低;styles風格系統,是一個外部掛載,支持用戶自己編輯、創建“風格.txt”來微調AI的寫作風格。
核心的內容生成環節,它做了一個路由層 (routes/)。article.js負責處理正文生成,可以流式輸出;titles.js負責批量生成標題和摘要;cover.js負責封面生成,提供Prompt生成+圖片下載的功能。
API配置,則是存在瀏覽器localStorage中,做到了安全合規。
對于一個輕量級網站來說,這個架構是比較成熟且結構清晰的,沒有過渡設計。我想要實現的功能,它基本都規劃進來了。
先看第一版。
![]()
功能大體上做出來了,但是前端太單一,我給了它一些資料和前端設計要求,讓它進行優化。
![]()
優化后的前端,果然耐看了很多。
![]()
我們填入API,沖。
![]()
不出意外的話,報錯果然來了……這其實不能怪它,怪我自己,API格式不對。前面我填的是anthropic格式的API,而非OpenAI格式的API。
![]()
在調整API接口后,它真的能生成文章了。
![]()
平時,用慣了別人幾十上百個工程師窮究集體智慧做出來的工程化產品,總覺得不以為然,現在看到自己手搓的毛坯產品也能正常生成,這種感覺真的挺奇妙的。
就像最近張雪的采訪視頻里,有一句話讓我真的想了好幾天——程前問他初中學歷怎么就敢去干發動機?他不做任何思考就說了一句“不會就學啊”。
![]()
是啊,不會就學,不服就干,多么簡單的道理。
對于我開發這個項目也是,不會你就問AI啊,總能有結果的。
于是,后續測試過程中,陸續出現生成標題報錯、生成圖片報錯……沒關系,我們直接跟GLM-5.1聊,讓它修復。
![]()
后面,我又迭代了大半天。主要是API接口調了很久,每家云廠商甚至每個模型的格式、接口和要求都有些細微的區別。
最終看到封面圖也搞定的那一刻,我覺得這個項目成了。
![]()
再給大家看下整個的演示流程。
目前,完整項目已經開源放在了Github上,歡迎大家使用和Star。上傳Github我也比較懶,直接讓GLM-5.1幫我搞定的。
![]()
開源地址:https://github.com/lengyi2030/Auto-wechat-writing
使用方式,也很簡單。先把這個項目clone到本地,然后本地npm start,然后接入API就可以用了。
![]()
寫作這塊,文本模型推薦GPT、Qwen、DeepSeek和GLM,圖片模型推薦banana或seedream,API記得要選OpenAI標準協議的url。
我不知道,這個項目對于大家來說有沒有幫助,但對于我來說是真的受用。
后面,我還會繼續迭代風格提示詞,以及給它增加導入到公眾號后臺、配圖生成、分發插件等功能,那對于我來說就真的完全自動化了。
![]()
整個體驗下來,GLM-5.1在長程任務開發這塊還是挺強的。
我主要開發時間是在昨天。給大家看下我的真實token消耗量,這個項目一共跑了1300萬tokens。
![]()
從首次輸入需求到最后上傳Github,與CC對話了大概30多次,調試了近10個版本,最后燒掉1300萬tokens,交付了一個我覺得是非常solid的東西。
期間,還調用了檢索、代碼、測試和API等工具進行開發,也都能穩定銜接。1300萬tokens的任務開發,始終能夠能夠跟目標保持一致,并未丟失,也沒有跑偏。
看來,GLM-5.1在長程任務這塊還是有點東西的
長程任務,它不同于one shot的showcase。
one shot更多是看前端,看審美,跑出來的demo能看但不能用。而長程任務不關心你酷不酷,而是要看最終出來的東西能不能用,能不能進入生產環境。
從我的實測來看,GLM-5.1的表現是合格的。
要是能開源的話,那就更好了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.