網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

5個月前他卡在"試試AI"階段，現(xiàn)在系統(tǒng)每天處理2000+請求

2026-04-14 11:01:16　來源: 我是一個粉刷匠2

北京舉報

分享至

大多數(shù)人對大語言模型的使用，停在ChatGPT對話框里。

作者去年也這樣。直到他發(fā)現(xiàn)一個規(guī)律：模型越強(qiáng)，落地越疼。上下文丟失、幻覺亂答、跟現(xiàn)有工作流打架——問題從來不在模型本身，而在包裹它的那層系統(tǒng)。

從"試試"到"上線"的斷層

技術(shù)社區(qū)有個隱形漏斗。100個人讀完LLM論文，80個會跑個Demo，20個想集成進(jìn)業(yè)務(wù)，最后能完整部署的只剩個位數(shù)。

作者最初也卡在中間層。他用GPT-4做過客服機(jī)器人，用Claude寫過代碼助手，但都是玩具——能演示，不能承壓。用戶多問兩句上下文，模型就開始胡編；接進(jìn)公司CRM，API延遲直接拖垮頁面。

他意識到自己在重復(fù)一個經(jīng)典錯誤：把LLM當(dāng)黑盒插件，而不是系統(tǒng)核心來設(shè)計。

真正的轉(zhuǎn)折點，是他關(guān)掉IDE，打開了空白文檔。

不是寫代碼，是畫架構(gòu)。數(shù)據(jù)怎么流、狀態(tài)存哪、哪步必須人工確認(rèn)、哪步可以自動化——這些決策比選模型重要十倍。

系統(tǒng)設(shè)計的三個反直覺選擇

作者最終落地的方案，做了幾個讓純AI玩家意外的取舍。

第一，主動限制模型自由度。他沒追求"通用對話"，而是把交互拆成固定步驟：意圖識別→信息提取→內(nèi)部工具調(diào)用→結(jié)果組裝。每一步輸出都有JSON Schema約束，幻覺率從不可控降到接近零。

第二，把記憶外包給傳統(tǒng)數(shù)據(jù)庫。向量數(shù)據(jù)庫只存語義索引，業(yè)務(wù)狀態(tài)全走PostgreSQL。作者的原話是：「LLM不該記住用戶上周改了什么地址，它只負(fù)責(zé)理解當(dāng)前這句話想干嘛。」

第三，預(yù)留人工介入的"逃生艙"。系統(tǒng)每步都暴露中間狀態(tài)，置信度低于閾值自動轉(zhuǎn)人工。上線第一周，人工接管率23%；兩個月后降到4%。

部署后的真實數(shù)據(jù)

這套系統(tǒng)現(xiàn)在每天處理2000+請求，平均響應(yīng)時間1.2秒。作者沒透露具體業(yè)務(wù)場景，但從架構(gòu)反推，應(yīng)該是B端流程自動化——客服、工單處理或內(nèi)部審批。

他提到一個細(xì)節(jié)：最初想用LangChain快速搭建，后來全拆了重寫。「框架幫你省三天，后期改架構(gòu)多花三個月。」

另一個教訓(xùn)是關(guān)于評估。作者花了整整兩周設(shè)計測試集，包含200+邊界case——用戶故意模糊的需求、矛盾的歷史記錄、超出系統(tǒng)能力的請求。上線后遇到的90%問題，都在這套case里預(yù)演過。

給同樣想落地的人

作者最后列了幾條實操建議，沒有一條是關(guān)于"提示詞工程"的。

先畫數(shù)據(jù)流圖，再寫代碼。如果畫不清楚，說明需求本身模糊。監(jiān)控比功能更重要——上線第一天就要能看到每一步的輸入輸出、耗時、錯誤類型。別迷信最新模型，GPT-4和Claude 3的差距，遠(yuǎn)小于"能跑通"和"能承壓"的差距。

他特別提到一個現(xiàn)象：很多團(tuán)隊把80%精力花在調(diào)模型，20%花在系統(tǒng)。結(jié)果往往是Demo驚艷，生產(chǎn)拉胯。他的比例反過來，模型選型只占兩成，架構(gòu)和工程占八成。

現(xiàn)在他的系統(tǒng)已經(jīng)穩(wěn)定運行數(shù)月。作者說最意外的反饋來自內(nèi)部同事：「用起來不像AI，像個特別聰明的同事——不會突然說胡話，也不會忘記上周聊過什么。」

如果你正在把LLM從"試試"推進(jìn)到"上線"，哪個環(huán)節(jié)卡得最久——是模型選型、架構(gòu)設(shè)計，還是內(nèi)部說服成本？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

匿名模型“大象”攪局OpenRouter：100B參數(shù)沖到熱榜第一，實測結(jié)果如何

智東西 2026-04-16 19:20:03
0 跟貼 0
我用1分鐘開發(fā)了個上線應(yīng)用，有阿里Meoo誰還學(xué)編程啊

量子位 2026-04-16 11:08:31
4 跟貼 4

萬幀實時！流式3D重建天花板，被國產(chǎn)開源模型打破了

機(jī)器之心Pro 2026-04-16 13:25:47
0 跟貼 0

挑戰(zhàn)閉源格局！騰訊混元3D 2.0開源發(fā)布，性能對標(biāo)商業(yè)級模型

鈦媒體APP 2026-04-16 16:59:20
0 跟貼 0
華為云推出“辦公蝦”：讓Agent互相辯論，還能生成可編輯PPT

智東西 2026-04-16 20:21:12
0 跟貼 0

剛剛，Claude Opus 4.7突然發(fā)布：不是最強(qiáng)，但奧特曼又得失眠

愛范兒 2026-04-17 01:35:26
0 跟貼 0

上一個兄弟離職了，我接手了他的代碼，我承認(rèn)沒憋住

環(huán)亞搞笑 2026-04-14 14:35:36
3 跟貼 3
美民主黨對防長赫格塞思發(fā)起彈劾

界面新聞 2026-04-16 07:08:40
5715 跟貼 5715

兩名外籍乘客在網(wǎng)約車上對著部隊大門連續(xù)拍照，接下來又要去訓(xùn)練場方向，司機(jī)覺得可疑，直接開車把他們交給了部隊

極目新聞 2026-04-16 08:59:25
5038 跟貼 5038
高手騎自行車上木樁，接下來的技術(shù)，直接讓人目瞪口呆！

林十六 2026-04-15 11:05:59
1 跟貼 1
2026年內(nèi)部協(xié)作工具橫評：誰在真干活誰在混

碼上閑敘 2026-04-15 19:16:45
0 跟貼 0
被美國封鎖、遭俄羅斯拒絕：中國一怒之下殺出血路，技術(shù)領(lǐng)先世界

魏叔胡侃 2026-04-14 17:21:53
0 跟貼 0
河南萬歲山武俠城演出中“大象”露出人腳，景區(qū)：沒飼養(yǎng)過大象，是4名工作人員扮的

環(huán)球網(wǎng)資訊 2026-04-16 11:29:34
2051 跟貼 2051
大批五一航班突然取消！廣東市民出行受到這些影響

南方都市報 2026-04-15 20:44:18
447 跟貼 447
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標(biāo)，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍(lán)鯨新聞 2026-04-15 09:44:24
2934 跟貼 2934
AI視頻混戰(zhàn)升級，字節(jié)在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
0 跟貼 0
Claude變蠢了，新模型發(fā)布前的黑暗時刻？

鈦媒體APP 2026-04-16 12:43:14
0 跟貼 0
與谷歌 Genie3 正面交鋒，阿里發(fā)布世界模型HappyOyster：從被動生成到主動模擬

鈦媒體APP 2026-04-16 22:40:08
0 跟貼 0
資深程序員收集錯誤，新手在刪除記錄

我是一個養(yǎng)蝦人 2026-04-16 08:55:03
0 跟貼 0
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
23款奔馳s400加裝通風(fēng)座椅怎么選？1分鐘教你選對方案

大威說改車 2026-04-15 16:14:08
5 跟貼 5
廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點才收工，發(fā)文吐槽：這個雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
1460 跟貼 1460
AI 記憶首次超越人類：幻覺率壓至 0.5%，長對話不再瞎編

鈦媒體APP 2026-04-16 10:14:16
2 跟貼 2
采用800V架構(gòu)，標(biāo)配寶華韋健，靜態(tài)體驗沃爾沃EX90

苑叔聊車官方賬號 2026-04-15 21:09:17
3 跟貼 3
確認(rèn)了！兩人系間諜

浙江之聲 2026-04-16 22:16:31
27 跟貼 27
Anthropic發(fā)布Claude Opus 4.7：金融分析能力登頂公開模型軟件工程、多模態(tài)全面進(jìn)階

財聯(lián)社 2026-04-17 01:18:06
0 跟貼 0
Claude Opus 4.7連夜突襲：或?qū)屪呷?億打工人飯碗！

新智元 2026-04-17 00:27:01
0 跟貼 0
陽臺遭飛鳥"精準(zhǔn)投糞" 住戶:每天來十多次或為挑釁貓

星視頻 2026-04-16 18:45:58
180 跟貼 180
格力怒斥海信，稱其沒資格用“真銅實料”四字進(jìn)行宣傳，海信高管回懟：又當(dāng)又立

大風(fēng)新聞 2026-04-15 15:07:03
955 跟貼 955
AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潛意識傳染

新智元 2026-04-16 18:50:56
0 跟貼 0
500美元工具卷走2000萬：FBI端掉全球最大釣魚網(wǎng)絡(luò)后，我為什么更擔(dān)心了

字節(jié)漫游指南 2026-04-16 19:50:03
0 跟貼 0
媒體：法國要"將不義之財歸還中國" 沒你想得那么容易

新民周刊 2026-04-16 15:02:54
2100 跟貼 2100
不是，怎么有模型叫“老婆們”，還能視頻通話啊？

差評XPIN 2026-04-17 00:09:07
0 跟貼 0
老板頭像在監(jiān)控里“升天”了，程序員用代碼教做人，打工人笑噴

茶余飯好 2026-04-16 12:07:39
6 跟貼 6
你藏bug的樣子，像極了愛情

我是一個粉刷匠2 2026-04-16 18:07:10
0 跟貼 0
Steam要搶SteamDB飯碗？30天價格查詢功能曝光

固件更新中 2026-04-15 12:44:46
0 跟貼 0
文章新開面館口味評分3.6分，網(wǎng)友：30多元一碗面有點貴

紅星新聞 2026-04-13 17:22:41
1249 跟貼 1249
龍蝦軍團(tuán)有了最強(qiáng)「視力」！一眼看圖直接寫代碼-1

機(jī)器之心Pro 2026-04-02 16:56:32
0 跟貼 0
組裝V8汽車發(fā)動機(jī)模型

制造科技 2026-04-16 13:26:17
0 跟貼 0
切記，半夜醒來千萬不要看時間！

環(huán)球網(wǎng)資訊 2026-04-16 07:56:25
158 跟貼 158

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

5個月前他卡在"試試AI"階段，現(xiàn)在系統(tǒng)每天處理2000+請求

從"試試"到"上線"的斷層

系統(tǒng)設(shè)計的三個反直覺選擇

部署后的真實數(shù)據(jù)

給同樣想落地的人

趙明：智駕之戰(zhàn)，看誰在大模型上更高效

美國威脅加大對伊朗制裁 伊朗回應(yīng)

美國威脅加大對伊朗制裁 伊朗回應(yīng)

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創(chuàng)始人王子杰去世，享年63歲

海爾與醫(yī)美女王互撕 換血抗衰誰的生意？

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

智能舒適 簡約風(fēng)尚

網(wǎng)傳建鄴區(qū)即將迎來大動作？多校學(xué)區(qū)要變？

人人人人！封關(guān)后首屆消博會，擠爆了！

封鎖霍爾木茲海峽后 美釋放雙重信號

美國威脅加大對伊朗制裁伊朗回應(yīng)

美國威脅加大對伊朗制裁伊朗回應(yīng)

海爾與醫(yī)美女王互撕換血抗衰誰的生意？

智能舒適簡約風(fēng)尚

封鎖霍爾木茲海峽后美釋放雙重信號