TALK
前幾天,我在新華社做了場兩小時的內部分享,聊了許多東西
結束后跟新華社的朋友聊,覺得「大模型的原理和用法」的這部分內容對很多人都有用,今天就把這些東西貼出來,每頁配一段說明
![]()
![]()
整場分享中,我都在圍繞一個詞展開論述:上下文
AI 的能力、問題和用法,本質都由上下文決定。用戶發一條請求,AI 把請求和它能拿到的所有材料拼在一起,組成一段完整的上下文,再往下生成結果...循環往復
大模型之所以神奇、為什么有時候不靠譜、以及怎么能用好,都依賴于對上下文的構建
![]()
大模型在進行內容生成的原理,其實很簡單:大模型會根據上文信息,不斷推測下一組文字最大概率是什么,而這組文字,就叫做 token,他可以是一個字、一個詞或者一些信息
這里我來舉一個例子:「今天北京的天氣很」后面接什么?
首先,模型給出四個候選詞,「好」42%,「熱」25%,「冷」18%,「亂」6%;接著模型會選中概率最高的「好」,放回上下文,繼續猜下一個...循環往復
這個循環在大模型生成的過程中不斷重復:給定上下文,預測概率,選中結果,放回上下文,重復生成...不管參數多大,模型都在做這一件事
![]()
ChatBot 和周報生成器看起來是兩種產品,底層流程完全一樣
系統預設一段上文(提示詞、歷史對話、頁面模板),加上用戶輸入,交給模型接龍,最后把結果填回界面
記住:無論 UI 是聊天框還是報表,內核跑的都是同一套「預設上文 + 用戶輸入 + 模型生成」
![]()
Agent 和 ChatBot 的區別在一件事上:誰來構建上下文
ChatBot 靠人喂,你給它什么材料它就用什么材料
Agent 會自己搜網頁、讀文檔、調工具,把有用的內容寫進上下文,發現不夠還會自動回頭繼續找
![]()
上下文的來源,包括以下
第一種是參數記憶,也就是模型訓練時讀過的海量內容,被壓縮進了模型權重里,這是廣義上的上下文
第二種是手動構建,人把 Word、Excel、提示詞這些材料喂進去
第三種是自動構建,AI 通過各種工具調用,自己聯網搜索、查知識庫、調接口
判斷一個 AI 工具好不好用,看它構建上下文的能力就夠了
![]()
我們設想一下,如果讓 AI 給出某政策文件第 18 條原文,但模型訓練的時候又沒有訓練到,那么會發生什么?
參數里沒有這條原文,上下文里也沒有,但它被要求必須給答案。于是模型從幾個看起來合理的候選里猜了一個,輸出的東西形式上很像真的,但可能是錯的。這就是幻覺的產生過程
上下文越好,幻覺越少,但不會是零
![]()
現在的 AI,能夠做很多的事情,包括翻譯、校對、改寫、摘要、首稿、資料整理在內的很多工作,都能夠很好的被解決。這時候你能發現一個共通點:AI 能做好的工作,其背后的素材都能被準確表達成一段上下文
但是哪些事情是 AI 做不到的呢?到現場、觀察細節、判斷真偽、決定選題、承擔責任...,這些做不到。
怎么判斷一件事交給 AI 合不合適?看它能不能被準確表達成一段好的上下文
![]()
對于大家來說,尤其是媒體工作者來說,在使用 AI 的過程中,我有三條落地建議:
跟蹤 AI 進展:盯模型官方、開發者社區和可信媒體,每周固定 30 分鐘夠了。
自己上手:給夠上下文(任務、材料、輸出格式),別糾結提示詞話術
恪守紅線:事實、引語、數據、法條必須人工核驗,敏感信息不喂外部模型,重要稿件必須人審
![]()
在 AI 的加持下,內容生產的方法也要跟進時代,也要有所恪守:不要拒絕使用 AI,但也不要盲目使用,更不要去制作賽博垃圾
過去,媒體是主要自己寫內容,而未來越來越多是在為 AI 提供準確的上下文
媒體要承擔的,是去現場是在拿最稀缺的上下文,做采訪是在拿別人拿不到的上下文,看材料是在篩選上下文,做判斷是在組織上下文
AI 是需要被喂養的系統,喂什么,決定它吐什么
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.