无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

3分鐘帶你看懂大語言模型基礎知識

0
分享至

今年以來,隨著chatGPT持續火爆,“大語言模型”這個名詞頻頻出現在大家的視野。

話說回來,什么是大語言模型?它包含哪些方面?和自然語言處理有何區別?經常和大語言模型一起出現的“AIGC”又指什么?

作為這個賽道的一員,下面我將結合司普科技這些年的積累和經驗,來為大家簡單介紹下。

什么是大語言模型?

其實我們常說的大語言模型,翻譯自專業名詞:Large Language Model,簡稱:LLM。因為目前大家用到的大語言模型遠不止一個,所以我們經常還會看到它的復數形式——LLMs。

之所以被稱為大語言模型,其實很大程度上源于:它是建立在無標注文本數據上訓練的語言模型,而且參與訓練的數據集往往非常龐大。

舉個例子,此前一鳴驚人的GPT-3就訓練了1750億個參數大型語言模型。而到了GPT-4,訓練的模型參數更是達到約1.8萬億,訓練數據多達13萬億。

而大語言模型的工作原理也很簡單:主要借助深度學習機制,把海量訓練數據中的各種語言邏輯、語言組織規律有效提取出來,再借助AI算法,在實際用戶需求中,理解或生成自然語言文本。

為了保證更好的輸出質量和精度,同時避免生成內容帶有“負面色彩”,除了“預訓練語言模型”((Pretrained Language Models),往往還會用到“訓練打分模型”(Reward Model),對其進行強化學習和打分規則的微調,打分越高的,輸出效度和精度越高,也越能滿足人們的期待和偏好。

當這整套工作完成,也就有了投喂大量訓練數據后,能像人一樣,進行高水平對話或創作的人工智能應用。

布局大語言模型要做好哪些?

目前,布局大語言模型賽道的廠商不少,而且聚焦的業務面也越來越廣,但進行大語言模型的開發并不簡單。

如上面所說,大語言模型底層的運作,離不開預訓練和打分模型。其中,預訓練語言模型作為核心技術基座,要想模型擁有更強的性能,模型結構和規模、樣本數據、算力等都是關鍵性要素。

以參數規模為例,因為參與訓練的數據量,直接影響預訓練模型在下游任務中的效果,所以效果較好的大語言模型,參數規模基本超過千億級(100B)。

比如OpenAI的GPT 4參數規模約為180B,Google旗下LaMDA的參數規模約為137B,PaLM的規模約為540B,DeepMind旗下的Gogher參數規模為280B等。

而完成如此大的數據量訓練,對算力和資金的需求極大,所以目前大語言模型底層技術的開發多集中在巨頭企業之間,而大型LLM廠商單次的訓練成本可能就高達百萬甚至千萬美元。

為了推動行業發展和生態合作,很多基礎性大語言模型實行了開源,加上LangChain等LLM集成工具的出現,依然為大眾開發者在大語言模型底層之上進行各類應用的開發創造了便利。

目前,利用通用大模型搭配行業小模型,并根據不同業務場景給到相應的解決方案,是很多應用層布局者的常見做法,由此也衍生出了多模態的大語言模型應用。

大語言模型和自然語言處理有何區別?

作為人工智能技術的重要分支,自然語言處理(NLP)任務早年就火出了圈。

從表面看,大語言模型和自然語言處理都高度聚焦于“語言文本”的處理,都離不開深度學習和神經網絡的支持,兩者甚至都涉及語音識別、語音合成、語義理解、機器翻譯等方面的應用。

但大語言模型在這些領域的應用更廣,而且在上下文理解、連續對話、邏輯推理等方面比單純的自然語言處理,顯得更智能、更有優勢。

從應用看,自然語言處理主要集中于“從文本到文本的輸入輸出”,基本是一問一答式。

而大語言模型已經能實現文字、圖片、音視頻等多模態數據的輸出,對話成文、文生圖、文生視頻等都能輕松實現,人機交互面積更大,通用性也更強。

就此來說,自然語言處理很多還停留于簡單理解語言含義后進行“基礎對話”,而大語言模型已經能在掌握語言規律的基礎上“自由對話”。

所以在談論兩者時,很多人都將大語言模型稱為自然語言處理的“奇點”或“拐點”。

什么是AIGC?和大語言模型有何關系?

AIGC翻譯自專業名詞:Artificial Intelligence Generated Content,簡單來說就是“利用人工智能技術來生產內容”。目前,比較有代表性的AI生成內容,就包括文本、圖像、音頻、視頻等。

從表面來看,AIGC其實可以算是大語言模型當下最熱門的一大方向。而大語言模型的發展,正是AIGC各項應用得以高速發展的基礎和關鍵。

從技術上看,AIGC的成功,主要得益于GAN、Transformer、Diffusion、CLIP、LLM等基礎生成算法模型的不斷發展,而它的成功也在極大地推進著內容生產的自動化和智能化進程。

備注:以上首發sipu-tech,僅做分享。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

細說職場
2026-05-18 09:37:45
中東危機再不解決,印度第一個就要崩盤,首都連水電都保證不了!

中東危機再不解決,印度第一個就要崩盤,首都連水電都保證不了!

開著車去流浪
2026-05-21 23:10:09
泰國王認命了!帕公主第七份病情公告發布,最后用詞流露悲觀姿態

泰國王認命了!帕公主第七份病情公告發布,最后用詞流露悲觀姿態

看盡落塵花q
2026-05-22 08:08:53
外長王毅將赴紐約主持會議 并將應邀訪問加拿大

外長王毅將赴紐約主持會議 并將應邀訪問加拿大

看看新聞Knews
2026-05-22 16:56:58
傳統剎車用了100年,為什么突然被“干掉”了

傳統剎車用了100年,為什么突然被“干掉”了

Autolab
2026-05-19 22:25:00
41分24板3帽!21分17板4帽!NBA神級紀錄誕生,文班亞馬放下狠話

41分24板3帽!21分17板4帽!NBA神級紀錄誕生,文班亞馬放下狠話

世界體育圈
2026-05-21 18:40:56
為什么華為和蘋果的差距,越追反而越大了?背后的原因懂的人不多

為什么華為和蘋果的差距,越追反而越大了?背后的原因懂的人不多

世界圈
2026-05-15 09:20:20
被俄軍滑翔炸彈炸了兩年,烏克蘭造出了自己的“空中長臂”

被俄軍滑翔炸彈炸了兩年,烏克蘭造出了自己的“空中長臂”

子桑說
2026-05-21 14:43:57
玩家真不裝機了!4月主板銷量暴跌44%

玩家真不裝機了!4月主板銷量暴跌44%

3DM游戲
2026-05-20 17:57:07
全網瘋傳的“工齡退休”是真是假?2026退休自查表出爐,建議收藏

全網瘋傳的“工齡退休”是真是假?2026退休自查表出爐,建議收藏

記錄生活日常阿蜴
2026-05-22 14:48:14
四大衛視聯播!張嘉益羅海瓊主演,雷佳音王勁松加盟,陣容強勁

四大衛視聯播!張嘉益羅海瓊主演,雷佳音王勁松加盟,陣容強勁

樂楓電影
2026-05-22 14:06:55
張嘉益的關系戶們,誰演技最好?演技排名,姬他第七,秦海璐第二

張嘉益的關系戶們,誰演技最好?演技排名,姬他第七,秦海璐第二

DJ雅清
2026-05-20 13:25:03
數據證明:妻子失業,丈夫會養活妻子;丈夫失業,妻子會提出離婚

數據證明:妻子失業,丈夫會養活妻子;丈夫失業,妻子會提出離婚

舒山有鹿
2026-05-21 11:06:33
上海一中院一審公開宣判中國遠洋海運集團有限公司原黨組管理正職領導干部隋軍受賄、挪用公款一案

上海一中院一審公開宣判中國遠洋海運集團有限公司原黨組管理正職領導干部隋軍受賄、挪用公款一案

環球網資訊
2026-05-22 16:54:19
第一名!生肖馬,5月20日過后,5件大事降臨,貴人相助,早做準備

第一名!生肖馬,5月20日過后,5件大事降臨,貴人相助,早做準備

阿龍美食記
2026-05-18 15:18:30
生產線上87個攝像頭的全球壟斷:350億美元反壟斷大案,7名中國高管全球通緝

生產線上87個攝像頭的全球壟斷:350億美元反壟斷大案,7名中國高管全球通緝

風向觀察
2026-05-21 17:02:11
何九華官宣當爸僅1周,王鷗出手“反擊”,這下里子面子全丟了

何九華官宣當爸僅1周,王鷗出手“反擊”,這下里子面子全丟了

星星沒有你亮
2026-05-22 06:54:17
紅軍長征走后,陳毅和項英大吵一架,陳毅怒罵項英是“五心不定”

紅軍長征走后,陳毅和項英大吵一架,陳毅怒罵項英是“五心不定”

顧史
2026-05-22 11:52:59
孫東旭直播復出!大談東方甄選主播離職潮,隔空祝賀甄選店

孫東旭直播復出!大談東方甄選主播離職潮,隔空祝賀甄選店

雷科技
2026-05-21 18:39:11
聯想集團:第四財季收入216億美元創歷史新高

聯想集團:第四財季收入216億美元創歷史新高

界面新聞
2026-05-22 07:36:47
2026-05-22 17:32:49
有聊有理
有聊有理
忙里偷閑,一起聊聊2B和人生
336文章數 175關注度
往期回顧 全部

科技要聞

雷軍:輸給特斯拉不丟人

頭條要聞

家屬稱89歲母親養老院摔傷7天后離世 民政部門拒回應

頭條要聞

家屬稱89歲母親養老院摔傷7天后離世 民政部門拒回應

體育要聞

最糟糕裁判?他想要退役當市長

娛樂要聞

周也戀情曝光!對象身份不簡單

財經要聞

證監會擬對老虎、富途、長橋依法嚴厲處罰

汽車要聞

轉場視頻

態度原創

親子
數碼
藝術
旅游
手機

親子要聞

產后修復,這些運動幫你"滿血復活"!

數碼要聞

家用除濕機怎么挑?十大品牌德業Z20B3除濕機,回南天一臺頂三臺

藝術要聞

海市蜃樓水中樹

旅游要聞

“跨國串門”成日常 市南區入境游奏響國際化文旅新樂章

手機要聞

8000mAh小米最大電池!小米17 Max圖賞

無障礙瀏覽 進入關懷版