No.0294
Science Partner
Bring you to the side of science
![]()
導 讀
旻宏跟你說一個真實的荒唐事。
中部內陸一所職校,這兩年嗅到AI風口,在能源轉型綠電豐富的一個城市火速開了個幾個新專業,名字起得很氣派“人工智能技術應用“”數據科技服務”。招生老師跑進每一個可以跑進去的班級,站在講臺上說:
“同學們,AI是未來。數據是AI的糧食。現在全國缺口超過百萬,你們只要學會打標注,月薪四五千起步,穩的。”
臺下坐著一批十六七歲的孩子還有他們的父母,聽完覺得這事靠譜。反正聽起來比那些明日黃花的老專業好聽多了,名字里帶著AI,聽上去就像站在了時代正中央。
于是第一屆招滿了。
兩年后,這批孩子畢業了。
有人發現工作沒著落,托關系問了一圈,得到的答案大同小異:要么崗位縮編了,要么干脆說“現在這塊大部分交給模型自動跑了,你們來干嘛呢。”
整件事加在一起,從招生到失業,不超過三年。
一個專業的壽命,比一些網紅餐廳還短。
這個世界、當下的教育設置,到底怎么了...
走,跟伙伴君來!
今日主筆 | 旻宏
學校新開了個AI專業,第一屆學生剛畢業,崗位已經沒了
我知道您看到這里可能想說:這不就是個例嗎,哪個行業沒有這種情況?
但問題是,這還真不是個例。
這兩年,全國陸續開了幾百個類似的專業方向,名字各有變體:AI技術應用、大數據標注與處理、智能信息服務……核心內容大同小異,都在教一件事:如何給AI打工。
學生學的是框圖標注,是文本分類,是語音轉寫,是內容審核。
然后他們走出校門,信心百倍。然后,他們發現,這些工作,AI自己已經能做了。
不是做得和他們一樣好,而是做得比他們更快、更便宜、更不需要交社保。
這就是今天職業教育里,最真實、最少人愿意正面講的那個問題。
01. 你可能聽過一個詞,叫“知識蒸餾”。
如果沒聽過,旻宏幫你翻譯一下:就是用大模型來教小模型,讓小模型花更少的錢,干跟大模型差不多的活。
這本來是AI公司壓縮成本用的技術。但這幾年它被玩出了一種更激進的用法:各家公司開始直接拿競爭對手的模型輸出來當訓練數據,喂進自己的系統。
GPT的輸出喂給Llama,Llama的數據流進Gemini,GEmini的輸出再轉手可能就成了下一代產品的語料。
整個AI行業的潛規則之一就是“互抄作業”。
而抄作業最直接的結果,就是原來需要大量人工來做的“數據生產工作”,正在被這個循環越來越多地內化進去。于是,那些職校開出來的課程里,本來依賴的那層崗位需求,開始快速萎縮。
學校不是沒努力,企業也不是臨時變卦,是整個行業底層的邏輯悄悄換了,而且換得太快,沒給任何人留太多反應時間。
最慘的,是那些剛好在這個時間窗口里讀完兩年的孩子。
他們不是受害者,也談不上被誰坑了。
他們只是,趕上了一個專業的有效期比他們的學制還短的年代。
02. 好消息是蒸餾這件事也有命門
要搞清楚這件事為什么會發生,我們得先想明白一個問題:AI互相抄作業,到底會抄出什么后果?
研究人員發現,純合成數據的訓練閉環是有極限的。這個現象有個專業名詞,叫模型坍塌(Model Collapse)。
打個比方吧。你把一張高清照片復印,再把復印件復印,再復印,再復印。前幾次看不出來,但復印到二十次的時候,圖像已經模糊到認不出原來是什么了。
模型蒸餾的多代循環,本質上是同一個問題。每轉一圈,都在累積誤差。幾代之后,模型開始丟失那些只有在真實世界里才會出現的東西:文化細節、邊緣場景、人的真實判斷,以及那些很難被歸納成規律的、活生生的認知復雜性。
特斯拉前AI總監,也是OpenAI的聯合創始人之一大神Karpathy專門說過這件事。他的判斷是:純合成數據訓練出來的模型會“靜默崩潰”,質量不是一下子垮掉的,而是悄無聲息地在你看不見的地方慢慢爛掉。
你以為它還好,其實它已經爛了。
所以模型互相抄作業的盡頭,不是徹底不需要人了,而是如果沒有高質量的真實人類數據壓陣,整個鏈條最終會一起失效。
這也就是為什么,真實人類的高質量判斷,在這個時代反而更值錢,但遺憾的是,值錢的,可能不是職校在教的那種。
03. 最先被吃掉的,恰好是最多學校在教的
數據標注這門生意,過去幾年確實火過一陣。
邏輯很簡單:大模型要吃大量數據,數據要有人去分類、打標簽、做審核。于是市場上出現了很多崗位,也出現了很多培訓班、職校專業、校企合作項目。很多地方一看,這不就是新時代的就業出口嗎?
于是趕緊上馬。
這套判斷在當時不能說完全錯。問題在于,技術演進的方向,比教育系統的反應速度快得多。
現在模型已經不只是需要人打標簽,它自己也開始會打標簽、會生成候選答案、會做初步分類、會幫你篩一遍數據。更重要的是,行業正在從低成本人工堆量轉向高質量人類校準。換句話說,AI并不是把人徹底踢出去,而是把人從勞動密集型那一層往上推了一層。
可職業教育最難受的地方就在這兒:它最容易批量培養的,恰恰是最容易被替代的那一層,就比如我們提到那家設在綠電替代火電城市的職校。
這就很尷尬了。
學校教學生怎么框圖、怎么分類、怎么轉寫、怎么做基礎審核;但行業真正缺的,慢慢變成了懂業務、會判斷、能質檢、能仲裁的人。
一個是操作員,一個是把關人。這中間隔著一條很寬的河。
04. Scale AI為什么還值138億?
說到這里不得不提一個人:Alexandr Wang,華裔,1997年生,19歲創業,做的就是數據標注生意,公司叫Scale AI,估值一度高達138億美元,后來還拿到了美國國防部的AI合同。
很多人聽到這里會困惑:這行不是要完了嗎,他怎么還能值這個數?
原因在于,大多數人誤解了Scale AI賣的是什么。
它賣的不是便宜的人力,而是一套數據工程體系——如何組織一條高質量的標注管道,如何做質量控制,如何讓數據和模型訓練形成真正的閉環,如何持續更新評測集和對齊反饋。
蒸餾時代,這套東西的價值反而在漲。
因為整個蒸餾鏈條需要一個錨,那些被反復驗證、質量可靠、能防止模型漂移的高質量人類數據,是整個體系不塌的地基。沒有這個錨,合成數據訓出來的模型就是那張被復印了二十次的照片。
所以到今天,行業里的共識是這樣的:合成數據管規模,人類標注管質量。兩者不是你死我活,是分工配合。
05. 職校這次撞上的,不只是行業變化
說到這里,問題就不只是“數據標注行業會不會被替代”了,而是更扎心一點:
職校到底是在培養一個學生,還是在押注一個崗位?
這兩者差別很大。
培養學生,意味著你面對的是長期穩定的技能需求輸出。押注崗位,意味著你默認這個崗位在未來幾年里還會存在,而且數量還不少。
問題在于,很多職業教育機構的邏輯,其實更接近后者。
他們不是先研究未來三年的行業結構,再去設計課程;而是先看到一個崗位熱了、企業招人了、市場缺口大了,然后迅速把課程開出來。動作快的時候,確實能吃到紅利。可一旦行業變向,學校就會比公司更被動。
公司不行,可以裁。學校不行,往往只能拖。而學生是最被動的那個。
他花了兩年時間,學了一套當時看起來很對的技能,最后發現這個技能還沒來得及成為自己的飯碗,就先變成了行業過渡期的臨時工具。
學生們這種落差,和實實在在搭進去的時間,才是最傷人的。
因為它不是“你不努力”,也不是“你學不會”,而是你認真學了,最后發現課程本身押錯了方向。
最后問一個真問題:當下職業教育最該重新思考的地方是什么
過去,很多職校強調的是上手快、能就業、證書好拿。這當然沒錯,但前提是市場對基礎操作工的需求足夠大。
可現在不一樣了。
AI把很多基礎活兒做掉之后,真正留下來的,是更靠近判斷、質檢、仲裁、反饋、行業知識的工作。未來更值錢的,不是“會不會按流程做”,而是“你知不知道這一步為什么要這么做”。
這對學校來說,意味著課程必須升級:不能只教工具,要教方法;不能只教操作,要教理解;不能只教一個固定崗位,要教學生如何在崗位變化之后繼續活下去。
真正好的職業教育,不是給學生一張通往某個工位的門票,而是給他一套在崗位變化后還能重新站穩的能力。
這才是關鍵!
我是旻宏,咱們下期見~
本文僅作科普分享使用,歡迎小伙伴們點、收藏、關注,以備不時之需,當然更歡迎您把 介紹給周邊可能需要的更多伙伴們呀。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.