No.0294
Science Partner
Bring you to the side of science
![]()
導(dǎo) 讀
旻宏跟你說一個(gè)真實(shí)的荒唐事。
中部?jī)?nèi)陸一所職校,這兩年嗅到AI風(fēng)口,在能源轉(zhuǎn)型綠電豐富的一個(gè)城市火速開了個(gè)幾個(gè)新專業(yè),名字起得很氣派“人工智能技術(shù)應(yīng)用“”數(shù)據(jù)科技服務(wù)”。招生老師跑進(jìn)每一個(gè)可以跑進(jìn)去的班級(jí),站在講臺(tái)上說:
“同學(xué)們,AI是未來。數(shù)據(jù)是AI的糧食。現(xiàn)在全國(guó)缺口超過百萬,你們只要學(xué)會(huì)打標(biāo)注,月薪四五千起步,穩(wěn)的。”
臺(tái)下坐著一批十六七歲的孩子還有他們的父母,聽完覺得這事靠譜。反正聽起來比那些明日黃花的老專業(yè)好聽多了,名字里帶著AI,聽上去就像站在了時(shí)代正中央。
于是第一屆招滿了。
兩年后,這批孩子畢業(yè)了。
有人發(fā)現(xiàn)工作沒著落,托關(guān)系問了一圈,得到的答案大同小異:要么崗位縮編了,要么干脆說“現(xiàn)在這塊大部分交給模型自動(dòng)跑了,你們來干嘛呢。”
整件事加在一起,從招生到失業(yè),不超過三年。
一個(gè)專業(yè)的壽命,比一些網(wǎng)紅餐廳還短。
這個(gè)世界、當(dāng)下的教育設(shè)置,到底怎么了...
走,跟伙伴君來!
今日主筆 | 旻宏
學(xué)校新開了個(gè)AI專業(yè),第一屆學(xué)生剛畢業(yè),崗位已經(jīng)沒了
我知道您看到這里可能想說:這不就是個(gè)例嗎,哪個(gè)行業(yè)沒有這種情況?
但問題是,這還真不是個(gè)例。
這兩年,全國(guó)陸續(xù)開了幾百個(gè)類似的專業(yè)方向,名字各有變體:AI技術(shù)應(yīng)用、大數(shù)據(jù)標(biāo)注與處理、智能信息服務(wù)……核心內(nèi)容大同小異,都在教一件事:如何給AI打工。
學(xué)生學(xué)的是框圖標(biāo)注,是文本分類,是語音轉(zhuǎn)寫,是內(nèi)容審核。
然后他們走出校門,信心百倍。然后,他們發(fā)現(xiàn),這些工作,AI自己已經(jīng)能做了。
不是做得和他們一樣好,而是做得比他們更快、更便宜、更不需要交社保。
這就是今天職業(yè)教育里,最真實(shí)、最少人愿意正面講的那個(gè)問題。
01. 你可能聽過一個(gè)詞,叫“知識(shí)蒸餾”。
如果沒聽過,旻宏幫你翻譯一下:就是用大模型來教小模型,讓小模型花更少的錢,干跟大模型差不多的活。
這本來是AI公司壓縮成本用的技術(shù)。但這幾年它被玩出了一種更激進(jìn)的用法:各家公司開始直接拿競(jìng)爭(zhēng)對(duì)手的模型輸出來當(dāng)訓(xùn)練數(shù)據(jù),喂進(jìn)自己的系統(tǒng)。
GPT的輸出喂給Llama,Llama的數(shù)據(jù)流進(jìn)Gemini,GEmini的輸出再轉(zhuǎn)手可能就成了下一代產(chǎn)品的語料。
整個(gè)AI行業(yè)的潛規(guī)則之一就是“互抄作業(yè)”。
而抄作業(yè)最直接的結(jié)果,就是原來需要大量人工來做的“數(shù)據(jù)生產(chǎn)工作”,正在被這個(gè)循環(huán)越來越多地內(nèi)化進(jìn)去。于是,那些職校開出來的課程里,本來依賴的那層崗位需求,開始快速萎縮。
學(xué)校不是沒努力,企業(yè)也不是臨時(shí)變卦,是整個(gè)行業(yè)底層的邏輯悄悄換了,而且換得太快,沒給任何人留太多反應(yīng)時(shí)間。
最慘的,是那些剛好在這個(gè)時(shí)間窗口里讀完兩年的孩子。
他們不是受害者,也談不上被誰坑了。
他們只是,趕上了一個(gè)專業(yè)的有效期比他們的學(xué)制還短的年代。
02. 好消息是蒸餾這件事也有命門
要搞清楚這件事為什么會(huì)發(fā)生,我們得先想明白一個(gè)問題:AI互相抄作業(yè),到底會(huì)抄出什么后果?
研究人員發(fā)現(xiàn),純合成數(shù)據(jù)的訓(xùn)練閉環(huán)是有極限的。這個(gè)現(xiàn)象有個(gè)專業(yè)名詞,叫模型坍塌(Model Collapse)。
打個(gè)比方吧。你把一張高清照片復(fù)印,再把復(fù)印件復(fù)印,再?gòu)?fù)印,再?gòu)?fù)印。前幾次看不出來,但復(fù)印到二十次的時(shí)候,圖像已經(jīng)模糊到認(rèn)不出原來是什么了。
模型蒸餾的多代循環(huán),本質(zhì)上是同一個(gè)問題。每轉(zhuǎn)一圈,都在累積誤差。幾代之后,模型開始丟失那些只有在真實(shí)世界里才會(huì)出現(xiàn)的東西:文化細(xì)節(jié)、邊緣場(chǎng)景、人的真實(shí)判斷,以及那些很難被歸納成規(guī)律的、活生生的認(rèn)知復(fù)雜性。
特斯拉前AI總監(jiān),也是OpenAI的聯(lián)合創(chuàng)始人之一大神Karpathy專門說過這件事。他的判斷是:純合成數(shù)據(jù)訓(xùn)練出來的模型會(huì)“靜默崩潰”,質(zhì)量不是一下子垮掉的,而是悄無聲息地在你看不見的地方慢慢爛掉。
你以為它還好,其實(shí)它已經(jīng)爛了。
所以模型互相抄作業(yè)的盡頭,不是徹底不需要人了,而是如果沒有高質(zhì)量的真實(shí)人類數(shù)據(jù)壓陣,整個(gè)鏈條最終會(huì)一起失效。
這也就是為什么,真實(shí)人類的高質(zhì)量判斷,在這個(gè)時(shí)代反而更值錢,但遺憾的是,值錢的,可能不是職校在教的那種。
03. 最先被吃掉的,恰好是最多學(xué)校在教的
數(shù)據(jù)標(biāo)注這門生意,過去幾年確實(shí)火過一陣。
邏輯很簡(jiǎn)單:大模型要吃大量數(shù)據(jù),數(shù)據(jù)要有人去分類、打標(biāo)簽、做審核。于是市場(chǎng)上出現(xiàn)了很多崗位,也出現(xiàn)了很多培訓(xùn)班、職校專業(yè)、校企合作項(xiàng)目。很多地方一看,這不就是新時(shí)代的就業(yè)出口嗎?
于是趕緊上馬。
這套判斷在當(dāng)時(shí)不能說完全錯(cuò)。問題在于,技術(shù)演進(jìn)的方向,比教育系統(tǒng)的反應(yīng)速度快得多。
現(xiàn)在模型已經(jīng)不只是需要人打標(biāo)簽,它自己也開始會(huì)打標(biāo)簽、會(huì)生成候選答案、會(huì)做初步分類、會(huì)幫你篩一遍數(shù)據(jù)。更重要的是,行業(yè)正在從低成本人工堆量轉(zhuǎn)向高質(zhì)量人類校準(zhǔn)。換句話說,AI并不是把人徹底踢出去,而是把人從勞動(dòng)密集型那一層往上推了一層。
可職業(yè)教育最難受的地方就在這兒:它最容易批量培養(yǎng)的,恰恰是最容易被替代的那一層,就比如我們提到那家設(shè)在綠電替代火電城市的職校。
這就很尷尬了。
學(xué)校教學(xué)生怎么框圖、怎么分類、怎么轉(zhuǎn)寫、怎么做基礎(chǔ)審核;但行業(yè)真正缺的,慢慢變成了懂業(yè)務(wù)、會(huì)判斷、能質(zhì)檢、能仲裁的人。
一個(gè)是操作員,一個(gè)是把關(guān)人。這中間隔著一條很寬的河。
04. Scale AI為什么還值138億?
說到這里不得不提一個(gè)人:Alexandr Wang,華裔,1997年生,19歲創(chuàng)業(yè),做的就是數(shù)據(jù)標(biāo)注生意,公司叫Scale AI,估值一度高達(dá)138億美元,后來還拿到了美國(guó)國(guó)防部的AI合同。
很多人聽到這里會(huì)困惑:這行不是要完了嗎,他怎么還能值這個(gè)數(shù)?
原因在于,大多數(shù)人誤解了Scale AI賣的是什么。
它賣的不是便宜的人力,而是一套數(shù)據(jù)工程體系——如何組織一條高質(zhì)量的標(biāo)注管道,如何做質(zhì)量控制,如何讓數(shù)據(jù)和模型訓(xùn)練形成真正的閉環(huán),如何持續(xù)更新評(píng)測(cè)集和對(duì)齊反饋。
蒸餾時(shí)代,這套東西的價(jià)值反而在漲。
因?yàn)檎麄€(gè)蒸餾鏈條需要一個(gè)錨,那些被反復(fù)驗(yàn)證、質(zhì)量可靠、能防止模型漂移的高質(zhì)量人類數(shù)據(jù),是整個(gè)體系不塌的地基。沒有這個(gè)錨,合成數(shù)據(jù)訓(xùn)出來的模型就是那張被復(fù)印了二十次的照片。
所以到今天,行業(yè)里的共識(shí)是這樣的:合成數(shù)據(jù)管規(guī)模,人類標(biāo)注管質(zhì)量。兩者不是你死我活,是分工配合。
05. 職校這次撞上的,不只是行業(yè)變化
說到這里,問題就不只是“數(shù)據(jù)標(biāo)注行業(yè)會(huì)不會(huì)被替代”了,而是更扎心一點(diǎn):
職校到底是在培養(yǎng)一個(gè)學(xué)生,還是在押注一個(gè)崗位?
這兩者差別很大。
培養(yǎng)學(xué)生,意味著你面對(duì)的是長(zhǎng)期穩(wěn)定的技能需求輸出。押注崗位,意味著你默認(rèn)這個(gè)崗位在未來幾年里還會(huì)存在,而且數(shù)量還不少。
問題在于,很多職業(yè)教育機(jī)構(gòu)的邏輯,其實(shí)更接近后者。
他們不是先研究未來三年的行業(yè)結(jié)構(gòu),再去設(shè)計(jì)課程;而是先看到一個(gè)崗位熱了、企業(yè)招人了、市場(chǎng)缺口大了,然后迅速把課程開出來。動(dòng)作快的時(shí)候,確實(shí)能吃到紅利。可一旦行業(yè)變向,學(xué)校就會(huì)比公司更被動(dòng)。
公司不行,可以裁。學(xué)校不行,往往只能拖。而學(xué)生是最被動(dòng)的那個(gè)。
他花了兩年時(shí)間,學(xué)了一套當(dāng)時(shí)看起來很對(duì)的技能,最后發(fā)現(xiàn)這個(gè)技能還沒來得及成為自己的飯碗,就先變成了行業(yè)過渡期的臨時(shí)工具。
學(xué)生們這種落差,和實(shí)實(shí)在在搭進(jìn)去的時(shí)間,才是最傷人的。
因?yàn)樗皇恰澳悴慌Α保膊皇恰澳銓W(xué)不會(huì)”,而是你認(rèn)真學(xué)了,最后發(fā)現(xiàn)課程本身押錯(cuò)了方向。
最后問一個(gè)真問題:當(dāng)下職業(yè)教育最該重新思考的地方是什么
過去,很多職校強(qiáng)調(diào)的是上手快、能就業(yè)、證書好拿。這當(dāng)然沒錯(cuò),但前提是市場(chǎng)對(duì)基礎(chǔ)操作工的需求足夠大。
可現(xiàn)在不一樣了。
AI把很多基礎(chǔ)活兒做掉之后,真正留下來的,是更靠近判斷、質(zhì)檢、仲裁、反饋、行業(yè)知識(shí)的工作。未來更值錢的,不是“會(huì)不會(huì)按流程做”,而是“你知不知道這一步為什么要這么做”。
這對(duì)學(xué)校來說,意味著課程必須升級(jí):不能只教工具,要教方法;不能只教操作,要教理解;不能只教一個(gè)固定崗位,要教學(xué)生如何在崗位變化之后繼續(xù)活下去。
真正好的職業(yè)教育,不是給學(xué)生一張通往某個(gè)工位的門票,而是給他一套在崗位變化后還能重新站穩(wěn)的能力。
這才是關(guān)鍵!
我是旻宏,咱們下期見~
本文僅作科普分享使用,歡迎小伙伴們點(diǎn)、收藏、關(guān)注,以備不時(shí)之需,當(dāng)然更歡迎您把 介紹給周邊可能需要的更多伙伴們呀。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.