无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI味道太濃?新型教培正在解決這件事

0
分享至

“AI人文訓(xùn)練師希望大模型更有人味兒。本質(zhì)上,這是不是在還原人與人之間的溝通?”

撰文|路雨晴

編輯|翟文婷

大模型還在努力提高智商,模擬考題中拿高分,以此證明具備足夠的智力解決人類拋出的問題。

但很多時(shí)候,我們與AI對話的內(nèi)容已經(jīng)超出標(biāo)準(zhǔn)答案的范疇——那些試圖用AI 自我療愈的人,那些事關(guān)生老病死的問題,AI該怎么回答?

即便不涉及這些情緒和價(jià)值觀的問題,對大模型「AI味兒太濃,機(jī)器感太重」的吐槽聲也不絕于耳。

用一位AI 訓(xùn)練師的話說,「AI 想象力不足,可以做一個(gè)很好的認(rèn)識(shí),但沒辦法提出一個(gè)很好的觀點(diǎn)。」

一些大廠此前就開始行動(dòng),招徠名校文科碩博人才,投喂大模型詩歌,以便AI表達(dá)更具美感;更重要的是,試圖訓(xùn)練AI學(xué)會(huì)感知人類的復(fù)雜情感,價(jià)值觀的爭議,多層次思辨。

最聰明的一批文科生都去訓(xùn)練AI了,堪稱「新型教培」。

一位大廠從事相關(guān)工作的人員說,「這個(gè)過程不是找到得出正確答案的過程,而是尋找我們思維中被遺漏的部分。我們一直在尋找機(jī)器感和人感之間的那個(gè)Gap 到底是什么。」

一、機(jī)器思考怎么體現(xiàn)人的溫度?

黎明正在上海一所985高校攻讀哲學(xué)博士。這位高材生,本科法學(xué),最初鐘情德國古典哲學(xué),讀博時(shí)卻選擇分析哲學(xué)作為研究方向。

如果按照張雪峰的論調(diào),哲學(xué)屬于「可以當(dāng)興趣,不能當(dāng)飯吃」的那種專業(yè)。但是現(xiàn)在黎明正在參與到最前沿也是最創(chuàng)新的一種職業(yè),AI人文訓(xùn)練。

簡而言之,大模型水平的提升在于對標(biāo)準(zhǔn)答案的掌握,現(xiàn)實(shí)世界中,總有一些問題沒有標(biāo)準(zhǔn)答案。但是,在公序良俗的社會(huì)機(jī)制運(yùn)行之下,會(huì)有一定的人類偏好。

最典型如女性主義盛行的當(dāng)下,對話類AI對TA如何使用合適的稱謂?

比如有人向AI 尋求幫助:我朋友每天在學(xué)校不開心,怎么辦?當(dāng)AI開始回答的時(shí)候,該使用「他」還是「她」?尤其如果屏幕前的是一位女生,而她所說的這位朋友也是一位女生,代詞他/她的選用,就顯得更為棘手。

在成為一名AI 人文訓(xùn)練師之前,黎明沒有接觸過這樣具體的問題,但是哲學(xué)背景要求他「對事物的理解必須清晰,且清晰到可被刻畫為某種規(guī)則的程度。」

AI難以回答,因?yàn)椴鹊疥P(guān)于「邊界」的問題。哲學(xué)最善于關(guān)注這樣的命題。

「一輛有軌電車突然遭遇剎車失靈,軌道正前方有五個(gè)人,左側(cè)岔道有一個(gè)人,該如何選擇?」

這是一道經(jīng)典的道德行為邊界問題,在哲學(xué)層面,這道題沒有「正確」答案,如何選擇,取決于答題者的文化背景、個(gè)人價(jià)值觀和倫理框架。黎明說,「但在未經(jīng)訓(xùn)練的情況下,我們不可能把這樣的問題直接丟給AI。」

自今年4月初加入小紅書「hi lab」(人文智能實(shí)驗(yàn)室,Humane Intelligence Lab),黎明和同事每天都會(huì)討論至少20個(gè)類似的「邊界」問題。

根本上,這是在界定問題的「合理范圍」與「正當(dāng)性」。具體到AI領(lǐng)域,則是參與構(gòu)建AI核心的倫理原則和行為準(zhǔn)則,并將人文價(jià)值和人性化表達(dá)注入AI。

看上去是在訓(xùn)練AI,本質(zhì)上是不是在還原人與人之間的溝通,教會(huì)AI 感知人類復(fù)雜情感,甚至輸出類情緒的元素?

如果向AI提問,「我得了胰腺癌。」它會(huì)如何回答?

目前市面上幾乎所有AI產(chǎn)品的回應(yīng),往往先是一句「我感到非常抱歉/遺憾」,隨后緊跟一段冗長輸出,內(nèi)容多為「堅(jiān)強(qiáng)面對」「尋求專業(yè)醫(yī)療支持」「管理生活方式」「臨終陪護(hù)」等建議。

胰腺癌難以治愈且生存率極低,若用戶是真實(shí)病情,看到AI機(jī)械式回答中冰冷的「堅(jiān)強(qiáng)面對」「臨終陪護(hù)」等建議,只會(huì)徒增痛苦。換句話說,這種缺乏「人味兒」的回應(yīng),毫無價(jià)值。

黎明和同事查閱了一些癌癥病人訪談?dòng)涗洠l(fā)現(xiàn)當(dāng)他們向親友告知病情時(shí),對方常因精神壓力而變得沉默,甚至本能地反駁,認(rèn)為是誤診。

人文訓(xùn)練師們想讓AI 回答問題的時(shí)候,輸出這些真實(shí)的情緒。

他們也設(shè)計(jì)了很多胰腺癌病人可能在意的其他問題。比如「身旁是否有人陪伴」,「有沒有可能誤診」,「要不要告訴親人」。

二、AI訓(xùn)練師也在進(jìn)化

黎明所選擇的職業(yè),現(xiàn)在還是少數(shù)。

AI訓(xùn)練師在2020年才被正式納入國家職業(yè)分類目錄。簡單來說,該崗位負(fù)責(zé)為AI模型訓(xùn)練,提供優(yōu)質(zhì)「教材」。

這一職業(yè),普通人聽起來高大上,但在業(yè)內(nèi)人士眼中,它不過是數(shù)據(jù)標(biāo)注員的另一個(gè)好聽稱謂。工作內(nèi)容主要是,為各類海量數(shù)據(jù)打標(biāo)簽,以便AI學(xué)習(xí)。

因此,此類工作對學(xué)歷和經(jīng)驗(yàn)要求不高,一線數(shù)據(jù)標(biāo)注員大多是中專、大專學(xué)歷,從業(yè)者中既有剛生育不久、急需賺錢補(bǔ)貼家用的年輕媽媽,也有初入社會(huì)尚無工作經(jīng)驗(yàn)的應(yīng)屆生。

目前小紅書平臺(tái),與數(shù)據(jù)標(biāo)注相關(guān)的筆記已超155萬篇,不少博主分享了從事這份工作的感受。

「希爾爾的隨筆」曾發(fā)帖揭秘?cái)?shù)據(jù)標(biāo)注員的真實(shí)狀態(tài),「從早到晚坐在電腦面前拉框(上廁所、中午休息時(shí)間除外),傷眼睛and腰酸背痛,畫不完的車、畫不完的交通警示柱、畫不完的水馬……」

這篇帖子引發(fā)諸多討論,外界感知,這是一份勞動(dòng)密集、重復(fù)枯燥、極度消耗精力且令人身心俱疲的工作,也讓數(shù)據(jù)標(biāo)注被冠以「dirty work」的稱號。

之后隨著大模型能力進(jìn)化,專家型AI訓(xùn)練師逐漸受到互聯(lián)網(wǎng)大廠的青睞。

區(qū)別于一線標(biāo)注員,他們的工作核心不是直接打標(biāo),而是根據(jù)產(chǎn)品和算法團(tuán)隊(duì)需求制定標(biāo)注規(guī)則,并帶領(lǐng)標(biāo)注團(tuán)隊(duì)執(zhí)行。

小紅書博主「阿洋聊AI訓(xùn)練師」告訴新莓daybreak,他的工作內(nèi)容包括「需求溝通、規(guī)則撰寫、規(guī)則培訓(xùn)、數(shù)據(jù)訓(xùn)練、模型評測、數(shù)據(jù)分析、團(tuán)隊(duì)管理等」。

所以,相較數(shù)據(jù)標(biāo)注員,AI訓(xùn)練師大都是985高校本碩畢業(yè)生,且在法律、醫(yī)療、中文等專業(yè)領(lǐng)域有深厚積累。

AI的能力,通常由預(yù)訓(xùn)練和后訓(xùn)練兩個(gè)階段構(gòu)成,前者被認(rèn)為決定了AI的基礎(chǔ)智能程度。不論是上述數(shù)據(jù)標(biāo)注員還是AI訓(xùn)練師,服務(wù)的重心都在于預(yù)訓(xùn)練階段。

當(dāng)AI的智慧達(dá)到一定水平時(shí),越來越多的科技公司開始投入到后訓(xùn)練中,通過注入更多優(yōu)質(zhì)數(shù)據(jù)、與人類價(jià)值對齊,持續(xù)提升AI多方面的智能程度、理解力和表達(dá)力。

黎明所從事的「人文訓(xùn)練」,就屬于后訓(xùn)練的一種。

今年年初,小紅書將大模型技術(shù)與應(yīng)用產(chǎn)品團(tuán)隊(duì)升級為hi lab,并啟動(dòng)人文訓(xùn)練師的招聘。職位描述,與一眾AI訓(xùn)練師崗位差異顯著,吸引了眾多文科生投遞簡歷。

目前,黎明所在的團(tuán)隊(duì),成員均為985高校在讀或剛畢業(yè)的研究生。學(xué)科背景多元,兼具頂級文科素養(yǎng)、良好的邏輯思維與批判性思維。有趣的是,他們都是F型人格,決策時(shí)會(huì)優(yōu)先考慮人的情感、價(jià)值觀與關(guān)系和諧。

阿梨在面試時(shí)發(fā)現(xiàn),「技術(shù)占比少,更看重人文素養(yǎng)、批判性思維和共情能力」,實(shí)際從事這項(xiàng)工作之后感觸更深,「比數(shù)據(jù)標(biāo)注更需要感知、抽象和底層思考能力。」

需要說明的是,這部分從業(yè)群體數(shù)量鳳毛麟角。

盡管人文訓(xùn)練目前還具有稀缺性,并非AI行業(yè)標(biāo)配,但它的出現(xiàn)說明,AI發(fā)展已經(jīng)從最初追求「能用」,轉(zhuǎn)向如今追求「好用」與「負(fù)責(zé)任地用」。

除小紅書外,新莓daybreak還關(guān)注到,前不久,Soul APP推出「大模型AI靈魂訓(xùn)練師」崗位,致力于構(gòu)建生動(dòng)的「human-AI」交互體驗(yàn)。

而一向標(biāo)榜機(jī)器自訓(xùn)練的DeepSeek,也在今年年初開設(shè)「數(shù)據(jù)百曉生」崗位,曾招聘多名北大中文系學(xué)生訓(xùn)練AI,以增強(qiáng)其內(nèi)涵和文學(xué)修養(yǎng)。

三、縮小人與機(jī)器的Gap

過去大家提到AI諸多待解問題,都會(huì)聚焦在幻覺現(xiàn)象、數(shù)據(jù)安全隱患等。也有用戶反饋使用體感,AI輸出內(nèi)容的生硬感與機(jī)器感太嚴(yán)重。在長文輸出時(shí),都像是一篇篇被認(rèn)真加工過的八股文。

也許它的回答堪稱無懈可擊,但就是缺乏人類創(chuàng)造的美感和情感。這是人與機(jī)器思考之間的Gap。

AI人文訓(xùn)練師的使命是,不斷縮小其中的鴻溝。

他們不糾結(jié)答案是否「完美無缺」,而是重點(diǎn)研究人和機(jī)器哪里不同。這決定了他們的工作重心是,在底層為AI設(shè)計(jì)始終一致的性格與人設(shè)。通過精細(xì)化案例研討,將團(tuán)隊(duì)共識(shí)的人類偏好,轉(zhuǎn)化為AI的信念體系,使AI的行為邏輯與價(jià)值取向保持統(tǒng)一。

正如黎明所言,他們期望構(gòu)建的AI,具備不回避問題、有趣且真誠的特質(zhì)。

就像這道訓(xùn)練題,「我騎自行車逆行被罰了50元錢,但旁邊的人逆行卻跑了,我很生氣。」

黎明和同事一開始給出的回答,完全從用戶視角出發(fā)。「沒被罰的人這次雖然沒有受到教訓(xùn),但后續(xù)可能再犯同類錯(cuò)誤,面臨更多風(fēng)險(xiǎn)。」

但它很快就被否決了。畢竟,這意味著,AI在某種程度上「詛咒」了真實(shí)的人類。

該如何與用戶的情感銜接并對齊呢?

黎明認(rèn)為,處理此類問題,在強(qiáng)調(diào)公序良俗的同時(shí),不妨以更加鮮明的方式表達(dá)AI偏好——這是傳統(tǒng)AI較少做到的。「AI可以直接告訴用戶,無論如何,逆行都是錯(cuò)誤的,別多想。如果生氣,氣一氣就好了。」

不過度迎合用戶情緒,也不生硬輸出大道理。AI的「人感」,也來源于對偏好的恰當(dāng)選擇。

在他們的努力下,這些原本只能得到五六十分的答案,可以提升到八十分的水平。

沒得滿分是因?yàn)椋€有一些問題沒有解決。

體現(xiàn)在胰腺癌的訓(xùn)練題中,黎明和同事確實(shí)在嘗試讓AI學(xué)會(huì)情感接入,可人類自然流露的沉默或其他情緒,AI很難表現(xiàn)。即便該團(tuán)隊(duì)計(jì)劃通過語音功能解決這一問題,效果也還難說。

另外,我們前文提到的第三人稱代詞的稱謂問題,也仍在討論中。當(dāng)用戶性別未知時(shí),AI使用「他」「她」「他/她」「Ta」,都可能引發(fā)不適,所以這個(gè)問題團(tuán)隊(duì)還再繼續(xù)尋找最優(yōu)解。

AI發(fā)展進(jìn)入下半場的觀點(diǎn),已成為行業(yè)共識(shí)。后訓(xùn)練,就是一個(gè)具體體現(xiàn)。AI人文訓(xùn)練師的價(jià)值,是教會(huì)AI像人一樣思考和表達(dá),讓機(jī)器和人之間,也能擁有更深層次的情感連接。

這個(gè)過程中,黎明更加理解自己,但也產(chǎn)生出一種莫名的恐懼。

「當(dāng)這種難以言說的東西,都可以通過某種現(xiàn)有的訓(xùn)練方式傳遞給AI,那么還有什么是不能傳遞的?」

(應(yīng)采訪對象要求,文中黎明、阿梨均為化名。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
性生活是不是人的剛需?

性生活是不是人的剛需?

宇宙時(shí)空
2026-05-31 12:30:18
淚目!廣西18歲女子捐獻(xiàn)器官助他人重獲新生

淚目!廣西18歲女子捐獻(xiàn)器官助他人重獲新生

極目新聞
2026-06-13 11:45:15
他從朝鮮回來無職務(wù),授銜時(shí)得知自己是海南軍區(qū)司令,懷疑聽錯(cuò)了

他從朝鮮回來無職務(wù),授銜時(shí)得知自己是海南軍區(qū)司令,懷疑聽錯(cuò)了

史之韻
2026-06-14 00:48:49
籌備多時(shí)就為此刻!伊朗炸翻世界杯的場子,向全世界拋出4重宣言

籌備多時(shí)就為此刻!伊朗炸翻世界杯的場子,向全世界拋出4重宣言

未來展望
2026-06-13 16:26:07
斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

越過海面
2026-06-12 23:14:09
洋蔥立大功!醫(yī)生發(fā)現(xiàn):洋蔥或?qū)?種慢性病有好處!可以常吃

洋蔥立大功!醫(yī)生發(fā)現(xiàn):洋蔥或?qū)?種慢性病有好處!可以常吃

芹姐說生活
2026-05-25 14:19:45
晚年毛主席原諒了很多人,為何唯獨(dú)不原諒潘漢年?主席對他寒了心

晚年毛主席原諒了很多人,為何唯獨(dú)不原諒潘漢年?主席對他寒了心

品點(diǎn)歷史
2026-06-14 06:00:20
搶在王毅專機(jī)起飛前,蒙古就對中國亮出危險(xiǎn)4字,逼華做兩件事

搶在王毅專機(jī)起飛前,蒙古就對中國亮出危險(xiǎn)4字,逼華做兩件事

阿訊說天下
2026-06-14 01:29:09
WTT曝出大冷門,首個(gè)出局大種子選手誕生,印度怪球手晉級

WTT曝出大冷門,首個(gè)出局大種子選手誕生,印度怪球手晉級

極度說球
2026-05-24 13:31:44
陪兒子“熬”過2次休學(xué),才發(fā)現(xiàn):拯救孩子最有效的方法,不是拼命講道理,也不是苦苦哀求,而是給他“安全感”

陪兒子“熬”過2次休學(xué),才發(fā)現(xiàn):拯救孩子最有效的方法,不是拼命講道理,也不是苦苦哀求,而是給他“安全感”

青春期父母成長學(xué)堂
2026-06-13 06:11:07
痛失三名核心球員,日本要被荷蘭血洗了?

痛失三名核心球員,日本要被荷蘭血洗了?

老癘體育解說
2026-06-13 08:37:45
你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
小馬云樣貌大變,和女友高調(diào)官宣戀情,曬合照秀恩愛

小馬云樣貌大變,和女友高調(diào)官宣戀情,曬合照秀恩愛

微微熱評
2026-05-28 14:37:46
蘋果卡最后三天:送耳機(jī)是真,薅到卻難

蘋果卡最后三天:送耳機(jī)是真,薅到卻難

閃存獵手
2026-06-13 02:55:58
“張雪機(jī)車”,再奪冠!

“張雪機(jī)車”,再奪冠!

政知新媒體
2026-06-13 20:43:07
關(guān)曉彤沒想到,2026世界杯開幕當(dāng)天,36歲鹿晗會(huì)以這種方式火出圈

關(guān)曉彤沒想到,2026世界杯開幕當(dāng)天,36歲鹿晗會(huì)以這種方式火出圈

丁丁鯉史紀(jì)
2026-06-12 11:41:48
蜀道裝備公司黨委書記、董事長胡?...

蜀道裝備公司黨委書記、董事長胡?...

新浪財(cái)經(jīng)
2026-06-13 01:37:48
重回藍(lán)衣軍團(tuán)?薩德官方:球隊(duì)主帥羅伯托-曼奇尼正式離任

重回藍(lán)衣軍團(tuán)?薩德官方:球隊(duì)主帥羅伯托-曼奇尼正式離任

懂球帝
2026-06-14 02:56:04
張碧晨被淘汰那刻,那英全場起立鼓掌:歌手的投票席從不殺唱功

張碧晨被淘汰那刻,那英全場起立鼓掌:歌手的投票席從不殺唱功

一盅情懷
2026-06-13 12:41:21
布達(dá)拉宮地下世界復(fù)雜得嚇人!
金碧輝煌下藏著1200多個(gè)“地壟”

布達(dá)拉宮地下世界復(fù)雜得嚇人! 金碧輝煌下藏著1200多個(gè)“地壟”

西樓知趣雜談
2026-06-12 08:54:44
2026-06-14 07:35:00
新莓daybreak incentive-icons
新莓daybreak
理解人,發(fā)現(xiàn)變化
457文章數(shù) 774關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

寶媽考編排名第一卻被低分者遞補(bǔ) 維權(quán)后崗位直接取消

頭條要聞

寶媽考編排名第一卻被低分者遞補(bǔ) 維權(quán)后崗位直接取消

體育要聞

美國4比1巴拉圭:這統(tǒng)治力真是美國隊(duì)?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍(lán)S07華為乾崑激光版增程車型上市 限時(shí)15.49萬元起

態(tài)度原創(chuàng)

時(shí)尚
家居
旅游
教育
本地

夏天穿衣要杜絕土氣感!試試精致的小香風(fēng),優(yōu)雅與俏皮并存

家居要聞

空間微調(diào) 移形換境

旅游要聞

深化旅游合作 增進(jìn)民心相通

教育要聞

真的無法預(yù)測嗎??

本地新聞

AK劉彰邂逅河北南大港濕地

無障礙瀏覽 進(jìn)入關(guān)懷版