![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】當(dāng)推薦算法行業(yè)步入深度深耕階段,行業(yè)發(fā)展全新增長突破口在哪里?
多年來,短視頻推薦系統(tǒng)在協(xié)同過濾、序列推薦、多目標(biāo)優(yōu)化等方向上經(jīng)歷了多輪技術(shù)迭代。
伴隨現(xiàn)有技術(shù)體系日漸完善,通過模型結(jié)構(gòu)優(yōu)化、常規(guī)特征開發(fā)、可觀測目標(biāo)學(xué)習(xí)帶來的效能提升逐步放緩,行業(yè)亟需開辟創(chuàng)新研究思路。
清華大學(xué)經(jīng)濟(jì)管理學(xué)院的陳柯均博士生、張佳音教授、徐心教授與快手消費(fèi)策略算法部合作探索完成了一項(xiàng)聯(lián)合實(shí)驗(yàn):從視頻傳遞的價(jià)值觀的角度,去理解觀看視頻后用戶的行為和心理變化。
實(shí)驗(yàn)嘗試?yán)么竽P偷哪M和推理能力,將社會(huì)學(xué)和心理學(xué)領(lǐng)域中的價(jià)值觀理論引入推薦排序策略,并在快手主站進(jìn)行了大規(guī)模隨機(jī)在線對比實(shí)驗(yàn)。
初步結(jié)果顯示,這一方向不僅技術(shù)上可行,更在用戶使用APP時(shí)長、電商、直播、社交、搜索等多個(gè)業(yè)務(wù)維度上實(shí)現(xiàn)了同步正向增長,創(chuàng)新性且系統(tǒng)性地實(shí)現(xiàn)了推薦系統(tǒng)在社會(huì)價(jià)值觀層面上通過算法手段滿足用戶需求的功能。
技術(shù)路徑
如何將抽象的價(jià)值觀概念從理論落地到推薦系統(tǒng),是本項(xiàng)目需要解決的核心問題之一。
團(tuán)隊(duì)基于前期合作的產(chǎn)出[1],分兩個(gè)階段完成了 視頻價(jià)值的大模型推理 和 輕量蒸餾模型線上生效 的完整解決方案,將離線實(shí)驗(yàn)驗(yàn)證的方法論轉(zhuǎn)化為真實(shí)推薦系統(tǒng)的策略工具。
![]()
圖1–ValueOpt技術(shù)框架
大語言模型推理
團(tuán)隊(duì)利用大語言模型模擬短視頻受眾群體,推理不同類型用戶在觀看視頻后的行為和心理變化,進(jìn)而推斷用戶所能感知到的價(jià)值觀,大致方案沿用前期工作[1]。
完整的大模型推理流程針對部分隨機(jī)采樣視頻進(jìn)行,采樣視頻時(shí)間跨度為6個(gè)月,視頻量累計(jì)超過650萬條,基本覆蓋全部類目。
注:實(shí)驗(yàn)中團(tuán)隊(duì)發(fā)現(xiàn),提示大模型在過程中扮演短視頻相關(guān)受眾群體,能夠更好地從內(nèi)容語義層面識(shí)別視頻所傳遞的價(jià)值觀信號(hào),生成的標(biāo)注結(jié)果會(huì)更準(zhǔn)確地反映受眾側(cè)的感知結(jié)果。其中視頻受眾群體的提取在工程上采用了 TagCF[2] 方案,理論上也可以根據(jù)場景需求通過自定義的推理模版實(shí)現(xiàn)。
輕量蒸餾上線+策略對比試驗(yàn)
為了應(yīng)對每天數(shù)以千萬計(jì)的視頻理解需要,團(tuán)隊(duì)進(jìn)一步完成了蒸餾模型規(guī)模化部署。
模型以快手自研的視頻embedding為特征,以大模型推理結(jié)果為監(jiān)督信號(hào),訓(xùn)練輕量級(jí)蒸餾模型,將大模型強(qiáng)大的受眾模擬和價(jià)值觀推理能力遷移到可實(shí)時(shí)在線高通量服務(wù)的小模型中,實(shí)現(xiàn)對全量視頻的價(jià)值觀標(biāo)簽預(yù)估,從而具備多場景規(guī)模化應(yīng)用的能力。
離線測試發(fā)現(xiàn)蒸餾小模型在充分訓(xùn)練后可以達(dá)到85%以上準(zhǔn)確率,人工評(píng)測也認(rèn)為其與大模型推理結(jié)果無明顯差異,滿足線上落地需求。
視頻價(jià)值標(biāo)簽預(yù)估結(jié)果在線上推薦系統(tǒng)生效時(shí),存在另一個(gè)關(guān)鍵挑戰(zhàn),即視頻價(jià)值與用戶可觀測反饋關(guān)聯(lián)的不可預(yù)知性。
雖然前期離線實(shí)驗(yàn)已驗(yàn)證視頻價(jià)值推理結(jié)果能夠有效提升視頻排序的準(zhǔn)確率,但線上真實(shí)場景中用戶存在多種反饋信號(hào)(APP時(shí)長、點(diǎn)贊、關(guān)注、打賞、長期留存),目前也并沒有任何理論論證這些反饋信號(hào)與視頻價(jià)值的相關(guān)性和互補(bǔ)性。
此外,團(tuán)隊(duì)也認(rèn)為不同推薦業(yè)務(wù)場景下由于其作者生態(tài)和消費(fèi)者群體不同,其價(jià)值內(nèi)容也會(huì)呈現(xiàn)明顯差異,因此只有通過完整的線上對比試驗(yàn)才能準(zhǔn)確判斷系統(tǒng)隱藏的價(jià)值需求和短板。
線上落地實(shí)驗(yàn)
實(shí)驗(yàn)設(shè)計(jì):億級(jí)用戶規(guī)模驗(yàn)證
實(shí)驗(yàn)在快手主站精選頁的重排階段進(jìn)行,采用經(jīng)典A/B實(shí)驗(yàn)范式
實(shí)驗(yàn)規(guī)模:每組約5%流量,每組覆蓋千萬級(jí)用戶群體
實(shí)驗(yàn)周期:AA期觀察一周,AB實(shí)驗(yàn)持續(xù)進(jìn)行超過一個(gè)月
實(shí)驗(yàn)干預(yù):每個(gè)實(shí)驗(yàn)組,在重排階段,適度提升某一類價(jià)值觀視頻的分發(fā)權(quán)重,觀察對各業(yè)務(wù)指標(biāo)的影響
初步結(jié)果:多業(yè)務(wù)板塊同步增長
這是本研究最值得關(guān)注的發(fā)現(xiàn)——價(jià)值觀調(diào)控能夠拉動(dòng)多個(gè)業(yè)務(wù)維度,且不同價(jià)值與多業(yè)務(wù)指標(biāo)關(guān)聯(lián)存在差異。
內(nèi)容消費(fèi):個(gè)人安全組,顯著提升了用戶APP使用時(shí)長及留存指標(biāo)。
直播業(yè)務(wù):多個(gè)價(jià)值觀組別(個(gè)人安全、傳統(tǒng)、仁慈-關(guān)懷等)對直播送禮金額有顯著正向影響。
電商業(yè)務(wù):享樂主義、個(gè)人安全、社會(huì)安全等價(jià)值觀組別對大盤結(jié)算GMV有明顯正向貢獻(xiàn),買家數(shù)也呈現(xiàn)同步增長。
社交互動(dòng):多個(gè)價(jià)值觀組別顯著提升了雙關(guān)用戶的內(nèi)容互動(dòng)與分享行為,平臺(tái)社交活躍度有所改善。
主動(dòng)搜索:大多數(shù)實(shí)驗(yàn)組均顯著提升了用戶主動(dòng)搜索次數(shù),其中刺激類價(jià)值觀視頻的提升幅度最為突出。
拓展討論和未來方向
為什么有效?一點(diǎn)理論解讀
這一系列結(jié)果背后,有兩個(gè)值得深思的發(fā)現(xiàn)。
其一,供需平衡需求。原有的推薦分發(fā)策略以主題作為內(nèi)容的主要表征維度,視頻的價(jià)值觀屬性在分發(fā)過程中并未被顯式考量。
這意味著,某些價(jià)值觀類型的視頻,在平臺(tái)上的供給比例可能長期低于用戶的潛在需求——當(dāng)我們主動(dòng)提升這類內(nèi)容的分發(fā)權(quán)重,用戶的正向反饋便隨之而來。
其二,價(jià)值觀的行為驅(qū)動(dòng)力。本研究在全體用戶層面統(tǒng)一提升某類價(jià)值觀視頻的曝光比例。實(shí)驗(yàn)結(jié)果表明,特定價(jià)值觀維度的內(nèi)容在大盤層面更容易激發(fā)用戶的觀看、互動(dòng)與轉(zhuǎn)化行為。
這一發(fā)現(xiàn)也具有一定的理論意義:它將社會(huì)心理學(xué)中成熟的價(jià)值觀理論與推薦系統(tǒng)的內(nèi)容理解問題連接起來,同時(shí)也為價(jià)值觀理論本身提供了新的經(jīng)驗(yàn)證據(jù)——在數(shù)字內(nèi)容消費(fèi)這一大規(guī)模真實(shí)場景下,不同價(jià)值觀類型對人類行為的影響存在因果性、系統(tǒng)性差異,這是以往依賴問卷或小樣本實(shí)驗(yàn)的價(jià)值觀研究所難以探討的問題。
意義與展望
這些發(fā)現(xiàn)的意義在于:人類的行為選擇背后,往往由深層價(jià)值觀驅(qū)動(dòng)。不同價(jià)值觀類型的內(nèi)容,在激發(fā)用戶消費(fèi)、互動(dòng)與轉(zhuǎn)化行為上存在系統(tǒng)性差異。
除視頻主題外,價(jià)值觀可以作為視頻內(nèi)容的一個(gè)新維度,幫助推薦系統(tǒng)識(shí)別出那些在業(yè)務(wù)帶動(dòng)上更具潛力的內(nèi)容,并通過調(diào)整分發(fā)策略加以放大。
![]()
圖2 – 價(jià)值觀在用戶行為和心理轉(zhuǎn)化中的驅(qū)動(dòng)性影響
此外,本研究展示了一個(gè)頗具潛力的方向:將人文社科領(lǐng)域的理論構(gòu)念引入工業(yè)級(jí)推薦系統(tǒng),為工業(yè)推薦場景提供了新思路、新視角。
當(dāng)然,推薦系統(tǒng)作為整合并匹配生產(chǎn)者與消費(fèi)者資源的核心算法節(jié)點(diǎn),可能其內(nèi)在本質(zhì)上就是一個(gè)「研究人的學(xué)科」。
聯(lián)系方式
zhangjy5@sem.tsinghua.edu.cn
liushuchang@kuaishou.com
參考資料:
[1] Kejun Chen, Shuchang Liu, Jiayin Zhang, Zhitao Yin, Yandong Bai, Xin Li, Sean Xin Xu, Qing Yu, Xiang Li: Individualized Value Discovery using LLMs for Short Video Recommendation. ICIS 2025
[2] Qing Yu, Xiaobei Wang, Shuchang Liu, Yandong Bai, Xiaoyu Yang, Xueliang Wang, Chang Meng, Shanshan Wu, Hailan Yang, Huihui Xiao, Xiang Li, Fan Yang, Xiaoqiang Feng, Lantao Hu, Han Li, Kun Gai, Lixin Zou: Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation. CoRR abs/2505.10940 (2025)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.