學(xué)習(xí)機已經(jīng)從“工具”躍升為“AI老師”。
來源|多知
作者|王上
學(xué)習(xí)機行業(yè)角逐,已切換至新維度。
近日,學(xué)而思學(xué)習(xí)機對外介紹了其“紙屏互動”的產(chǎn)品邏輯。可以看出,學(xué)習(xí)機已突破了“平板”的交互模式,而是成為了一個“長眼睛”的機器人老師的載體。
AI老師發(fā)展到今天,各家已有不同的定義。好未來的路徑,可以從學(xué)而思學(xué)習(xí)機“紙屏互動”中,看出端倪。
紙屏互動是一套“軟硬一體化”的AI老師解決方案,簡單來說,用戶將一套卷子放在學(xué)習(xí)機面前,拍一拍小思的“智慧島Pro”,指著桌面紙上的一道題目問:“這道題怎么做?”小思AI老師便從頭至尾像一位真人家教一樣講解,過程中有AI老師的提問,學(xué)生的書寫,AI老師還會說“我看看你寫的有沒有什么問題”,經(jīng)過多輪問答與反饋,直至完整講解完一道題目。
“智慧島Pro”像是集合了學(xué)習(xí)機的眼睛、耳朵和嘴巴,不用解鎖開機、再打開攝像頭,這對于學(xué)生來說,使用的門檻極大降低。
學(xué)而思學(xué)習(xí)機小思產(chǎn)品部負責(zé)人伊麗君提到:“‘小思AI 1對1’是行業(yè)領(lǐng)先的軟硬一體超擬人交互的‘AI老師’,學(xué)而思學(xué)習(xí)機則在行業(yè)率先做到紙屏互動分步驟批改和講解的學(xué)習(xí)機。”
從技術(shù)上來看,覆蓋了從感知、認知到?jīng)Q策與生成的全鏈路,包括OCR技術(shù)、語音交互、版面分析與指尖識別、九章大模型等底層模型等,這背后依賴自研的高質(zhì)量數(shù)據(jù)與算法?。
“孩子最核心的學(xué)習(xí)場景還是發(fā)生在紙面上。” 學(xué)而思學(xué)習(xí)機學(xué)習(xí)系統(tǒng)負責(zé)人李通說,這是整個產(chǎn)品設(shè)計的基礎(chǔ)。
從學(xué)而思學(xué)習(xí)機的迭代可以看到學(xué)習(xí)機的演化路徑:從最初的優(yōu)質(zhì)內(nèi)容資源,解決“學(xué)什么”的問題,到AI技術(shù)的注入實現(xiàn)了“精準學(xué)”,通過初步解答了“如何學(xué)”的問題,而今,學(xué)而思學(xué)習(xí)機已然邁入第三階段,它成為了一個高度擬人、實時互動的AI Tutor載體。
這意味著,在新范式下,學(xué)習(xí)機在形態(tài)上或許仍是一臺置于桌面的設(shè)備,但本質(zhì)已經(jīng)發(fā)生改變,已經(jīng)從“工具”躍升為“AI老師”。
01“紙屏互動”是未來?
學(xué)而思為什么將最前沿的AI能力聚焦在一紙張上?
決策的起點,源于學(xué)而思團隊對用戶真實學(xué)習(xí)場景的觀察:
第一,無論科技如何演進,當前全球主流的教育體系,尤其是學(xué)校的作業(yè)、練習(xí)和考試,仍然建立在紙質(zhì)基礎(chǔ)之上。紙上書寫、演算、畫圖,這個過程本身就是思維的外化。
第二,孩子每天放學(xué)回家,最核心、最固定的學(xué)習(xí)場景就是“在書桌前寫作業(yè)”。與此同時,家長最大的痛點、最重的輔導(dǎo)壓力,也正是在這個場景下爆發(fā)的。學(xué)而思學(xué)習(xí)機所要破解的,正是這個高頻、剛需且焦慮的難題。
由此,學(xué)而思學(xué)習(xí)機AI老師的核心設(shè)計思路是:不改變孩子的紙質(zhì)學(xué)習(xí)習(xí)慣,而是讓AI主動、無感地融入其中。 李通說:“我們希望當孩子在紙面上學(xué)習(xí)時,AI老師能自然介入,成為他身邊那個‘看得見’的學(xué)習(xí)伙伴。”
李通解釋:“我們小思AI的長期目標不是成為一個簡單的答題工具,而是取代家庭場景中書桌旁的真人輔導(dǎo)角色,最終實現(xiàn)讓家長放心的、高質(zhì)量的個性化學(xué)習(xí)‘托管’。”
如果以終為始的倒推,要實現(xiàn)“家庭托管”這一愿景,就必須回答一個關(guān)鍵問題:“家長是不是很放心的,把自己的孩子交給這個學(xué)習(xí)機,然后讓他有意義的高效率的度過比如說1到2個小時的時間?”
學(xué)而思小思AI的產(chǎn)品邏輯非常清晰:一旦將主場景聚焦在“家庭中的書桌前”,那么主要的交互方式就指向了“紙屏互動”。
02為什么“紙屏互動”是人機交互新范式?
要理解紙屏互動的革命性,必須明確學(xué)而思對“AI老師”的定義。可以說,小思AI不是一個答題工具,而是一個教育智能體。
李通系統(tǒng)地解釋了學(xué)而思心中“好的AI老師”所應(yīng)具備的三重能力:
“第一是本身的業(yè)務(wù)能力,比如說批改、講題,然后診斷規(guī)劃,包括口語對答,這些都屬于AI老師本身的一些業(yè)務(wù)能力的范圍。
第二是對于孩子的理解,即掌握孩子的一些學(xué)習(xí)情況,這非常重要,這是我們做個性化教育的基礎(chǔ)。
第三是交互能力,這也很關(guān)鍵。它需要能看,能聽,如聽到孩子一些語音指令。”
這意味著“紙屏互動”成為了一個真正的AI老師,它將這三個維度融合在一起。
與普通學(xué)習(xí)機相比,學(xué)而思學(xué)習(xí)機紙屏互動的突破在于實現(xiàn)了“步驟級陪伴”。這意味著孩子每在紙上寫下一個步驟,學(xué)習(xí)機就能實時識別內(nèi)容、即時批改對錯,并動態(tài)調(diào)整接下來的講解策略。
李通總結(jié):“紙屏互動是完全以孩子作為中心的,基于孩子的這個學(xué)習(xí)情況來去自適應(yīng)的調(diào)整。”
這種能力解決了孩子在家自學(xué)的輔導(dǎo)困境。例如,當孩子某一步驟寫錯,AI不會直接給出答案,而是引導(dǎo)他思考錯在哪里;如果孩子表示“沒聽懂”,AI還會自動切換另一種講法,真正做到“因步施教”。
在這個過程中,AI老師能看到孩子在紙質(zhì)上作答,也能聽到孩子直接的語音回復(fù),形成一種多模態(tài)的、自然的交互閉環(huán)。
這使得AI老師的價值評判標準發(fā)生了改變:其價值不在于屏幕里的演示多么酷炫,而在于它對現(xiàn)實世界中孩子行為的理解和反饋能力。
這正是AI老師從L2(助手級)邁向L3(教師級)最關(guān)鍵的一步。
更重要的是,在這背后,小思AI構(gòu)建了一個完整的教學(xué)閉環(huán):系統(tǒng)基于學(xué)生的作答情況,融合了批改模型、講題模型和推薦模型,先通過批改模型精準診斷問題,再由講題模型針對性精講,最后通過推薦模型智能推送相似題進行鞏固。在學(xué)而思看來,對一位真正的AI老師而言,這三項能力相輔相成,缺一不可。
如果說以前的學(xué)習(xí)機解決的是“有什么內(nèi)容”的問題,如有多少精品課程,那么學(xué)而思學(xué)習(xí)機機小思AI 通過紙屏互動,解決的是“如何學(xué)習(xí)這些內(nèi)容”的過程問題。
就像李通所說的:“學(xué)習(xí)機的第一個階段,大家拼的是‘好內(nèi)容+好屏幕’,而現(xiàn)在競爭的核心已經(jīng)轉(zhuǎn)向AI。”
學(xué)習(xí)機從此不再是一個被動的資源庫,而是一個能主動介入學(xué)習(xí)過程的伙伴。
03曾席卷全行業(yè)的Demo,被學(xué)而思學(xué)習(xí)機做出來了
教育科技行業(yè)也有紙屏互動的想法,但在學(xué)而思學(xué)習(xí)機之前,沒有成熟的產(chǎn)品落地。
早在2024年5月,OpenAI邀請可汗學(xué)院創(chuàng)始人薩爾曼·可汗及其兒子共同參與GPT-4o的測試,重點評估GPT-4o在數(shù)學(xué)輔導(dǎo)能力。?
在測試中,薩爾曼·可汗的兒子在紙上做了一道幾何題,然后手機攝像頭打開,GPT-4o來根據(jù)他的作答情況實時地給他講解。
但當時這只是一個Demo,到目前也沒有進行產(chǎn)品化。
這個Demo證明了技術(shù)方向的可行性,但將其打造成一個穩(wěn)定、可靠、可量產(chǎn)的產(chǎn)品,卻是一條艱難的道路。
李通表示:“我們在目前實現(xiàn)的紙屏互動能力確實是行業(yè)唯一的。”
伊麗君介紹,“小思”AI自2023年11月誕生以來,經(jīng)歷了快速迭代。1.0版本實現(xiàn)了從0到1的跨越,建立了智能交互基礎(chǔ);2024年5月的2.0版本基于大模型Agent技術(shù),構(gòu)建了智能理解與決策能力,并配備了記憶系統(tǒng)和情感系統(tǒng)。
而3.0版本的突破,則建立在兩大技術(shù)成熟的基礎(chǔ)之上:
第一,多模態(tài)感知系統(tǒng)的成熟。
統(tǒng)能夠同時處理視覺、語音、文本等多維度輸入,實現(xiàn)真正的全場景感知。特別是在紙屏互動方面,書寫識別準確率大幅提升,即便是潦草的筆跡或復(fù)雜的數(shù)學(xué)公式,也能精準識別。
第二,教育大模型的持續(xù)深化。
小思AI 3.0搭載的九章大模型在教育領(lǐng)域進行了專門優(yōu)化。李通指出:“在業(yè)務(wù)能力上,如高頻剛需的功能,像批改、講題等,在準確性上是我們內(nèi)部在做這個九章大模型的核心的指標。”
通過在海量教育數(shù)據(jù)上做持續(xù)的預(yù)訓(xùn)練與強化學(xué)習(xí),模型不僅在解題正確率上達到新高,更重要的是在“講題質(zhì)量”這一主觀維度上實現(xiàn)了顯著提升,能夠根據(jù)學(xué)生的學(xué)段、知識掌握程度自動選擇最適合的講解方法。
盡管最終呈現(xiàn)給用戶的交互形式看起來流暢自然,但實現(xiàn)過程卻充滿了挑戰(zhàn)。
這背后包括要去識別孩子各式各樣的筆跡,然后批改,然后講題等,涉及到諸多細節(jié)。李通坦言:“我們看到的一輪簡單交互,背后串聯(lián)了非常多算法能力。它特別容易出現(xiàn)bad case。”
04長期目標是做 “孩子書桌旁的機器人”
現(xiàn)在,小思AI有了L3(教師級)的雛形,未來還有很多迭代空間。
目前,學(xué)而思AI老師的“紙屏互動”已在數(shù)學(xué)等學(xué)科中實現(xiàn)應(yīng)用,未來還將拓展至更多的科目。
未來,AI老師將不再僅僅“看懂”題目和“聽懂”指令,它將能像真人老師一樣,感知到更豐富的環(huán)境信息與學(xué)生的狀態(tài),甚至是能夠基于全局學(xué)習(xí)數(shù)據(jù)生成動態(tài)的、長期的學(xué)習(xí)路徑規(guī)劃,甚至堪比“AI張雪峰”。
李通透露,學(xué)而思團隊的長期目標是將學(xué)習(xí)機打造成“孩子書桌旁的機器人”,不僅看懂紙面內(nèi)容,還能感知孩子的坐姿、表情、專注度,甚至情緒狀態(tài),從而提供更人性化的學(xué)習(xí)陪伴。
“理想情況下,AI老師應(yīng)該像真人老師一樣,在孩子煩躁時給予鼓勵,走神時及時提醒。” 李通說,“而這,正是我們持續(xù)努力的方向。”
從L3到L4,意味著AI老師需要從在特定場景下提供閉環(huán)解決方案,進化到更全面、更擬人、更深度個性化的陪伴,學(xué)而思已經(jīng)在路上。
作者:王上
教育從業(yè)者年度必讀丨《教育科技這一年:教育+AI新紀元》火熱銷售中,點擊小程序購買?
掃碼加入多知新書交流群,共同探討教育+AI的未來
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.