網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

學(xué)而思學(xué)習(xí)機推出“紙屏互動”：桌面機器人AI老師，上崗

2025-11-19 10:09:37　來源: 多知

北京舉報

分享至

學(xué)習(xí)機已經(jīng)從“工具”躍升為“AI老師”。

來源|多知

作者|王上

學(xué)習(xí)機行業(yè)角逐，已切換至新維度。

近日，學(xué)而思學(xué)習(xí)機對外介紹了其“紙屏互動”的產(chǎn)品邏輯。可以看出，學(xué)習(xí)機已突破了“平板”的交互模式，而是成為了一個“長眼睛”的機器人老師的載體。

AI老師發(fā)展到今天，各家已有不同的定義。好未來的路徑，可以從學(xué)而思學(xué)習(xí)機“紙屏互動”中，看出端倪。

紙屏互動是一套“軟硬一體化”的AI老師解決方案，簡單來說，用戶將一套卷子放在學(xué)習(xí)機面前，拍一拍小思的“智慧島Pro”，指著桌面紙上的一道題目問：“這道題怎么做？”小思AI老師便從頭至尾像一位真人家教一樣講解，過程中有AI老師的提問，學(xué)生的書寫，AI老師還會說“我看看你寫的有沒有什么問題”，經(jīng)過多輪問答與反饋，直至完整講解完一道題目。

“智慧島Pro”像是集合了學(xué)習(xí)機的眼睛、耳朵和嘴巴，不用解鎖開機、再打開攝像頭，這對于學(xué)生來說，使用的門檻極大降低。

學(xué)而思學(xué)習(xí)機小思產(chǎn)品部負責(zé)人伊麗君提到：“‘小思AI 1對1’是行業(yè)領(lǐng)先的軟硬一體超擬人交互的‘AI老師’，學(xué)而思學(xué)習(xí)機則在行業(yè)率先做到紙屏互動分步驟批改和講解的學(xué)習(xí)機。”

從技術(shù)上來看，覆蓋了從感知、認知到?jīng)Q策與生成的全鏈路，包括OCR技術(shù)、語音交互、版面分析與指尖識別、九章大模型等底層模型等，這背后依賴自研的高質(zhì)量數(shù)據(jù)與算法?。

“孩子最核心的學(xué)習(xí)場景還是發(fā)生在紙面上。” 學(xué)而思學(xué)習(xí)機學(xué)習(xí)系統(tǒng)負責(zé)人李通說，這是整個產(chǎn)品設(shè)計的基礎(chǔ)。

從學(xué)而思學(xué)習(xí)機的迭代可以看到學(xué)習(xí)機的演化路徑：從最初的優(yōu)質(zhì)內(nèi)容資源，解決“學(xué)什么”的問題，到AI技術(shù)的注入實現(xiàn)了“精準學(xué)”，通過初步解答了“如何學(xué)”的問題，而今，學(xué)而思學(xué)習(xí)機已然邁入第三階段，它成為了一個高度擬人、實時互動的AI Tutor載體。

這意味著，在新范式下，學(xué)習(xí)機在形態(tài)上或許仍是一臺置于桌面的設(shè)備，但本質(zhì)已經(jīng)發(fā)生改變，已經(jīng)從“工具”躍升為“AI老師”。

01“紙屏互動”是未來？

學(xué)而思為什么將最前沿的AI能力聚焦在一紙張上？

決策的起點，源于學(xué)而思團隊對用戶真實學(xué)習(xí)場景的觀察：

第一，無論科技如何演進，當前全球主流的教育體系，尤其是學(xué)校的作業(yè)、練習(xí)和考試，仍然建立在紙質(zhì)基礎(chǔ)之上。紙上書寫、演算、畫圖，這個過程本身就是思維的外化。

第二，孩子每天放學(xué)回家，最核心、最固定的學(xué)習(xí)場景就是“在書桌前寫作業(yè)”。與此同時，家長最大的痛點、最重的輔導(dǎo)壓力，也正是在這個場景下爆發(fā)的。學(xué)而思學(xué)習(xí)機所要破解的，正是這個高頻、剛需且焦慮的難題。

由此，學(xué)而思學(xué)習(xí)機AI老師的核心設(shè)計思路是：不改變孩子的紙質(zhì)學(xué)習(xí)習(xí)慣，而是讓AI主動、無感地融入其中。李通說：“我們希望當孩子在紙面上學(xué)習(xí)時，AI老師能自然介入，成為他身邊那個‘看得見’的學(xué)習(xí)伙伴。”

李通解釋：“我們小思AI的長期目標不是成為一個簡單的答題工具，而是取代家庭場景中書桌旁的真人輔導(dǎo)角色，最終實現(xiàn)讓家長放心的、高質(zhì)量的個性化學(xué)習(xí)‘托管’。”

如果以終為始的倒推，要實現(xiàn)“家庭托管”這一愿景，就必須回答一個關(guān)鍵問題：“家長是不是很放心的，把自己的孩子交給這個學(xué)習(xí)機，然后讓他有意義的高效率的度過比如說1到2個小時的時間？”

學(xué)而思小思AI的產(chǎn)品邏輯非常清晰：一旦將主場景聚焦在“家庭中的書桌前”，那么主要的交互方式就指向了“紙屏互動”。

02為什么“紙屏互動”是人機交互新范式？

要理解紙屏互動的革命性，必須明確學(xué)而思對“AI老師”的定義。可以說，小思AI不是一個答題工具，而是一個教育智能體。

李通系統(tǒng)地解釋了學(xué)而思心中“好的AI老師”所應(yīng)具備的三重能力：

“第一是本身的業(yè)務(wù)能力，比如說批改、講題，然后診斷規(guī)劃，包括口語對答，這些都屬于AI老師本身的一些業(yè)務(wù)能力的范圍。

第二是對于孩子的理解，即掌握孩子的一些學(xué)習(xí)情況，這非常重要，這是我們做個性化教育的基礎(chǔ)。

第三是交互能力，這也很關(guān)鍵。它需要能看，能聽，如聽到孩子一些語音指令。”

這意味著“紙屏互動”成為了一個真正的AI老師，它將這三個維度融合在一起。

與普通學(xué)習(xí)機相比，學(xué)而思學(xué)習(xí)機紙屏互動的突破在于實現(xiàn)了“步驟級陪伴”。這意味著孩子每在紙上寫下一個步驟，學(xué)習(xí)機就能實時識別內(nèi)容、即時批改對錯，并動態(tài)調(diào)整接下來的講解策略。

李通總結(jié)：“紙屏互動是完全以孩子作為中心的，基于孩子的這個學(xué)習(xí)情況來去自適應(yīng)的調(diào)整。”

這種能力解決了孩子在家自學(xué)的輔導(dǎo)困境。例如，當孩子某一步驟寫錯，AI不會直接給出答案，而是引導(dǎo)他思考錯在哪里；如果孩子表示“沒聽懂”，AI還會自動切換另一種講法，真正做到“因步施教”。

在這個過程中，AI老師能看到孩子在紙質(zhì)上作答，也能聽到孩子直接的語音回復(fù)，形成一種多模態(tài)的、自然的交互閉環(huán)。

這使得AI老師的價值評判標準發(fā)生了改變：其價值不在于屏幕里的演示多么酷炫，而在于它對現(xiàn)實世界中孩子行為的理解和反饋能力。

這正是AI老師從L2（助手級）邁向L3（教師級）最關(guān)鍵的一步。

更重要的是，在這背后，小思AI構(gòu)建了一個完整的教學(xué)閉環(huán)：系統(tǒng)基于學(xué)生的作答情況，融合了批改模型、講題模型和推薦模型，先通過批改模型精準診斷問題，再由講題模型針對性精講，最后通過推薦模型智能推送相似題進行鞏固。在學(xué)而思看來，對一位真正的AI老師而言，這三項能力相輔相成，缺一不可。

如果說以前的學(xué)習(xí)機解決的是“有什么內(nèi)容”的問題，如有多少精品課程，那么學(xué)而思學(xué)習(xí)機機小思AI 通過紙屏互動，解決的是“如何學(xué)習(xí)這些內(nèi)容”的過程問題。

就像李通所說的：“學(xué)習(xí)機的第一個階段，大家拼的是‘好內(nèi)容+好屏幕’，而現(xiàn)在競爭的核心已經(jīng)轉(zhuǎn)向AI。”

學(xué)習(xí)機從此不再是一個被動的資源庫，而是一個能主動介入學(xué)習(xí)過程的伙伴。

03曾席卷全行業(yè)的Demo，被學(xué)而思學(xué)習(xí)機做出來了

教育科技行業(yè)也有紙屏互動的想法，但在學(xué)而思學(xué)習(xí)機之前，沒有成熟的產(chǎn)品落地。

早在2024年5月，OpenAI邀請可汗學(xué)院創(chuàng)始人薩爾曼·可汗及其兒子共同參與GPT-4o的測試，重點評估GPT-4o在數(shù)學(xué)輔導(dǎo)能力。?

在測試中，薩爾曼·可汗的兒子在紙上做了一道幾何題，然后手機攝像頭打開，GPT-4o來根據(jù)他的作答情況實時地給他講解。

但當時這只是一個Demo，到目前也沒有進行產(chǎn)品化。

這個Demo證明了技術(shù)方向的可行性，但將其打造成一個穩(wěn)定、可靠、可量產(chǎn)的產(chǎn)品，卻是一條艱難的道路。

李通表示：“我們在目前實現(xiàn)的紙屏互動能力確實是行業(yè)唯一的。”

伊麗君介紹，“小思”AI自2023年11月誕生以來，經(jīng)歷了快速迭代。1.0版本實現(xiàn)了從0到1的跨越，建立了智能交互基礎(chǔ)；2024年5月的2.0版本基于大模型Agent技術(shù)，構(gòu)建了智能理解與決策能力，并配備了記憶系統(tǒng)和情感系統(tǒng)。

而3.0版本的突破，則建立在兩大技術(shù)成熟的基礎(chǔ)之上：

第一，多模態(tài)感知系統(tǒng)的成熟。

統(tǒng)能夠同時處理視覺、語音、文本等多維度輸入，實現(xiàn)真正的全場景感知。特別是在紙屏互動方面，書寫識別準確率大幅提升，即便是潦草的筆跡或復(fù)雜的數(shù)學(xué)公式，也能精準識別。

第二，教育大模型的持續(xù)深化。

小思AI 3.0搭載的九章大模型在教育領(lǐng)域進行了專門優(yōu)化。李通指出：“在業(yè)務(wù)能力上，如高頻剛需的功能，像批改、講題等，在準確性上是我們內(nèi)部在做這個九章大模型的核心的指標。”

通過在海量教育數(shù)據(jù)上做持續(xù)的預(yù)訓(xùn)練與強化學(xué)習(xí)，模型不僅在解題正確率上達到新高，更重要的是在“講題質(zhì)量”這一主觀維度上實現(xiàn)了顯著提升，能夠根據(jù)學(xué)生的學(xué)段、知識掌握程度自動選擇最適合的講解方法。

盡管最終呈現(xiàn)給用戶的交互形式看起來流暢自然，但實現(xiàn)過程卻充滿了挑戰(zhàn)。

這背后包括要去識別孩子各式各樣的筆跡，然后批改，然后講題等，涉及到諸多細節(jié)。李通坦言：“我們看到的一輪簡單交互，背后串聯(lián)了非常多算法能力。它特別容易出現(xiàn)bad case。”

04長期目標是做 “孩子書桌旁的機器人”

現(xiàn)在，小思AI有了L3(教師級)的雛形，未來還有很多迭代空間。

目前，學(xué)而思AI老師的“紙屏互動”已在數(shù)學(xué)等學(xué)科中實現(xiàn)應(yīng)用，未來還將拓展至更多的科目。

未來，AI老師將不再僅僅“看懂”題目和“聽懂”指令，它將能像真人老師一樣，感知到更豐富的環(huán)境信息與學(xué)生的狀態(tài)，甚至是能夠基于全局學(xué)習(xí)數(shù)據(jù)生成動態(tài)的、長期的學(xué)習(xí)路徑規(guī)劃，甚至堪比“AI張雪峰”。

李通透露，學(xué)而思團隊的長期目標是將學(xué)習(xí)機打造成“孩子書桌旁的機器人”，不僅看懂紙面內(nèi)容，還能感知孩子的坐姿、表情、專注度，甚至情緒狀態(tài)，從而提供更人性化的學(xué)習(xí)陪伴。

“理想情況下，AI老師應(yīng)該像真人老師一樣，在孩子煩躁時給予鼓勵，走神時及時提醒。” 李通說，“而這，正是我們持續(xù)努力的方向。”

從L3到L4，意味著AI老師需要從在特定場景下提供閉環(huán)解決方案，進化到更全面、更擬人、更深度個性化的陪伴，學(xué)而思已經(jīng)在路上。

作者：王上

教育從業(yè)者年度必讀丨《教育科技這一年：教育+AI新紀元》火熱銷售中，點擊小程序購買?

掃碼加入多知新書交流群，共同探討教育+AI的未來

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.