![]()
智東西
編譯 楊京麗
編輯 李水青
智東西6月24日消息,今天,美國AI初創(chuàng)公司Engram公開亮相,宣布推出面向Agent的API,并完成9800萬美元(約合人民幣6.7億元)融資。Engram希望讓Agent能夠在超大型共享知識工作區(qū)中學(xué)習(xí),無需每次任務(wù)開始前重新讀取上下文。
公司稱,其模型能夠研究用戶上下文,拼接零散信息、建立新聯(lián)系,并發(fā)現(xiàn)過去未被注意到的錯誤;在很多任務(wù)中,由于不必重新收集上下文,token效率可提升10倍甚至100倍。
![]()
▲Engram發(fā)文介紹公司,并宣布獲9800萬美元融資(圖源:X)
Engram的投資方包括General Catalyst、Kleiner Perkins、紅杉資本等風投機構(gòu),投資人和顧問還包括Wiz聯(lián)合創(chuàng)始人兼CEO阿薩夫·拉帕波特(Assaf Rappaport)、近期剛加入Anthropic的“AI大神”安德烈·卡帕西(Andrej Karpathy)、加州大學(xué)伯克利分校教授彼得·阿貝爾(Pieter Abbeel)等。
公司已與協(xié)作辦公軟件公司Notion、法律AI公司Harvey和微軟展開早期合作,分別圍繞大型Notion工作區(qū)、自定義律所或企業(yè)知識模型,以及Microsoft 365中的企業(yè)Agent試點落地。
Engram是一家聚焦AI記憶、持續(xù)學(xué)習(xí)和自適應(yīng)系統(tǒng)的AI初創(chuàng)公司。據(jù)公司公開信息,其團隊成員來自斯坦福大學(xué)、加州大學(xué)伯克利分校和康奈爾大學(xué)等機構(gòu),研究方向覆蓋上下文壓縮、檢索、LoRA、合成數(shù)據(jù)、長上下文、記憶架構(gòu),以及人類和機器中的記憶與遺忘機制。
一、首款產(chǎn)品是Agent API,已與Notion、Harvey、微軟合作
Engram的長期目標是建立一種統(tǒng)一訓(xùn)練算法,讓模型能夠吸收任意規(guī)模的數(shù)據(jù),并在持續(xù)更新中變得更好。公司目前每天都會在公司全部數(shù)據(jù)上,運行這一流程。接下來,他們希望把重訓(xùn)頻率提高到每小時一次,最終接近每分鐘一次。
不過,Engram也承認,盡管持續(xù)學(xué)習(xí)、記憶和“從用戶身上學(xué)習(xí)”已經(jīng)成為AI領(lǐng)域的熱門概念,但要讓這類系統(tǒng)在大規(guī)模、多輪更新中真正可用,仍然沒有成熟解法。Engram團隊已經(jīng)從上下文壓縮、檢索、LoRA、合成數(shù)據(jù)、長上下文、記憶架構(gòu),以及人類和機器中的記憶與遺忘機制等多個方向研究這一問題。
Engram的首款產(chǎn)品是一套面向Agent的API,能夠讓Agent在超大型共享知識工作區(qū)中學(xué)習(xí)。公司早期合作伙伴擁有非常豐富的上下文數(shù)據(jù),也較早采用AI技術(shù)。
Engram正與Notion合作開發(fā)自定義Agent,使其能夠理解大型Notion工作區(qū);Engram還與法律AI公司Harvey合作開發(fā)模型,讓模型內(nèi)化整個律所或企業(yè)的知識,并能在大量客戶事務(wù)中搜索和發(fā)現(xiàn)判例;此外,Engram與微軟合作,在Microsoft 365中試點Engram模型,為企業(yè)客戶提供更低成本、更定制化的Agent。
二、Engram要改變AI“讀完就忘”,讓模型學(xué)習(xí)用戶上下文
Engram認為,當前AI模型并不能真正理解,用戶在做什么。模型所知道的內(nèi)容來自訓(xùn)練,而訓(xùn)練數(shù)據(jù)大多來自公開互聯(lián)網(wǎng)。因此,模型了解熱門GitHub項目,也了解人們寫在網(wǎng)上的文章,但用戶每天真正思考和處理的事情遠不止這些。
用戶知道什么樣的工作是好的,知道項目的研究方向,也知道希望它一年后變成什么樣。這些知識覆蓋從細節(jié)到全局的諸多方面,往往遠超一個聊天窗口能承載的范圍。即便用戶把想法寫下來,重要信息也會散落在大量文檔和文件中。現(xiàn)在使用模型時,模型通常要先反復(fù)讀取公司里的許多文檔,然后才能開始工作。
隨著上下文不斷增長,現(xiàn)有方式的問題越來越明顯:模型變得更貴,也更容易混亂。單個用戶產(chǎn)生的數(shù)據(jù),已經(jīng)遠超模型能夠完整處理的范圍。更關(guān)鍵的是,讀取本身是淺層且臨時的。即便模型看到了用戶的上下文,也可能在用戶關(guān)閉聊天后,忘掉這些內(nèi)容。換句話說,目前,模型并不會從這些數(shù)據(jù)中學(xué)習(xí),因而,無法自動變得更擅長用戶需要它完成的任務(wù)。
此外,一些模型雖然能夠保存歷史上下文,但在新任務(wù)中可能會把舊信息和當前問題錯誤關(guān)聯(lián),反而帶來干擾。Engram要解決的不只是讓模型記住上下文,還包括讓模型在合適的時候正確使用這些記憶。
Engram希望改變上述問題,目標是構(gòu)建能從用戶上下文中學(xué)習(xí)的模型。
三、把訓(xùn)練算力用在上下文上,最高提升100倍token效率
Engram與其他AI實驗室的訓(xùn)練方向不同,他們沒有繼續(xù)花費大量訓(xùn)練算力在公開數(shù)據(jù)上,而是從強預(yù)訓(xùn)練模型出發(fā),把訓(xùn)練用于用戶關(guān)心的上下文。Engram稱,這相當于每個模型都會花費數(shù)百年的時間,研究你的上下文:拼湊零散信息,建立此前從未形成過的聯(lián)系,并發(fā)現(xiàn)過去未被注意到的錯誤。
在內(nèi)部使用和與Notion的設(shè)計合作中,Engram的模型已經(jīng)有不錯的表現(xiàn)。這些模型能夠從Engram自己的GitHub、Slack和Notion中學(xué)習(xí)公司及其工作內(nèi)容,知道團隊正在做什么、為什么做,也能建立意料之外的聯(lián)系,甚至能夠記住團隊成員已經(jīng)遺忘的信息。
由于很多任務(wù)不再需要重新收集上下文,Engram稱其模型可以實現(xiàn)10倍甚至100倍的token效率提升。它們不只是讀過資料,而是像一個熟悉團隊工作的同事一樣,直接知道一些應(yīng)該知道的事情。
結(jié)語:通過上下文學(xué)習(xí),讓模型理解用戶
Engram的切入點和很多AI公司不太一樣。多數(shù)AI產(chǎn)品仍在圍繞長上下文和工具調(diào)用做文章,而Engram選擇把訓(xùn)練算力用在用戶自己的上下文上,試圖讓模型學(xué)會一個人、一個組織的知識和工作方式。
這家公司剛剛亮相就收獲大額投資,贏得行業(yè)大牛的支持。接下來,Engram面向Agent的API能否在真實場景中穩(wěn)定“干活”,在成本、準確性和持續(xù)更新上兌現(xiàn)承諾,還需要實際應(yīng)用來驗證。
來源:Engram
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.