![]()
作者|洋紫
編輯|李小天
霞光社獲悉,Visual Agent 創業公司 Chance AI 宣布完成數百萬美元融資。本輪由美圖領投,NYX Ventures、阿里系投資機構等跟投。融資將用于模型能力迭代、北美學生群體增長、以及社區與商業化探索。
Chance AI 成立于2025年,核心產品是世界第一款以攝像頭為主要入口的AI產品Visual Agent(視覺智能體)。與傳統AI產品依賴輸入框不同,用戶打開Chance AI后直接拍攝眼前內容,系統即可理解視覺意圖并提供判斷、建議和行動方案。
在Chance AI看來,視覺不是輸入方式,而是人類的認知系統。“對人類來說,視覺才是最直覺的操作系統,而不是輸入框。”Chance AI創始人兼CEO曾熙告訴霞光社,“從第一天開始做產品,我們的首頁就是沒有任何輸入框的。在我們的產品里面唯一的輸入框就是出現在評論區,但是現在更多人是用語音,點開只有一個拍照按鍵,進來以后用戶不用輸入prompt,one tap,因為這才是人類最直覺的方式。”
使用方式也很簡單,只需要通過Chance AI拍攝任何圖片,Chance AI就會快速將圖片內容轉為對于圖片深層次含義的解讀。每一個圖片都不只限于“閱讀”,更多在于“理解”,即在認識的基礎上解釋看見事物的意義;此外,Chance AI也有Live模式,即實時視覺交互系統(Real-time Visual Intelligence System),在Live模式中,用戶可以一邊看,一邊與Chance AI交流,它還會做出對于畫面的實時視覺理解(Real-time perception)以及連續推理(Continuous reasoning,而非單次響應)。
![]()
![]()
巴塞爾藝術周現場,觀眾使用Chance AI「Visual Agent – Live」,在觀看作品的過程中與AI實時交流與理解
Chance AI的交互方式,打破了過去兩年間,AI通過輸入框提問、隨后獲得答案的主流形態。曾熙向霞光社表示,產品設計的差異源自年輕人認識世界的底層邏輯不同,對從小使用emoji、meme和縮寫溝通的Gen Z來說,他們本身就是visual native:更習慣通過圖像和直覺理解世界,而不是先組織語言再提問。也就是說,越來越多的年輕人對于現實世界的認知方式是從“先提問再理解” 轉變為“先看見再理解”。
對圖像的精準理解離不開Chance AI的技術突破。MMMMU-Pro 是目前最嚴苛的多模態基準測試之一,它通過過濾純文本可解題、增加選項干擾,并將問題嵌入圖像中,真正考察 AI 是否具備人類級別的視覺理解與跨學科推理能力,而非依賴模式匹配或文字捷徑。Chance AI Visual Agent 在 MMMU 相關評測中以 86.07% 的準確率位列世界第一,在藝術理解、結構分析與跨語境解釋等任務上表現優秀,甚至超越了人類在2024年的成績。
![]()
實際操作上也可見Chance AI的出色表現,如下圖所示,為一塊坐標于洛杉磯的市中心的石頭,在Chance AI的“看見”里,不只有關于石頭的來歷故事——即一位藝術家把這個石頭從內華達州搬過來花了1300萬美金,還有這一故事背后的意義:這場搬運是為了體現美國的種族和階級對立的問題。
![]()
截至目前,Chance AI的全球年輕用戶已突破20萬,在iOS歐美多個國家進入下載榜Top 3,并在Product Hunt上兩次獲得當日最佳產品(Product of the Day)。在剛剛過去的香港Art Central藝術展上,Chance AI也作為官方創新合作伙伴,深度融入觀眾的觀展體驗,這一能力也首次得到了真實場景的驗證。
面向未來的可能性,曾熙表示,手機拍照分享目前是圖片數據來源最直接、量最大的場景。“現在我們的數據是,每個北美的女生每天會拍2.8次的穿搭,這是非常海量的數據。”而視覺數據本身就創造了價值,“我們想把Visual Agent engine這‘發動機’給搭好,以后我們會有更豐富的數據,會形成視覺的社區,這就是最大的價值。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.