6月9日,重慶市服務(wù)業(yè)大會(huì)召開,提出加快AI賦能產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,深化拓展數(shù)智融合綜合服務(wù)場景。其實(shí),在重慶,AI大模型早已走進(jìn)眾多行業(yè),并且當(dāng)起了從業(yè)者的“專家型助手”。
以重慶中科云從科技有限公司(以下簡稱“云從科技”)自主研發(fā)的從容大模型為例,拿出一張發(fā)票,大模型“看”一眼,就知道是否合規(guī);拿到報(bào)銷材料,大模型交叉比對后,能從幾十張票據(jù)中,準(zhǔn)確“拎”出不符合報(bào)銷要求的票據(jù)。
并且,從容大模型不僅會(huì)干活,還十分優(yōu)秀。2025年5月,從容大模型在國際權(quán)威評測平臺(tái)OpenCompass全球多模態(tài)榜單中,以80.7分的綜合成績登頂榜首。
作為一個(gè)完全國產(chǎn)自研的AI大模型,從容大模型為何能超越谷歌等巨頭,在全球多模態(tài)榜單中取勝?它具體能干哪些事兒?記者進(jìn)行了打探。
![]()
▲2026年6月9日,位于兩江新區(qū)的重慶中科云從科技有限公司,工程師對照屏幕上的應(yīng)用可視化界面,依托從容大模型開展應(yīng)用落地效果核驗(yàn)工作。記者 張錦輝 攝/視覺重慶
在AI多模態(tài)評測賽道跑贏全球頂級(jí)對手
“多模態(tài)榜單的評測,更注重考察AI大模型的綜合能力,而從容大模型剛好是一個(gè)‘多面手’。”云從科技高級(jí)算法工程師劉盛中介紹,在AI領(lǐng)域,模態(tài)指信息的存在形式,如文本、圖像、聲音等數(shù)據(jù)類型,多模態(tài)就是混合處理這些信息。
OpenCompass的全球多模態(tài)測評,涵蓋視覺感知、認(rèn)知理解與跨領(lǐng)域應(yīng)用的8大核心數(shù)據(jù)集,涉及醫(yī)學(xué)健康、數(shù)理邏輯、藝術(shù)設(shè)計(jì)等十余個(gè)專業(yè)領(lǐng)域。
也就是說,要在測評中取得好成績,AI大模型不僅得有過硬的突出實(shí)力,還不能有“拖后腿”的短板。最好是“樣樣通,樣樣精”,才能取得好成績。
以文圖信息處理為例,一部分AI大模型實(shí)際上是分別處理文圖信息,即后臺(tái)實(shí)際上有2個(gè)AI模型在工作,一個(gè)處理文字,一個(gè)處理圖片,二者互相調(diào)用功能,類似于2個(gè)同事配合著干活。
而從容大模型具備All-in-One多模態(tài)框架(即用一個(gè)統(tǒng)一模型或系統(tǒng)集成多種能力),它能同時(shí)將文字和圖片作為信息進(jìn)行處理,相當(dāng)于一個(gè)人的“大腦”和“眼睛”協(xié)同工作,效率自然更高。
記者了解到,從容大模型在OpenCompass的MMBench中文測試、高難度學(xué)科綜合評測及高階推理榜單中均拔得頭籌,并在復(fù)雜場景文本識(shí)別、開放域問答等關(guān)鍵場景中穩(wěn)居全球前列。
好成績的背后是過硬的實(shí)力。據(jù)悉,云從科技在多模態(tài)核心領(lǐng)域持續(xù)深耕,從容大模型聚焦通用視覺語言理解與推理任務(wù),通過多模態(tài)對齊、高階推理、長上下文建模的突破性優(yōu)化,構(gòu)建起了全球領(lǐng)先的技術(shù)壁壘。
從誕生之初就瞄準(zhǔn)解決實(shí)際問題
搭建這一技術(shù)壁壘,云從科技下了近十年的苦功。
早在2016年左右,云從科技就開始著手研發(fā)AI產(chǎn)品。最初,基于初創(chuàng)團(tuán)隊(duì)在雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域的技術(shù)優(yōu)勢,企業(yè)專攻人臉識(shí)別技術(shù),并且很快就取得成果,在金融、安防等領(lǐng)域落地應(yīng)用。
不過,在最初的一批AI產(chǎn)品落地后,用戶的反饋?zhàn)屧茝目萍家庾R(shí)到,僅僅提供會(huì)回答問題的“小助理”,或者會(huì)認(rèn)人的“小秘書”,還遠(yuǎn)遠(yuǎn)不夠。
劉盛中舉了一個(gè)例子:某金融企業(yè)使用云從科技提供的AI產(chǎn)品進(jìn)行風(fēng)控合規(guī)審查,一段時(shí)間后,客戶對AI的金融知識(shí)庫很滿意,夸它是個(gè)法律法規(guī)“萬事通”。但也提出了新的要求:能不能讓AI增加寫報(bào)告、審合同的功能?
“如果要增加這些功能,AI產(chǎn)品不僅得精通法律法規(guī),會(huì)回答人類提出的問題,還得會(huì)識(shí)別票據(jù)、合同、協(xié)議。”劉盛中說,簡單地說,AI產(chǎn)品需要理解報(bào)告、合同等文書中的圖文邏輯關(guān)系,就像一個(gè)真正的金融從業(yè)者一樣。這就要求它的能力必須進(jìn)行全方位的提升。
通過和客戶的深度合作,云從科技運(yùn)用行業(yè)的真實(shí)數(shù)據(jù)沉淀,對AI進(jìn)行了定制化的邏輯推理訓(xùn)練和識(shí)圖訓(xùn)練。讓AI產(chǎn)品不僅能識(shí)別印刷的票據(jù),還能識(shí)別手寫體的收據(jù)、簽名等,同時(shí)還能讀懂文字,理解行業(yè)術(shù)語等。
至此,這款A(yù)I產(chǎn)品才算是在金融行業(yè)真正落地。如今,它能自動(dòng)抽取大量文字和圖片中的有效信息,自動(dòng)識(shí)別姓名等關(guān)鍵文本段,自動(dòng)生成合規(guī)報(bào)告。
“我們意識(shí)到,只有真正能幫客戶解決問題的AI,才能真正產(chǎn)生價(jià)值。”劉盛中說,此后,云從科技決定選擇ALL IN ONE的技術(shù)路線,深耕多模態(tài)大模型,為各行各業(yè)賦能,從容大模型應(yīng)運(yùn)而生。
可管理多個(gè)AI小模型,協(xié)調(diào)復(fù)雜工作
現(xiàn)在,從容大模型已經(jīng)走出重慶,走向全國,在許多場景落地應(yīng)用。記者了解到,作為一個(gè)“多面手”,從容大模型還能當(dāng)“領(lǐng)導(dǎo)”,管理多個(gè)小模型一起工作。
劉盛中介紹,大模型的參數(shù)規(guī)模大,能力更強(qiáng)、泛化更好,但推理成本和資源消耗更高。而相對的,小模型參數(shù)規(guī)模較小、計(jì)算需求低、可邊緣部署在設(shè)備側(cè),效率高、延遲低、還能離線運(yùn)行。
通俗地說,大模型“淵博”,小模型“專精”。大小模型協(xié)同,能在特定場景中發(fā)揮最大化的價(jià)值。
例如,在某電力企業(yè),云從科技基于從容大模型為其開發(fā)了電力大模型,幫助管理發(fā)電的全過程。同時(shí),根據(jù)云從科技提供的解決方案,企業(yè)在關(guān)鍵的安全位置部署多個(gè)小模型,實(shí)時(shí)監(jiān)測電箱門是否關(guān)閉,絕緣索是否破裂等;一旦發(fā)現(xiàn)異常,小模型就立刻“報(bào)告”電力大模型。電力大模型使用識(shí)圖、識(shí)別視頻等能力,迅速判斷是需要工作人員來進(jìn)行維修,還是需要發(fā)出大規(guī)模的緊急告警。
如此一來,既為企業(yè)節(jié)約了AI模型部署的成本,又讓AI模型真正起到了賦能安全生產(chǎn)的作用。
記者了解到,目前,從容大模型已在金融、制造、政務(wù)等多個(gè)領(lǐng)域通過AI智能體實(shí)現(xiàn)規(guī)模化落地。
其中,某銀行基于從容模型與云從科技合作打造風(fēng)控合規(guī)案防智能平臺(tái),構(gòu)建風(fēng)控AI智能體,實(shí)現(xiàn)風(fēng)險(xiǎn)識(shí)別自動(dòng)化和問責(zé)標(biāo)準(zhǔn)化,投訴數(shù)量壓降50%以上;
在電商領(lǐng)域,云從科技為某客戶部署的智能客服平臺(tái),通過多模態(tài)對齊與知識(shí)庫精準(zhǔn)匹配,將問答準(zhǔn)確率提升至95%,客服月均效率提高24%。
“技術(shù)創(chuàng)新最終要服務(wù)于社會(huì)價(jià)值。”云從科技聯(lián)合創(chuàng)始人姚志強(qiáng)表示,團(tuán)隊(duì)將持續(xù)探索多模態(tài)技術(shù)的安全落地模式,以自主創(chuàng)新的AI基礎(chǔ)設(shè)施,為全球智能化轉(zhuǎn)型提供更高效、更包容的技術(shù)支撐。
來源:新重慶-重慶日報(bào)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.