![]()
作者丨Lucas
編輯丨劉恒濤
圖源丨杉巖數(shù)據(jù)
存儲(chǔ)是IT基礎(chǔ)設(shè)施三大支柱之一,與計(jì)算、網(wǎng)絡(luò)共同支撐起數(shù)字經(jīng)濟(jì)的運(yùn)行。但單純的存儲(chǔ)硬件只是一堆冰冷的盤。真正讓數(shù)據(jù)發(fā)揮價(jià)值的,是上層的智能管理系統(tǒng):負(fù)責(zé)數(shù)據(jù)的調(diào)度和整理分類,充分釋放硬件潛能,讓數(shù)據(jù)價(jià)值最大化。
2014年,陳堅(jiān)從華為辭職,創(chuàng)立杉巖數(shù)據(jù),專注于軟件定義存儲(chǔ)系統(tǒng)研發(fā)。通俗來說,就是存儲(chǔ)的功能靠軟件來定義,將存儲(chǔ)功能從硬件中解耦出來,通過軟件實(shí)現(xiàn)對(duì)存儲(chǔ)資源的管理和控制,并用軟件來管理和提升存儲(chǔ)性能。在底層系統(tǒng),不斷突破硬件性能極限;在應(yīng)用層,將海量音視頻、文檔、圖像等數(shù)據(jù)自動(dòng)整理歸類,實(shí)現(xiàn)數(shù)據(jù)的“隨需而用”。
在競(jìng)爭(zhēng)激烈的軟件賽道里,一家創(chuàng)業(yè)公司能活下來已屬不易。但杉巖數(shù)據(jù)不僅活了12年,還做到了中國(guó)對(duì)象存儲(chǔ)市場(chǎng)前三,還拿下了京東方、吉利、國(guó)信證券、南方航空等多個(gè)行業(yè)頭部企事業(yè)單位客戶。如今AI浪潮襲來,大廠紛紛加碼存儲(chǔ)基建,杉巖數(shù)據(jù)的機(jī)會(huì)在哪里?它的護(hù)城河還夠深嗎?
近日,杉巖數(shù)據(jù)完成億元級(jí)D輪融資,由長(zhǎng)勝產(chǎn)業(yè)基金領(lǐng)投,達(dá)晨財(cái)智湖南中小二期基金跟投。長(zhǎng)勝產(chǎn)業(yè)基金是福田資本運(yùn)營(yíng)集團(tuán)旗下的產(chǎn)業(yè)投資基金。本輪資金將用于全面推動(dòng)AI原生數(shù)據(jù)基礎(chǔ)設(shè)施及行業(yè)數(shù)智解決方案的戰(zhàn)略升級(jí),持續(xù)加大關(guān)鍵技術(shù)研發(fā)投入,加速重點(diǎn)行業(yè)及全球市場(chǎng)布局。
![]()
押注對(duì)象存儲(chǔ),從零開拓市場(chǎng)
陳堅(jiān),1975年生于長(zhǎng)沙,本科及碩士就讀于湖南大學(xué)計(jì)算機(jī)系,主攻分布式計(jì)算方向。2000年畢業(yè)后,他加入到了華為研發(fā)部門,專注于分布式存儲(chǔ)架構(gòu)在實(shí)際場(chǎng)景中的應(yīng)用探索。
2014年,陳堅(jiān)觀察到,隨著5G通信、云計(jì)算等行業(yè)的快速發(fā)展,數(shù)據(jù)即將迎來爆發(fā)式增長(zhǎng)。以往采用的集中式存儲(chǔ),由于擴(kuò)展性差、靈活性不足,已無法滿足不斷增長(zhǎng)的數(shù)據(jù)存儲(chǔ)需求。
而新興的分布式存儲(chǔ)能夠擴(kuò)展存儲(chǔ)空間,且管理便捷,很有可能成為新一代的基礎(chǔ)設(shè)施。基于這一判斷,在華為工作了14年的陳堅(jiān)果斷辭職,創(chuàng)辦了杉巖數(shù)據(jù)。
![]()
彼時(shí),存儲(chǔ)市場(chǎng)已被頭部企業(yè)瓜分,客戶普遍更信賴大廠品牌的集中式存儲(chǔ),對(duì)創(chuàng)業(yè)公司會(huì)有諸多擔(dān)心。
“客戶會(huì)問,你公司能活多久?數(shù)據(jù)存在你這里,后續(xù)維護(hù)找誰?”陳堅(jiān)坦言,在存儲(chǔ)行業(yè),數(shù)據(jù)安全是首要考量,創(chuàng)業(yè)公司處于天然的劣勢(shì)。
面對(duì)大廠的壟斷格局,陳堅(jiān)選擇了一條差異化道路:向大廠尚未關(guān)注的對(duì)象存儲(chǔ)發(fā)力。
大數(shù)據(jù)與移動(dòng)互聯(lián)網(wǎng)的爆發(fā)下,海量的圖片、視頻等非結(jié)構(gòu)化數(shù)據(jù)急劇增長(zhǎng)。這類數(shù)據(jù)很難整理,傳統(tǒng)文件存儲(chǔ)只提供文件名、時(shí)間、創(chuàng)建人等基礎(chǔ)屬性,無法有效分類,企業(yè)管理成本隨之上升。
2016年底,團(tuán)隊(duì)決定做分布式對(duì)象存儲(chǔ)。對(duì)象存儲(chǔ)是一種新的數(shù)據(jù)存儲(chǔ)架構(gòu),可對(duì)數(shù)據(jù)附加多維度標(biāo)簽,并支持快速檢索。在醫(yī)療、金融、運(yùn)營(yíng)商、交通等涉及圖片、文字、視頻等多形態(tài)數(shù)據(jù)場(chǎng)景中,對(duì)象存儲(chǔ)尤為適用。
但當(dāng)時(shí),這一領(lǐng)域在企業(yè)級(jí)市場(chǎng)幾乎是一片“無人區(qū)”。陳堅(jiān)回憶,很多客戶連對(duì)象存儲(chǔ)是什么都不清楚,團(tuán)隊(duì)只能從零開始,說服客戶嘗試體驗(yàn),慢慢開拓業(yè)務(wù)。
![]()
部署杉巖存儲(chǔ)系統(tǒng)的IT數(shù)據(jù)中心
2017年,杉巖數(shù)據(jù)拿到了廣發(fā)證券的訂單。當(dāng)時(shí),廣發(fā)證券每月會(huì)產(chǎn)生數(shù)千萬個(gè)電子檔案,視頻、圖片、文字等金融數(shù)據(jù)堆在一起,傳統(tǒng)方式難以分類和整理。于是,杉巖數(shù)據(jù)為其打造對(duì)象存儲(chǔ)系統(tǒng),用標(biāo)簽把數(shù)據(jù)自動(dòng)歸類,讓用戶能即時(shí)查詢數(shù)據(jù),提高數(shù)據(jù)利用效率。
之后,杉巖數(shù)據(jù)的客戶版圖開始向外輻射,從金融到交通、醫(yī)療、運(yùn)營(yíng)商,再到制造業(yè)。到2019年,杉巖數(shù)據(jù)已在對(duì)象存儲(chǔ)市場(chǎng)中拿下16.3%的份額,穩(wěn)居行業(yè)前列。
![]()
存得下是前提
管得好、用得爽是目標(biāo)
隨著對(duì)象存儲(chǔ)市場(chǎng)逐漸被激活,大約在2019年至2020年前后,華為、浪潮等大型廠商開始跟進(jìn)這一賽道。
陳堅(jiān)又開始謀劃第二次轉(zhuǎn)型。在他看來,僅僅幫客戶“存得下”還不夠,還要讓數(shù)據(jù)“管得好、用得爽”,這才能跟其他廠商區(qū)分開。為此,他提出了“數(shù)據(jù)感知”的理念:讓存儲(chǔ)系統(tǒng)能夠感知數(shù)據(jù)內(nèi)容。
具體而言,就是讓存儲(chǔ)提前理解文件內(nèi)容,提煉出關(guān)鍵信息。如此一來,用戶在海量數(shù)據(jù)中檢索時(shí),不需要逐個(gè)翻閱原始文件,而是能直接檢索到文件內(nèi)部的核心信息。
基于這一理念,面向先進(jìn)制造行業(yè),杉巖數(shù)據(jù)打造了杉巖檢測(cè)數(shù)據(jù)管理系統(tǒng)(IDM),這是業(yè)內(nèi)首款專注檢測(cè)數(shù)據(jù)管理的工業(yè)軟件。
二次轉(zhuǎn)型后的第一個(gè)客戶,是一家負(fù)責(zé)芯片封測(cè)的企業(yè)。其產(chǎn)線上的檢測(cè)設(shè)備持續(xù)產(chǎn)生海量的檢測(cè)圖像,數(shù)據(jù)總量達(dá)百億規(guī)模。這些數(shù)據(jù)還需要長(zhǎng)期保存,還要能快速檢索和導(dǎo)出。一旦出現(xiàn)質(zhì)量問題,能第一時(shí)間追溯。
問題在于,每條產(chǎn)線成百上千臺(tái)機(jī)臺(tái)設(shè)備,查詢這些數(shù)據(jù)是痛苦的過程,要追溯某個(gè)產(chǎn)品的問題,必須先知道它是哪條線、哪臺(tái)設(shè)備、哪天生產(chǎn)的,然后去對(duì)應(yīng)硬盤里翻找。
杉巖數(shù)據(jù)為客戶部署杉巖IDM系統(tǒng)后,可實(shí)現(xiàn)檢測(cè)數(shù)據(jù)的自動(dòng)采集與匯聚,并自動(dòng)提煉關(guān)鍵信息、打好標(biāo)簽——設(shè)備號(hào)、物料號(hào)、缺陷類型……查詢質(zhì)量問題時(shí),可直接在上層業(yè)務(wù)系統(tǒng)中快速查詢定位,響應(yīng)時(shí)間從幾十分鐘甚至幾個(gè)小時(shí),縮短至秒級(jí)。
截至目前,杉巖IDM已廣泛應(yīng)用到消費(fèi)電子、汽車電子、半導(dǎo)體、新能源動(dòng)力電池、光伏等先進(jìn)制造業(yè)。杉巖IDM已成為公司營(yíng)收的主力產(chǎn)品之一。
![]()
在陳堅(jiān)看來,第二階段的轉(zhuǎn)型,是將存儲(chǔ)系統(tǒng)產(chǎn)品融入行業(yè)場(chǎng)景中,必須深入理解并解決客戶在該場(chǎng)景下的核心痛點(diǎn)。
“你會(huì)發(fā)現(xiàn),過去做存儲(chǔ)系統(tǒng),是不需要懂行業(yè)的。”陳堅(jiān)說道,“但如今,一旦你懂得了行業(yè)知識(shí),你的產(chǎn)品就會(huì)自帶行業(yè)屬性。”
這就是杉巖數(shù)據(jù)的“護(hù)城河”,來自長(zhǎng)期的行業(yè)深耕。“競(jìng)爭(zhēng)對(duì)手想抄你的東西,光看幾篇論文是遠(yuǎn)遠(yuǎn)不夠的。”他強(qiáng)調(diào),“你必須真正擁有客戶,和他們深入交流,腳踏實(shí)地地扎進(jìn)場(chǎng)景,在一次次復(fù)雜迭代中,才能沉淀出真正的能力。”
陳堅(jiān)指出,大廠并非沒有能力介入,但這一賽道過于細(xì)分,巨頭們難以真正深入場(chǎng)景。至于一些創(chuàng)業(yè)公司,早期雖有跟進(jìn),后來紛紛放棄。他們?nèi)钡牟皇羌夹g(shù),而是制造業(yè)場(chǎng)景的經(jīng)驗(yàn)積累。
![]()
AI浪潮來襲
杉巖數(shù)據(jù)如何迎勢(shì)而上
隨著AI浪潮的興起,存儲(chǔ)行業(yè)迎來了新的挑戰(zhàn)和機(jī)遇。作為一家數(shù)據(jù)基礎(chǔ)設(shè)施廠商,如何在AI浪潮中找到適合自己的落地場(chǎng)景,成為杉巖數(shù)據(jù)面臨的新戰(zhàn)略命題。
為此,杉巖數(shù)據(jù)在2026年提出了第三階段戰(zhàn)略:“for AI”和“+AI”。
for AI,即聚焦AI原生基礎(chǔ)設(shè)施,打造AI數(shù)據(jù)底座。杉巖數(shù)據(jù)打造的新一代AI數(shù)據(jù)平臺(tái)——杉巖AIDP,以對(duì)象存儲(chǔ)為基礎(chǔ),融合多協(xié)議訪問、智能分層、存算融合和全局統(tǒng)一命名空間等創(chuàng)新技術(shù),廣泛賦能數(shù)據(jù)采集、預(yù)處理、模型訓(xùn)練等環(huán)節(jié),目前已在具身智能、智算中心、量化金融、科研創(chuàng)新等多個(gè)行業(yè)探索落地。
以具身智能場(chǎng)景為例,在采集階段,杉巖AIDP能夠適配觸覺、視覺、運(yùn)動(dòng)軌跡等多模態(tài)數(shù)據(jù)的高效采集,對(duì)于來自遙操設(shè)備、仿真平臺(tái)、本體采集等多來源數(shù)據(jù)應(yīng)收盡收。同時(shí)內(nèi)置智能數(shù)據(jù)處理能力,自動(dòng)規(guī)整多模態(tài)數(shù)據(jù),高效構(gòu)建機(jī)器人訓(xùn)練集。
在AI訓(xùn)練與推理階段,則需要具備“高性能數(shù)據(jù)吞吐”與“高效數(shù)據(jù)索引”能力。例如,當(dāng)GPU集群需要讀取成千上萬張圖片進(jìn)行下一輪訓(xùn)練時(shí),存儲(chǔ)系統(tǒng)能迅速將數(shù)據(jù)“喂”給GPU,確保算力不被閑置。
另一個(gè)方向是“+AI”,即把AI能力注入制造行業(yè)的質(zhì)量檢測(cè)場(chǎng)景,在杉巖數(shù)據(jù)現(xiàn)有IDM中,引入工業(yè)質(zhì)檢大模型能力。通過 AI 算法賦能,實(shí)現(xiàn)從被動(dòng)的數(shù)據(jù)存儲(chǔ)、管理,向主動(dòng)質(zhì)量預(yù)判、工藝優(yōu)化升級(jí)的躍遷。
陳堅(jiān)舉例,杉巖IDM在運(yùn)行過程中沉淀了大量高質(zhì)量檢測(cè)數(shù)據(jù)集,可以用于訓(xùn)練工業(yè)質(zhì)檢數(shù)據(jù)大模型。當(dāng)發(fā)現(xiàn)某條生產(chǎn)線的不良品比例異常升高時(shí),大模型就能及時(shí)預(yù)測(cè)可能出現(xiàn)的質(zhì)量問題和質(zhì)量趨勢(shì),并給出工藝參數(shù)調(diào)整參考,優(yōu)化質(zhì)檢流程,提高產(chǎn)品良率。
在更長(zhǎng)期的布局上,陳堅(jiān)提出了“類腦存儲(chǔ)”的發(fā)展方向。在他看來,數(shù)據(jù)存儲(chǔ)與算力調(diào)度本是一體——就像大腦既能存儲(chǔ)記憶、也能處理思考。杉巖數(shù)據(jù)的目標(biāo)是讓存儲(chǔ)系統(tǒng)同時(shí)具備“記憶”與“思考”的能力,最終實(shí)現(xiàn)存算融合。
基于這一理念,杉巖數(shù)據(jù)與湖南大學(xué)成立了合資公司“杉湖智算”,依托湖南大學(xué)、國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心在算力領(lǐng)域的先進(jìn)技術(shù),以及杉巖數(shù)據(jù)持續(xù)創(chuàng)新能力及市場(chǎng)積累,專注于算力的管理與調(diào)度,像打造數(shù)據(jù)存儲(chǔ)、管理和應(yīng)用系統(tǒng)一樣,構(gòu)建面向未來的智能算力底座。
“這是業(yè)務(wù)的跨界延伸,對(duì)象不同,本質(zhì)是一樣的。”陳堅(jiān)表示,“存與算,本是一體兩面——都是為了提升資源使用效率。”
但無論如何變化,陳堅(jiān)始終堅(jiān)持,將數(shù)據(jù)作為主線。“大數(shù)據(jù)時(shí)代,我們圍繞數(shù)據(jù)的存儲(chǔ)、管理、應(yīng)用;AI時(shí)代,我們圍繞Token的生產(chǎn)、效率與價(jià)值——主線從未改變,只是命題在迭代。”
![]()
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.