无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

階躍的新模型,正在大模型的下個戰場,搶占先機

0
分享至


你們發沒發現,現在新模型發布,大家越來越不關注榜單排名和分數了。

大家逐漸有了一個共識,單點能力的價值正在弱化,能讓我的Agent干好活的模型,才是好模型。

做好Agent的基層模型,對于大模型廠商來說,很可能是未來更大的一塊蛋糕,下一個兵家必爭之地。

階躍星辰是比較快意識到這件事,并采取行動的模型廠商。這次階躍發布的新模型「Step 3.7 Flash」,聲稱是面向生產級Agent的高效模型。


于是,我在小龍蝦中添加了Step 3.7 Flash,用真實場景來看看效果。順便分享一下我日常獲取AI信息的工作流。

這里分為三步,廣泛抓取AI資訊 -> 深入獲取話題信息 -> 做成可視化信息圖。

第一步,抓取前沿AI資訊。

這個任務看似簡單,實則非常之復雜、繁瑣,成功率也不高。

我會給龍蝦大幾十個AI資訊網站,并按抓取策略分為三類,分別是RSS解析、Crawl4AI、Paywall或其他方案。不同網站的安全機制不同,抓取難度不同,也受網絡狀態影響。所以這一堆網站通常只有一小部分能抓出數據。

這次我讓Step抓取3日內的AI資訊。

發完指令,我本想刷刷手機,等著任務完成。過了幾分鐘,我瞥了一眼電腦,竟然完成了!成功抓取349條。


之前用Claude和Gemini,效果雖然好,但每次都得20分鐘起步,我一般放后臺執行。

我一看階躍開發平臺,只花了兩塊錢!大約只有Claude花費的1/20,而且還是第三方渠道,懂得都懂。

看看輸出文件。


首先,349條這個數量,就遠超我之前每次執行的結果。但有個小問題,會有一些泛科技、其他學科這種非精準AI類的資訊。

然后單看每個字段的結果,都不錯,沒有什么幻覺。尤其是原鏈接,我點開的幾個都是對的。以前測過能力中等的模型,鏈接地址很容易出現編造情況。

這一步對工具調用能力要求其實很高。它不光是簡單檢索,還要在RSS、腳本撰寫、程序運行、網頁抓取、鏈接讀取、文件寫入之間來回切換。

我以前用好幾個模型跑過這個任務,成功率和效果都一般。一進入這種多工具、多步驟流程,就容易出現漏步驟、重復調用、卡在無效鏈接上、中途忘記目標。

Step 3.7 Flash的工具調用鏈路比較穩,沒有把任務跑散。

第二步,針對想了解的話題,深入獲取更多信息。

這里分兩步,首先檢索話題的相關文章鏈接,然后整理匯總全部信息點。

這樣做的好處是,可以更全面了解整件事,包括延展事件和相似事件。并且按照事件邏輯梳理信息點,列出每個信息點對應的原文,可以更快速、清晰地閱讀,還能避免幻覺。

比如我想了解這個話題:

“Anthropic聯合創始人前往梵蒂岡,告訴教皇他們在AI模型中發現了‘令人不安’的東西”

把話題丟給龍蝦,讓它先收集鏈接,再匯總信息。


依然迅速完成任務。下面是兩個文件內容:



清晰,且準確。這兩份文件可以自己閱讀,也可以作為寫文章的素材來源。

一個真正能干活的Agent,不能只靠大模型的訓練數據回答問題,它必須會主動找資料、判斷來源、交叉驗證,再把搜索結果變成可引用、可追溯的結構化信息。

這里得益于Step自帶的檢索能力,任務完成得很絲滑。

第三步,生成可視化信息圖。

我搞了4個不同風格的信息圖。這里沒有指定具體風格,沒有復雜prompt,全憑Step自己發揮。


結果如下:





不錯吧,適合放在文章中,方便讀者理解和保存。

這里提一下,Step 3.7 Flash是具備原生多模態能力的。所以圖片理解、視覺檢索這些任務,Agent就不用調用外部工具了。

比如我把第一張信息圖的一部分截圖給它,讓它調整文字。


Step找到了對應位置,進行了正確修正。


工作流跑完,整體是超出我預期的。

咱實話實說,效果上的確Claude opus 4.7更勝一籌,但對于絕大多數日常任務,Step 3.7 Flash完全夠用,而且執行速度和花費上非常有競爭力。

就像第一步抓取AI資訊這種任務,日常用Claude opus 4.7屬實有點花不起。

網上好多人調侃,說AI并沒有讓我們更輕松,有了AI我反而更累。

我自己也有過這個階段,但現在AI實實在在的減輕了我的工作。轉折點就是,一個好用的Agent框架,搭配好一個穩定、高效、經濟承受范圍內的基礎模型。

比如我剛剛展示的工作,本就不需要多少人為參與,可在過去常常占滿我一天的時間,現在半小時搞定。省下的時間精力,可以支撐我做更多高價值的工作。

這套AI信息獲取工作流,這對AI博主有用,對產品經理、投資人、研究員、創業者也一樣有用。

我們缺的從來都不是信息量,而是信息獲取、整理和吸收的效率。

看完實測,咱說回Step 3.7 Flash模型本身。

光看模型名稱,你可能覺得這只是一個更快、更便宜的Flash模型。

但這次階躍給它的定位,不只是這樣。

按階躍星辰給它的定位,Step 3.7 Flash是面向生產級Agent的高效率Flash模型,為Agent、Coding、Search與多模態工作流而生,開放、開源可部署,并且為高效完成真實任務而優化。


什么是生產級Agent?

生產級任務不是一次回答,它是一串連續動作。理解目標,拆任務,搜索實時信息,讀文檔,篩選來源,整理證據,生成結果,再檢查有沒有遺漏、有沒有嚴格遵循指令。

中間任何一步慢一點、歪一點、漏一點,最后都會變成成本。

下一階段模型競爭,看的不會只是單點能力,而是Agent loop里的總效率。

便宜的模型,可能每次執行低效,跑完整個任務并沒省錢。

聰明的模型,可能執行緩慢,或價格昂貴,實際生產環境根本跑不起來,或跑不起。

所以現在大家對模型的要求,也可以說大家的Agent對模型的要求,是能不能以更低延遲、更低成本、更穩定的方式,把完整工作流跑完。

Step 3.7 Flash的價值,正好落在這里。

另外,提到生產級,必須要提開源。

對普通用戶來說,是否開源并不性感。但對做生產環境的人來說,開源意味著安全。

很多企業做Agent,重點考慮的是數據邊界、穩定性、版本可控、業務系統集成、長期維護。

Step 3.7 Flash作為開源、可本地部署的模型,給的是另一種掌控感。

可控性更強,部署更靈活,集成更深,信任才有地方落地。

而用戶的信任,就是模型廠商最大的籌碼。

Step 3.7 Flash還有一個點,原生多模態。

在很多場景中,數據并不都是文本形態。截圖、PDF、網頁、視頻,都會進入工作流。

過去開發者可能要額外編排視覺模塊,把圖片先交給OCR,再交給另一個模型理解,再把結果塞回Agent流程。

工程里最貴的,經常不是某個模塊本身,而是模塊之間的銜接。

Step 3.7 Flash的原生多模態意義就在這兒。視覺理解可以直接進入Agent工作流,和代碼生成、搜索、工具調用放在一起。

對開發者來說,這省下來的不只是一段prompt,更是編排成本。

最后,如果你還在為Agent尋找合適的模型,那 Step 3.7 Flash值得一試。 不用糾結紙面參數,把它放進你的真實工作流里,才能真正感受到它的效率與優勢。

與此同時,在AI產業化全速推進的當下,也期待更多廠商跳出參數內卷,深耕真實場景,推出更多貼合生產級需求、能落地、能干活的優質模型。

如果你有任何看法,歡迎在評論區一起討論

如果有一點收獲,可以點贊、轉發、推薦文章,關注「AI機器人茶館」

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
瑞典理發師:哲凱的發型是現在瑞典年輕人里最流行的;他本人很隨和

瑞典理發師:哲凱的發型是現在瑞典年輕人里最流行的;他本人很隨和

懂球帝
2026-06-14 00:20:05
領先16分慘遭逆轉,馬刺輸球最大罪人揪出,無可爭議!

領先16分慘遭逆轉,馬刺輸球最大罪人揪出,無可爭議!

體育見習官
2026-06-14 11:33:47
京城的飯局與騙局:京西賓館遭遇“山寨協會”【20】

京城的飯局與騙局:京西賓館遭遇“山寨協會”【20】

金哥說新能源車
2026-06-14 02:18:27
世界杯最窮球隊?15萬人小國坐舊校車來比賽!海島美到窒息!免簽

世界杯最窮球隊?15萬人小國坐舊校車來比賽!海島美到窒息!免簽

尋墨閣
2026-06-13 12:57:20
苦盡甘來!2026年夏季好運氣數之不盡,事業迎來滿堂紅的3個生肖

苦盡甘來!2026年夏季好運氣數之不盡,事業迎來滿堂紅的3個生肖

毅談生肖
2026-06-14 11:47:22
一輪牛市,科技見頂就是牛市結束,大家被“洗腦”了!

一輪牛市,科技見頂就是牛市結束,大家被“洗腦”了!

郭小凡財經
2026-06-14 09:13:07
印第安人消亡真相:西方編造的天花殺人謊言,如今被基因研究揭穿

印第安人消亡真相:西方編造的天花殺人謊言,如今被基因研究揭穿

掠影后有感
2026-06-13 10:14:11
天妒英才!從狀元熱門跌至12號秀,三次大傷太慘,在雷霆吃空餉

天妒英才!從狀元熱門跌至12號秀,三次大傷太慘,在雷霆吃空餉

你的籃球頻道
2026-06-14 09:45:05
危機來了!5天未被發現,美無人艇潛入臺海,接近中國護衛艦拍照

危機來了!5天未被發現,美無人艇潛入臺海,接近中國護衛艦拍照

超喜歡我的狗子
2026-06-13 16:29:43
只是技術故障!國際足聯:瑞士造點沒越位,圖像沒能正常顯示

只是技術故障!國際足聯:瑞士造點沒越位,圖像沒能正常顯示

澎湃新聞
2026-06-14 08:36:28
曝森林狼休賽期醞釀大交易

曝森林狼休賽期醞釀大交易

體壇周報
2026-06-13 22:30:14
徹底翻車!Lisa世界杯表演被韓網痛批低俗,主題曲內容太離譜

徹底翻車!Lisa世界杯表演被韓網痛批低俗,主題曲內容太離譜

觀魚聽雨
2026-06-13 14:16:48
油價大跌超8毛/升,“創2個多月新低”的油價,6月18日或再大跌

油價大跌超8毛/升,“創2個多月新低”的油價,6月18日或再大跌

油價早知道
2026-06-14 01:49:21
布達拉宮剖開內部圖看懂:為啥有人逛著會覺得陰森壓抑

布達拉宮剖開內部圖看懂:為啥有人逛著會覺得陰森壓抑

西樓知趣雜談
2026-06-13 19:18:15
16.3%青年失業率,明明失業的人越來越多為什么社會還這么穩定?

16.3%青年失業率,明明失業的人越來越多為什么社會還這么穩定?

原廣工業
2026-06-14 11:07:46
《教父》柯里昂告訴兒子:和周圍人搞好關系的最高級方式,不是請客吃飯,也不是阿諛奉承,而是做到這兩點

《教父》柯里昂告訴兒子:和周圍人搞好關系的最高級方式,不是請客吃飯,也不是阿諛奉承,而是做到這兩點

心理觀察局
2026-06-14 10:38:25
什么是知識的詛咒?網友:但凡被知識污染一點也想不出淡硫酸這詞

什么是知識的詛咒?網友:但凡被知識污染一點也想不出淡硫酸這詞

另子維愛讀史
2026-06-13 23:39:37
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

花折亦度無情
2026-06-13 16:49:17
銀行工作人員提醒,60歲以上大額存款的老人,注意5件事

銀行工作人員提醒,60歲以上大額存款的老人,注意5件事

別人都叫我阿腈
2026-06-09 18:55:04
廣東男籃大洗牌!三人徹底退出培養,天賦小將鬧心態遭交易

廣東男籃大洗牌!三人徹底退出培養,天賦小將鬧心態遭交易

體育見習官
2026-06-14 09:50:25
2026-06-14 12:19:00
北茗的AI茶館 incentive-icons
北茗的AI茶館
探討AI領域內容,展望人機共生的美好未來!
89文章數 14關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

具俊曄曝大S離世前虛弱照,難怪小s退讓

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

手機
時尚
家居
房產
公開課

手機要聞

告別4499元!小米18起售價將突破5000元大關 首發高通驍龍8E6

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

家居要聞

空間微調 移形換境

房產要聞

海南最賺錢行業曝光!最快4年半,??谌钯I三房!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版