亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

階躍模型上新,幫我搞定了產(chǎn)品開發(fā)的大麻煩

0
分享至


好幾天沒更文章了,最近忙到起飛,在開發(fā)一款A(yù)I教育類應(yīng)用,調(diào)代碼調(diào)得焦頭爛額。

不做不知道,教育領(lǐng)域的一些場景落地是真挺難。比如中學(xué)數(shù)學(xué)題解析,要求推導(dǎo)嚴(yán)謹(jǐn),公式不能解析渲染錯(cuò)誤。再比如生成幾何題,不僅要保證出題正確,幾何圖形也要與題目嚴(yán)格對(duì)應(yīng)。

抓耳撓腮之際,階躍星辰邀請(qǐng)我測(cè)評(píng)新模型「Step 3.5 Flash 2603」。正好,把它應(yīng)用到幾個(gè)有難度的編程場景,看看表現(xiàn)如何。


Step 3.5 Flash 2603有以下幾個(gè)核心亮點(diǎn):

  • 更適合高頻編程與Agent工作流:模型非常適合編程任務(wù),尤其是bug修復(fù)、patch生成、多輪代碼修改、Agent工作流內(nèi)結(jié)構(gòu)化輸出與任務(wù)執(zhí)行。

  • 更高響應(yīng)、更低延遲:增加了Low think模式,并非降低能力,而是避免簡單任務(wù)過度思考,減少不必要的token消耗,提高高頻任務(wù)的響應(yīng)效率。

  • 更適配Agent框架與開發(fā)工具:使用應(yīng)用到Agent工作流中,針對(duì)OpenClaw、Claude Code等主流Agent框架進(jìn)行了兼容優(yōu)化。

下面開始場景實(shí)戰(zhàn)!

場景一 數(shù)學(xué)公式處理

說實(shí)話,做這個(gè)產(chǎn)品,最讓我頭疼的就是數(shù)學(xué)公式解析錯(cuò)誤。像這樣:


大模型生成包含大量復(fù)雜公式的文本,要面臨 JSON+LaTeX+HTML 多重解析的考驗(yàn)。數(shù)據(jù)流轉(zhuǎn)過程中,各種轉(zhuǎn)義,反斜杠要將我淹沒了......


大家都知道,大模型的輸出本就不穩(wěn)定,要是公式中有一個(gè)細(xì)節(jié)錯(cuò)誤,甚至缺少一個(gè) “\”,那就是一串亂碼。

我用 Step 3.5 Flash替換原有模型,用來根據(jù)題目,輸出解答過程,并展示在HTML網(wǎng)頁中。下面是兩個(gè)示例:

已知橢圓E的中心為坐標(biāo)原點(diǎn),對(duì)稱軸為x軸、y軸,且過A(0,-2),B(3/2,-1)兩點(diǎn)。 (1)求E的方程; (2)設(shè)過點(diǎn)P(1,-2)的直線交E于M,N兩點(diǎn),過M且平行于x軸的直線與線段AB交于點(diǎn)T,點(diǎn)H滿足向量MT=向量TH。證明:直線HN過定點(diǎn)。


已知函數(shù)f(x)=2ln x -ax2 +1(a∈R)。 (1)討論函數(shù)f(x)的單調(diào)性; (2)若存在正數(shù)x,使f(x)≥0成立,求a的取值范圍; (3)若0


可以看到,各類數(shù)學(xué)符號(hào)、公式都沒有解析和渲染錯(cuò)誤,效果還是比較穩(wěn)定的。

場景二|幾何圖形數(shù)據(jù)

產(chǎn)品中有一個(gè)需求是,根據(jù)數(shù)學(xué)幾何題目,生成對(duì)應(yīng)的幾何圖形。

具體的實(shí)現(xiàn)方法是,把題目丟給大模型來生成繪圖數(shù)據(jù)(如下,包含了2D/3D、點(diǎn)、線、圖形、圖例等),然后據(jù)此用Python的 Matplotlib組件生成幾何圖形圖片。

{ "type": "3D", "points": {"A": [0,0,5], "B": [2,0,0], "C": [-2,0,0], "P": [0,3,0]}, "lines": [ {"nodes": ["A","B"], "style": "solid"}, {"nodes": ["B","C"], "style": "dashed"} ], "curves": [{"type": "circle", "center": [0,0], "r": 2}], "labels": {"A": "top", "B": "bottom"} }

但讓大模型理解題目,理解點(diǎn)線之間的關(guān)系,理解空間關(guān)系,并且生成結(jié)構(gòu)化幾何數(shù)據(jù),是很難的。

讓 Step 3.5 Flash試試:

在棱長為2的正方體ABCD-A?B?C?D?中,E為棱AA?的中點(diǎn),點(diǎn)F滿足A?F=λA?B?(0≤λ≤1),則(多選) A.當(dāng)λ=0時(shí),AC?⊥平面BDF B.對(duì)任意λ∈[0,1],三棱錐F-BDE的體積是定值 C.存在λ∈[0,1],使得AC與平面BDF所成的角為π/3 D.當(dāng)λ=2/3時(shí),平面BDF截該正方體的外接球所得截面的面積為56/19π


(2024全國甲理,19,12分,中)如圖,在以A,B,C,D,E,F為頂點(diǎn)的五面體中,四邊形ABCD與四邊形ADEF均為等腰梯形, EF∥AD,BC∥AD,AD=4,AB=BC=EF=2,ED=√10,FB=2√3,M為AD的中點(diǎn)。 (1)證明:BM∥平面CDE; (2)求二面角F-BM-E的正弦值。


本來沒抱太大希望,沒想到效果還真不錯(cuò)。

還有個(gè)點(diǎn),試了好幾個(gè)模型都做不好,就是被遮擋的線畫成虛線,其他模型要么畫成實(shí)線,要么干脆不連線。我用 Step 3.5 Flash測(cè)了幾道題,大多數(shù)都畫對(duì)了。

場景三|數(shù)據(jù)統(tǒng)計(jì)與可視化圖表

這里實(shí)現(xiàn)的是一個(gè)試卷解析功能,根據(jù)多張?jiān)嚲韴D片,生成對(duì)試卷的解析報(bào)告,包含試卷照片、每道題目、答案解析、知識(shí)點(diǎn),并對(duì)整體進(jìn)行統(tǒng)計(jì),生成可視化圖表。

實(shí)現(xiàn)流程是,先用其他大模型進(jìn)行圖片識(shí)別( Step 3.5 Flash目前不支持圖像識(shí)別 ),識(shí)別出試卷中的題目,然后用 Step 3.5 Flash解答題目,識(shí)別知識(shí)點(diǎn),并進(jìn)行統(tǒng)計(jì)。再根據(jù)這些數(shù)據(jù),生成HTML報(bào)告。

這個(gè)功能中,需要反復(fù)調(diào)試的點(diǎn)包括:保證每道題都解答正確,并且公式輸出正確;知識(shí)點(diǎn)識(shí)別正確;公式解析正確;可視化圖表數(shù)據(jù)準(zhǔn)確、視覺美觀、位置準(zhǔn)確。

我用 Step 3.5 Flash去生成HTML代碼,看看效果:


19道題、這么多公式,幾乎沒有出現(xiàn)渲染錯(cuò)誤,最后的環(huán)狀圖非常直觀,整體UI也是簡潔清新風(fēng)。

一個(gè)小問題是, 環(huán)狀圖中內(nèi)容太多的話,會(huì)有圖文重疊。

之前用其他模型,去解答題目,生成HTML代碼,調(diào)試了很多很多輪才能達(dá)到可用的程度。這次用 Step 3.5 Flash只調(diào)試了6輪。

還有個(gè)小技巧,在解答題目時(shí),使用 low think模式,減少用戶等待時(shí)間。在用 Step 3.5 Flash生成代碼時(shí),用high think模式,獲得更好的效果。

這次將Step 3.5 Flash 2603應(yīng)用到正在做的產(chǎn)品中,體驗(yàn)還是很不錯(cuò)的。

之前折磨我一兩天的Bug, Step 調(diào)試幾輪就能出結(jié)果。

輸出穩(wěn)定性也很高,像數(shù)學(xué)這種對(duì)精確度有極高要求的場景,或者要求輸出固定JSON格式的場景,Step表現(xiàn)都不錯(cuò)。

此外,速度是真挺快,尤其是深度思考模式。之前用的模型,雖然效果不錯(cuò),但思考時(shí)間太長。一條工作流中有幾個(gè)大模型節(jié)點(diǎn),跑一次等的花都謝了。

測(cè)評(píng)完,看了眼后臺(tái)的token消耗,沒花多少,蠻省錢的。

當(dāng)然, Step 3.5 Flash沒有神到任何編程任務(wù)都能一次跑通,但它確實(shí)會(huì)大大縮短Debug時(shí)間。

如果你是純技術(shù)小白, Step 3.5 Flash對(duì)你可能沒那么驚艷,它還不能無卡點(diǎn)生成復(fù)雜軟件 。如果你是一個(gè)開發(fā)者,真的建議把工作流中的模型,換成 Step 3.5 Flash試一試。

目前有兩種方式使用 Step 3.5 Flash 2603。

  • 方式一:調(diào)用API

可以通過OpenAI兼容接口調(diào)用 Step 3.5 Flash 2603。Python代碼示例:

print(answer)

其中,“ reasoning_effort”的值為“high”,是深度推理模式;值為“l(fā)ow”,是快速模式。

此外,由于模型可能會(huì)優(yōu)先在Step Plan上線,base url可能會(huì)變更為:

https://api.stepfun.com/step_plan/v1。

  • 方式二:接入Coding Agent

可以在你的Agent平臺(tái),將Step添加為Custom Provider。如果你的平臺(tái)內(nèi)置了階躍星辰模型列表,例如Cherry Studio,那就可以直接添加“ step-3.5-flash-2603 ”模型。

Key需要在階躍星辰開放平臺(tái)獲取:

https://platform.stepfun.com

幾分鐘的嘗試,也許能讓整個(gè)項(xiàng)目節(jié)省大量時(shí)間,趕快去試試吧~

如果你有任何看法,歡迎在評(píng)論區(qū)一起討論

如果有一點(diǎn)收獲,可以點(diǎn)贊、轉(zhuǎn)發(fā)、推薦文章,關(guān)注「AI機(jī)器人茶館」


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
沒得商量了,中國軍工訂單被搶,馬國找到新賣家,將再購5艘軍艦

沒得商量了,中國軍工訂單被搶,馬國找到新賣家,將再購5艘軍艦

泠泠說史
2026-04-16 19:29:38
A股,尾盤傳來一個(gè)“重磅利好”信號(hào),明天,或?qū)⒂瓉泶笞儽P!

A股,尾盤傳來一個(gè)“重磅利好”信號(hào),明天,或?qū)⒂瓉泶笞儽P!

夜深愛雜談
2026-04-16 16:24:29
一個(gè)人認(rèn)知在不在你之上,看這4個(gè)細(xì)節(jié)就夠了

一個(gè)人認(rèn)知在不在你之上,看這4個(gè)細(xì)節(jié)就夠了

洞見
2026-04-16 11:35:51
內(nèi)娛最好命闊太: 住億萬豪宅, 一頓飯賺7000萬, 被老公寵愛30年!

內(nèi)娛最好命闊太: 住億萬豪宅, 一頓飯賺7000萬, 被老公寵愛30年!

趣文說娛
2026-04-15 21:42:55
2026年修電腦還用微PE?我試了USBOS V3.0,第二天就把舊U盤扔了

2026年修電腦還用微PE?我試了USBOS V3.0,第二天就把舊U盤扔了

小柱解說游戲
2026-04-15 00:05:50
《明朝那些事兒》濃縮成30句精華,狠狠提升你的格局

《明朝那些事兒》濃縮成30句精華,狠狠提升你的格局

尚曦讀史
2026-04-13 09:00:12
57歲許戈輝:美女主持變粗腿大媽,結(jié)婚21年感情穩(wěn)定,難再回?zé)赡?>
    </a>
        <h3>
      <a href=白面書誏
2026-04-15 17:27:54
灰熊提前一小時(shí)通知莫蘭特離隊(duì):一場精心設(shè)計(jì)的羞辱

灰熊提前一小時(shí)通知莫蘭特離隊(duì):一場精心設(shè)計(jì)的羞辱

體壇觀察猿
2026-04-16 08:11:22
59歲王志文已準(zhǔn)備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

59歲王志文已準(zhǔn)備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

翰飛觀事
2026-04-13 22:14:07
以色列何去何從,歷史驚人的相似,猶太人在打中國的主意

以色列何去何從,歷史驚人的相似,猶太人在打中國的主意

東風(fēng)寄的千愁
2026-04-16 05:51:58
歐冠出局!皇馬2大巨星現(xiàn)場吵架 熊皇反擊貝林:你給我閉嘴

歐冠出局!皇馬2大巨星現(xiàn)場吵架 熊皇反擊貝林:你給我閉嘴

葉青足球世界
2026-04-16 08:19:08
北京首鋼VS山東男籃!李楠復(fù)出首秀,許利民拒絕輸球,央視直播

北京首鋼VS山東男籃!李楠復(fù)出首秀,許利民拒絕輸球,央視直播

體壇瞎白話
2026-04-16 08:36:11
廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點(diǎn)才收工,發(fā)文吐槽:這個(gè)雞你們是非吃不可嗎

廣東“莫氏雞煲大公主”爆火前后反差大,晚上干到凌晨2點(diǎn)才收工,發(fā)文吐槽:這個(gè)雞你們是非吃不可嗎

大象新聞
2026-04-15 12:57:04
發(fā)明NBA附加賽的人,真是個(gè)天才!

發(fā)明NBA附加賽的人,真是個(gè)天才!

湖報(bào)體育
2026-04-16 19:32:36
39歲前國腳現(xiàn)狀:定居美國踢野球,早已財(cái)富自由,有2個(gè)可愛女兒

39歲前國腳現(xiàn)狀:定居美國踢野球,早已財(cái)富自由,有2個(gè)可愛女兒

攬星河的筆記
2026-04-14 15:18:30
2013年,王石和前妻同框,參加岳父王寧告別儀式,一張罕見的留影

2013年,王石和前妻同框,參加岳父王寧告別儀式,一張罕見的留影

阿廢冷眼觀察所
2026-04-15 13:20:06
信仰不是法外之地,全國開始雷霆出擊整頓寺廟

信仰不是法外之地,全國開始雷霆出擊整頓寺廟

卷史
2026-04-16 08:06:56
省委、市委決定:金寧任廣德市委書記

省委、市委決定:金寧任廣德市委書記

上觀新聞
2026-04-16 13:34:03
71歲沈富麟現(xiàn)狀:退休不到1年,體型暴瘦,從上海到江蘇桃李滿園

71歲沈富麟現(xiàn)狀:退休不到1年,體型暴瘦,從上海到江蘇桃李滿園

白面書誏
2026-04-16 14:50:20
笑不活了!面館過度爆火,文章竟親自下廚,現(xiàn)場齊喊“少帥”調(diào)侃

笑不活了!面館過度爆火,文章竟親自下廚,現(xiàn)場齊喊“少帥”調(diào)侃

冷紫葉
2026-04-16 14:25:50
2026-04-16 20:31:00
北茗的AI茶館 incentive-icons
北茗的AI茶館
探討AI領(lǐng)域內(nèi)容,展望人機(jī)共生的美好未來!
68文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

家居
藝術(shù)
親子
健康
軍事航空

家居要聞

智能舒適 簡約風(fēng)尚

藝術(shù)要聞

張大千『 花菓薈萃冊(cè)』

親子要聞

彩泥長頭發(fā)糖果食玩

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號(hào)

無障礙瀏覽 進(jìn)入關(guān)懷版