![]()
好幾天沒更文章了,最近忙到起飛,在開發(fā)一款A(yù)I教育類應(yīng)用,調(diào)代碼調(diào)得焦頭爛額。
不做不知道,教育領(lǐng)域的一些場景落地是真挺難。比如中學(xué)數(shù)學(xué)題解析,要求推導(dǎo)嚴(yán)謹(jǐn),公式不能解析渲染錯(cuò)誤。再比如生成幾何題,不僅要保證出題正確,幾何圖形也要與題目嚴(yán)格對(duì)應(yīng)。
抓耳撓腮之際,階躍星辰邀請(qǐng)我測(cè)評(píng)新模型「Step 3.5 Flash 2603」。正好,把它應(yīng)用到幾個(gè)有難度的編程場景,看看表現(xiàn)如何。
![]()
Step 3.5 Flash 2603有以下幾個(gè)核心亮點(diǎn):
更適合高頻編程與Agent工作流:模型非常適合編程任務(wù),尤其是bug修復(fù)、patch生成、多輪代碼修改、Agent工作流內(nèi)結(jié)構(gòu)化輸出與任務(wù)執(zhí)行。
更高響應(yīng)、更低延遲:增加了Low think模式,并非降低能力,而是避免簡單任務(wù)過度思考,減少不必要的token消耗,提高高頻任務(wù)的響應(yīng)效率。
更適配Agent框架與開發(fā)工具:使用應(yīng)用到Agent工作流中,針對(duì)OpenClaw、Claude Code等主流Agent框架進(jìn)行了兼容優(yōu)化。
下面開始場景實(shí)戰(zhàn)!
場景一 | 數(shù)學(xué)公式處理
說實(shí)話,做這個(gè)產(chǎn)品,最讓我頭疼的就是數(shù)學(xué)公式解析錯(cuò)誤。像這樣:
![]()
大模型生成包含大量復(fù)雜公式的文本,要面臨 JSON+LaTeX+HTML 多重解析的考驗(yàn)。數(shù)據(jù)流轉(zhuǎn)過程中,各種轉(zhuǎn)義,反斜杠要將我淹沒了......
![]()
大家都知道,大模型的輸出本就不穩(wěn)定,要是公式中有一個(gè)細(xì)節(jié)錯(cuò)誤,甚至缺少一個(gè) “\”,那就是一串亂碼。
我用 Step 3.5 Flash替換原有模型,用來根據(jù)題目,輸出解答過程,并展示在HTML網(wǎng)頁中。下面是兩個(gè)示例:
已知橢圓E的中心為坐標(biāo)原點(diǎn),對(duì)稱軸為x軸、y軸,且過A(0,-2),B(3/2,-1)兩點(diǎn)。 (1)求E的方程; (2)設(shè)過點(diǎn)P(1,-2)的直線交E于M,N兩點(diǎn),過M且平行于x軸的直線與線段AB交于點(diǎn)T,點(diǎn)H滿足向量MT=向量TH。證明:直線HN過定點(diǎn)。
![]()
已知函數(shù)f(x)=2ln x -ax2 +1(a∈R)。 (1)討論函數(shù)f(x)的單調(diào)性; (2)若存在正數(shù)x,使f(x)≥0成立,求a的取值范圍; (3)若0
![]()
可以看到,各類數(shù)學(xué)符號(hào)、公式都沒有解析和渲染錯(cuò)誤,效果還是比較穩(wěn)定的。
場景二|幾何圖形數(shù)據(jù)
產(chǎn)品中有一個(gè)需求是,根據(jù)數(shù)學(xué)幾何題目,生成對(duì)應(yīng)的幾何圖形。
具體的實(shí)現(xiàn)方法是,把題目丟給大模型來生成繪圖數(shù)據(jù)(如下,包含了2D/3D、點(diǎn)、線、圖形、圖例等),然后據(jù)此用Python的 Matplotlib組件生成幾何圖形圖片。
{ "type": "3D", "points": {"A": [0,0,5], "B": [2,0,0], "C": [-2,0,0], "P": [0,3,0]}, "lines": [ {"nodes": ["A","B"], "style": "solid"}, {"nodes": ["B","C"], "style": "dashed"} ], "curves": [{"type": "circle", "center": [0,0], "r": 2}], "labels": {"A": "top", "B": "bottom"} }
但讓大模型理解題目,理解點(diǎn)線之間的關(guān)系,理解空間關(guān)系,并且生成結(jié)構(gòu)化幾何數(shù)據(jù),是很難的。
讓 Step 3.5 Flash試試:
在棱長為2的正方體ABCD-A?B?C?D?中,E為棱AA?的中點(diǎn),點(diǎn)F滿足A?F=λA?B?(0≤λ≤1),則(多選) A.當(dāng)λ=0時(shí),AC?⊥平面BDF B.對(duì)任意λ∈[0,1],三棱錐F-BDE的體積是定值 C.存在λ∈[0,1],使得AC與平面BDF所成的角為π/3 D.當(dāng)λ=2/3時(shí),平面BDF截該正方體的外接球所得截面的面積為56/19π
![]()
(2024全國甲理,19,12分,中)如圖,在以A,B,C,D,E,F為頂點(diǎn)的五面體中,四邊形ABCD與四邊形ADEF均為等腰梯形, EF∥AD,BC∥AD,AD=4,AB=BC=EF=2,ED=√10,FB=2√3,M為AD的中點(diǎn)。 (1)證明:BM∥平面CDE; (2)求二面角F-BM-E的正弦值。
![]()
本來沒抱太大希望,沒想到效果還真不錯(cuò)。
還有個(gè)點(diǎn),試了好幾個(gè)模型都做不好,就是被遮擋的線畫成虛線,其他模型要么畫成實(shí)線,要么干脆不連線。我用 Step 3.5 Flash測(cè)了幾道題,大多數(shù)都畫對(duì)了。
場景三|數(shù)據(jù)統(tǒng)計(jì)與可視化圖表
這里實(shí)現(xiàn)的是一個(gè)試卷解析功能,根據(jù)多張?jiān)嚲韴D片,生成對(duì)試卷的解析報(bào)告,包含試卷照片、每道題目、答案解析、知識(shí)點(diǎn),并對(duì)整體進(jìn)行統(tǒng)計(jì),生成可視化圖表。
實(shí)現(xiàn)流程是,先用其他大模型進(jìn)行圖片識(shí)別( Step 3.5 Flash目前不支持圖像識(shí)別 ),識(shí)別出試卷中的題目,然后用 Step 3.5 Flash解答題目,識(shí)別知識(shí)點(diǎn),并進(jìn)行統(tǒng)計(jì)。再根據(jù)這些數(shù)據(jù),生成HTML報(bào)告。
這個(gè)功能中,需要反復(fù)調(diào)試的點(diǎn)包括:保證每道題都解答正確,并且公式輸出正確;知識(shí)點(diǎn)識(shí)別正確;公式解析正確;可視化圖表數(shù)據(jù)準(zhǔn)確、視覺美觀、位置準(zhǔn)確。
我用 Step 3.5 Flash去生成HTML代碼,看看效果:
![]()
19道題、這么多公式,幾乎沒有出現(xiàn)渲染錯(cuò)誤,最后的環(huán)狀圖非常直觀,整體UI也是簡潔清新風(fēng)。
一個(gè)小問題是, 環(huán)狀圖中內(nèi)容太多的話,會(huì)有圖文重疊。
之前用其他模型,去解答題目,生成HTML代碼,調(diào)試了很多很多輪才能達(dá)到可用的程度。這次用 Step 3.5 Flash只調(diào)試了6輪。
還有個(gè)小技巧,在解答題目時(shí),使用 low think模式,減少用戶等待時(shí)間。在用 Step 3.5 Flash生成代碼時(shí),用high think模式,獲得更好的效果。
這次將Step 3.5 Flash 2603應(yīng)用到正在做的產(chǎn)品中,體驗(yàn)還是很不錯(cuò)的。
之前折磨我一兩天的Bug, Step 調(diào)試幾輪就能出結(jié)果。
輸出穩(wěn)定性也很高,像數(shù)學(xué)這種對(duì)精確度有極高要求的場景,或者要求輸出固定JSON格式的場景,Step表現(xiàn)都不錯(cuò)。
此外,速度是真挺快,尤其是深度思考模式。之前用的模型,雖然效果不錯(cuò),但思考時(shí)間太長。一條工作流中有幾個(gè)大模型節(jié)點(diǎn),跑一次等的花都謝了。
測(cè)評(píng)完,看了眼后臺(tái)的token消耗,沒花多少,蠻省錢的。
當(dāng)然, Step 3.5 Flash沒有神到任何編程任務(wù)都能一次跑通,但它確實(shí)會(huì)大大縮短Debug時(shí)間。
如果你是純技術(shù)小白, Step 3.5 Flash對(duì)你可能沒那么驚艷,它還不能無卡點(diǎn)生成復(fù)雜軟件 。如果你是一個(gè)開發(fā)者,真的建議把工作流中的模型,換成 Step 3.5 Flash試一試。
目前有兩種方式使用 Step 3.5 Flash 2603。
方式一:調(diào)用API
可以通過OpenAI兼容接口調(diào)用 Step 3.5 Flash 2603。Python代碼示例:
print(answer)其中,“ reasoning_effort”的值為“high”,是深度推理模式;值為“l(fā)ow”,是快速模式。
此外,由于模型可能會(huì)優(yōu)先在Step Plan上線,base url可能會(huì)變更為:
https://api.stepfun.com/step_plan/v1。
方式二:接入Coding Agent
可以在你的Agent平臺(tái),將Step添加為Custom Provider。如果你的平臺(tái)內(nèi)置了階躍星辰模型列表,例如Cherry Studio,那就可以直接添加“ step-3.5-flash-2603 ”模型。
Key需要在階躍星辰開放平臺(tái)獲取:
https://platform.stepfun.com
幾分鐘的嘗試,也許能讓整個(gè)項(xiàng)目節(jié)省大量時(shí)間,趕快去試試吧~
如果你有任何看法,歡迎在評(píng)論區(qū)一起討論
如果有一點(diǎn)收獲,可以點(diǎn)贊、轉(zhuǎn)發(fā)、推薦文章,關(guān)注「AI機(jī)器人茶館」
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.