无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

ollama v0.23.2 更新:/api/show 緩存提升 6.7 倍,Claude Desktop 集成調整

0
分享至




一、版本概覽:聚焦性能與體驗

Ollama 在 2026 年 5 月 8 日正式發布了 v0.23.2 版本。本次更新雖然沒有引入全新的模型架構或大規模功能擴展,但在核心性能優化、用戶體驗細節以及集成生態的管理上進行了重要的迭代。從更新日志來看,本次發布的重點在于提升 API 響應速度、優化備份機制、調整第三方集成策略,并對 MLX 運行時的圖像生成界面進行了清理。

這是一個典型的維護性發布,包含了 5 次代碼提交,涉及 50 個文件的變更,有 3 位貢獻者參與了此次開發。對于依賴 Ollama 進行開發或部署 AI 應用的工程師而言,此次更新帶來的延遲降低和集成流程的改進將直接提升日常使用效率。

二、核心性能優化:/api/show 響應緩存

在本版本中,最引人注目的技術改進無疑是對/api/show端點響應實施了緩存機制。根據官方公告,這一變化使得中位數延遲提升了約 6.7 倍

在之前的版本中,每次對/api/show的調用(通常用于獲取模型詳細信息,如參數、模板、系統提示等)都可能觸發實時的磁盤 I/O 和配置解析。對于像 VS Code 擴展這樣需要頻繁查詢模型信息的集成環境,反復的開銷會積累成明顯的延遲。

技術實現分析
通過分析代碼變更,我們看到server/model_show_cache.go文件被新增(包含 705 行代碼)。這表明團隊實現了一個專門的modelShowCache結構。該緩存不僅針對本地模型,還對云端模型(modelSourceCloud)的請求進行了攔截。

核心邏輯體現在server/routes.goShowHandler中:

  • ? 當請求的模型來源為云端時,如果緩存可用且未過期,則直接返回緩存的內容,避免了代理請求到云端 API 的延遲。

  • ? 對于本地模型,同樣會先查詢緩存,若未命中則調用原有的GetModelInfo函數。

這一改進對于集成開發環境(IDE)插件頻繁調用模型元數據的應用具有重要意義。例如,VS Code 中的 Continue 擴展或 Cline 插件,它們在提供補全建議前往往需要校驗模型能力。緩存生效后,插件啟動和切換模型時的“卡頓感”將顯著減少。

三、集成管理變更:Claude Desktop 調整

此次更新中,ollama launch命令的行為發生了重要變化:默認啟動不再包含 Claude Desktop 集成。官方解釋原因為第三方集成限制于 Anthropic 模型。

3.1 變更詳情

  • ?舊行為:執行ollama launchollama launch claude-desktop可以直接將 Ollama 設置為 Claude Desktop 的推理網關。

  • ?新行為:直接運行ollama launch claude-desktop會返回錯誤提示:Claude Desktop is no longer supported

  • ?恢復命令:用戶可以使用ollama launch claude-desktop --restore將 Claude Desktop 恢復到正常狀態(即移除 Ollama 的配置修改)。

3.2 代碼層面的調整

代碼變更揭示了這一功能被隱藏的具體實現:

  • ? 在cmd/launch/launch.go中,Claude Desktop 相關的啟動邏輯被移出。

  • ? 在cmd/launch/registry.go中,Claude Desktop 的IntegrationSpec被標記為Hidden: true,這意味著它在交互式 TUI 菜單中將不再顯示。

  • ?docs/integrations/claude-desktop.mdx文檔被大幅簡化,標題下方直接注明“Claude Desktop is no longer supported byollama launch”,并建議用戶轉而使用 Claude Code 集成。

對于仍在使用此集成的用戶,建議備份現有配置后執行恢復操作,以避免未來 Ollama 版本升級帶來的潛在兼容性問題。

四、啟動器(Launcher)體驗增強

v0.23.2 對ollama launch交互界面進行了深度優化,特別是備份工作流和模型選擇器。

4.1 改進的備份工作流

在管理集成(如 OpenClaw、Hermes、VSCode 等)時,Ollama 需要修改這些工具的配置文件。為了安全起見,新版本加強了備份機制:

  • ?備份位置變更:備份目錄從臨時的os.TempDir()/ollama-backups遷移到了用戶目錄下的~/.ollama/backup。這避免了系統清理臨時文件時誤刪重要備份。

  • ?按集成分類存儲:備份文件現在會按照集成名稱(如openclawvscodehermes)存儲在子目錄中,便于管理和恢復。

  • ?自動清理策略cmd/internal/fileutil/files.go中引入了pruneOldBackups函數,確保每個配置文件的備份數量不超過 5 個(maxBackupsPerFile)。這防止了長期使用中備份文件無限的膨脹。

4.2 更清晰的 MLX 圖像生成布局

對于 macOS 用戶(使用 MLX 后端),圖像生成的界面布局得到了清理。雖然更新日志未詳述具體布局變化,但從x/imagegen/transfer/目錄被重命名為x/transfer/來看,本次對圖像生成相關的代碼結構進行了重構,移除了冗余的imagegen層級,使模塊職責更加清晰。這有助于未來在該領域的擴展和維護。

4.3 選擇器(Selector)UI 的進化

TUI(文本用戶界面)的選擇器組件獲得了動態更新能力。

  • ? 引入了SelectionItem結構,替代舊的ModelItem,增加了AvailabilityBadge(可用性角標)字段。

  • ? 支持了WithUpdates系列函數(如DefaultSingleSelectorWithUpdates),允許選擇器在打開狀態下接收外部的狀態更新(例如賬戶狀態變更、模型推薦列表刷新)。cmd/tui/selector.go中新增了selectorItemsUpdatedMsgwaitForSelectorItems來處理這些動態刷新。

  • ? 賬戶狀態(登錄/登出/套餐計劃)現在會影響模型列表的展示。例如,未登錄用戶在使用需要付費計劃的模型時,列表中會顯示“Sign in required”或“Upgrade required”的角標。

五、賬戶與套餐計劃感知

本次更新引入了一個重要的基礎設施功能:模型推薦與用戶套餐計劃的聯動

5.1 RequiredPlan 字段

api/types.go中的ModelRecommendation結構體新增了RequiredPlan字段(字符串類型)。這允許云端模型推薦數據攜帶所需的訂閱計劃信息(如 "free", "pro", "max" 等)。

5.2 賬戶狀態預取與校驗

cmd/launch/account.go文件(新增 371 行代碼)實現了賬戶狀態的預取邏輯:

  • ?StartAccountStatePrefetch:在啟動器啟動時立即在后臺嘗試獲取用戶信息,不阻塞主 UI。

  • ?ensureCloudModelAccess:在用戶嘗試運行需要特定計劃的云端模型時,會檢查當前賬戶的計劃是否滿足要求。如果不滿足,會觸發升級流程(調用DefaultUpgrade回調)。

  • ?PlanSatisfies函數:用于比較當前計劃是否滿足模型所需的計劃(例如 "pro" 可以滿足 "pro",但不能滿足未定義的更高計劃)。

5.3 升級流程改進

cmd/tui/signin.go中,新增了RunUpgrade函數和對應的 TUI 界面。當用戶缺少所需計劃時:

  • ? 界面會明確提示“Upgrade required”。

  • ? 提供升級鏈接(默認為https://ollama.com/upgrade)。

  • ? 用戶確認后,程序會打開瀏覽器并開始輪詢賬戶狀態,直到檢測到計劃已升級或用戶取消。

這對于 Ollama 商業化(提供高級云端模型)奠定了用戶體驗基礎,確保免費用戶和付費用戶都能通過清晰的界面獲得合適的模型訪問權限。

六、其他集成細節調整

除了 Claude Desktop,本次更新對其他集成也進行了一些微調:

  • ?VSCode:在編輯配置時,會區分chatLanguageModels.jsonsettings.json,并在~/.ollama/backup/vscode/下為每個文件創建獨立的備份。這解決了之前兩個文件可能共享備份計數和位置的問題。

  • ?Pi、OpenClaw、Droid、OpenCode、Hermes:這些集成的配置寫入函數都統一增加了fileutil.WriteWithBackup的調用,并傳入了對應的集成名稱作為子目錄參數,實現了備份的分類存儲。

  • ?集成列表順序launcherIntegrationOrder變量更新,移除了claude-desktop,現在順序為["claude", "openclaw", "hermes", "opencode", "codex", "copilot", "droid", "pi", "pool"]

七、升級建議與注意事項 7.1 如何升級
  • ?macOS/Linux:重新運行官方安裝腳本curl -fsSL https://ollama.com/install.sh | sh或使用包管理器(如 Homebrew:brew upgrade ollama)。

  • ?Windows:重新運行安裝程序或使用irm https://ollama.com/install.ps1 | iex

7.2 重要注意事項
  1. 1.Claude Desktop 用戶:如果你之前通過ollama launch claude-desktop配置過 Claude Desktop,請盡快運行ollama launch claude-desktop --restore恢復原始配置。未來 Ollama 更新可能會徹底移除相關代碼。

  2. 2.備份目錄:舊版本創建的備份位于系統臨時目錄(如/tmp/ollama-backups),新版本的備份位于~/.ollama/backup。建議遷移或清理舊的備份文件以節省空間,但新版本不會自動刪除舊備份。

  3. 3.VS Code 擴展用戶:升級后,你可能會感覺到擴展內部切換模型或獲取模型信息時的響應速度有顯著提升,這是/api/show緩存帶來的直接收益。

  4. 4.API 使用者:如果你有腳本或應用頻繁調用/api/show接口,建議升級到 v0.23.2 以減輕服務端壓力并降低自身應用的延遲。緩存行為是默認開啟且對客戶端透明的。

八、總結

代碼地址:github.com/ollama/ollama

Ollama v0.23.2 是一個聚焦于“幕后質量”的版本。它通過緩存機制解決了性能痛點,通過精細化的備份和賬戶管理提升了集成生態的健壯性,并果斷調整了與第三方(Claude Desktop)集成的策略。

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
3個細節對比,劉濤這次真的有點難受,小媽祖直接被跪拜

3個細節對比,劉濤這次真的有點難受,小媽祖直接被跪拜

手工制作阿殲
2026-05-12 19:19:53
硬氣!中方徹底松手,拒接8500億美債!救美就是救中方的時代結束

硬氣!中方徹底松手,拒接8500億美債!救美就是救中方的時代結束

云舟史策
2026-05-12 07:14:59
用血淚教訓告訴大家:鄰里關系再好,有些“善良”也不能給得太多

用血淚教訓告訴大家:鄰里關系再好,有些“善良”也不能給得太多

小馬達情感故事
2026-05-11 18:40:04
安徽一副縣長,主動投案!另有多人被通報

安徽一副縣長,主動投案!另有多人被通報

鳳凰網安徽
2026-05-12 17:17:35
水在4℃時密度最大?這個反常識物理Bug,差點決定地球生命的命運

水在4℃時密度最大?這個反常識物理Bug,差點決定地球生命的命運

半解智士
2026-05-05 12:56:18
拔蘿卜帶泥!逃往美國的恒大“二把手”,鄰居卻是另一名潛逃富豪

拔蘿卜帶泥!逃往美國的恒大“二把手”,鄰居卻是另一名潛逃富豪

二大爺觀世界
2026-03-14 18:43:53
果然低估印度!川普訪華前夕,印度突然放雜音,妄圖拿捏中國命脈

果然低估印度!川普訪華前夕,印度突然放雜音,妄圖拿捏中國命脈

蘭妮搞笑分享
2026-05-12 18:33:35
體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

觀察鑒娛
2026-05-10 10:38:12
特斯拉:再次突破

特斯拉:再次突破

新浪財經
2026-05-11 10:29:59
變天了!特朗普登上專機前,鄭麗文劃下紅線:不許支持“臺獨”

變天了!特朗普登上專機前,鄭麗文劃下紅線:不許支持“臺獨”

線裝史冊
2026-05-12 18:31:31
48歲歐陽夏丹現狀:離開央視,被教授邀請現身挪威,至今未婚未育

48歲歐陽夏丹現狀:離開央視,被教授邀請現身挪威,至今未婚未育

白面書誏
2026-05-07 17:50:08
1650年,39歲多爾袞突然墜馬身亡,彌留時急召哥哥,順治:太遲了

1650年,39歲多爾袞突然墜馬身亡,彌留時急召哥哥,順治:太遲了

掠影后有感
2026-05-12 10:30:55
阿扎爾:巴薩配得上加冕西甲冠軍,我希望穆帥回到皇馬

阿扎爾:巴薩配得上加冕西甲冠軍,我希望穆帥回到皇馬

懂球帝
2026-05-12 20:36:22
莎拉安全過關!菲律賓參議院議長突然被換,就是13號彈劾預演

莎拉安全過關!菲律賓參議院議長突然被換,就是13號彈劾預演

蘭妮搞笑分享
2026-05-12 13:42:22
發現一個殘酷現實,中印沖突正全方位升級,中國越避讓 印度越對

發現一個殘酷現實,中印沖突正全方位升級,中國越避讓 印度越對

瀲滟晴方DAY
2026-05-12 20:05:08
CBA再開重磅罰單,奇葩操作太離譜,必須嚴懲

CBA再開重磅罰單,奇葩操作太離譜,必須嚴懲

宗介說體育
2026-05-12 09:58:47
你們有后悔過前幾年大手大腳浪費掉的錢嗎?網友:現在都買不起了

你們有后悔過前幾年大手大腳浪費掉的錢嗎?網友:現在都買不起了

另子維愛讀史
2026-05-11 21:30:13
星際迷航最慘星艦:剛出廠就故障纏身

星際迷航最慘星艦:剛出廠就故障纏身

娛圈觀察員
2026-05-11 20:03:25
貔貅認主不看財富,這四個生肖千萬別碰,戴了反而會破財

貔貅認主不看財富,這四個生肖千萬別碰,戴了反而會破財

紙鳶奇譚
2026-04-13 16:06:54
張藝謀新劇《主角》爆火,張嘉益劉浩存表現平平,37歲女配卻出圈

張藝謀新劇《主角》爆火,張嘉益劉浩存表現平平,37歲女配卻出圈

冷紫葉
2026-05-11 18:12:37
2026-05-12 22:31:00
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1221文章數 67關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

體育要聞

總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

黃仁勛真是被白宮徹底封殺了

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

健康
房產
教育
時尚
軍事航空

干細胞能讓人“返老還童”嗎

房產要聞

穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

教育要聞

想進深圳體制內的中小學校?看完這3092人名單,我勸你先考研

穿極簡風的夏天,是真高級!

軍事要聞

知情人士披露:美國或考慮恢復對伊朗軍事行動

無障礙瀏覽 進入關懷版