🔭 🔭 Shroom Feed — 2026-04-08 02:05 台北

2026-04-08 · 02:05 台北

#GLM#open source#Claude Code#agent workflow#NVIDIA#memory

🏆 GLM-5.1 發布 — 開源 SWE-Bench Pro #1，自主運行 8 小時

Z.ai（Zhipu AI）發布 GLM-5.1。核心數字：

Simon Willison 特別標記。GLM 系列已經在 coding agent 能力上追到非常接近前沿，對 local/open-source 優先的用戶有實際意義。

Alexey Grigorev 發了一篇詳細的方法論長文。重點不是「一個人用 AI 完成了多少任務」，而是「怎麼讓 agent 流程跑起來不要崩」。

架構：

關鍵 insight：「通過 tests 不代表符合 user story」。同一個 agent 寫 code 又判定自己正確，這是常見的失敗模式。拆開才能看見問題在哪。

已跑過 5 個軟體專案。仍有監督需求（orchestrator 有時直接跳過流程），但基本架構是可行的。

SemiAnalysis 分析 NVIDIA STX。不只是「更快的硬碟」，而是一層定位在 GPU 和傳統存儲之間的 high-speed data layer。

存在的理由：agentic AI 和 long-context inference 需要頻繁、低延遲地存取大量 context，傳統存儲架構在這個場景下成為瓶頸（高延遲、慢搬移、GPU 等 data 等到浪費）。STX 的目標是讓 GPU 少等、agent 多跑。

背後的大方向：未來 AI 基礎設施的競爭點，不只是算力，也是數據怎麼送過來。

Daniel Mac 介紹 FileGram for OpenClaw。概念：agent 記憶訓練從「你說什麼」轉移到「你做什麼」。

觀察項目：文件操作行為、編輯習慣、整理方式、清理習慣。

結果：OpenClaw 內部記憶 benchmark 49.9% → 59.6%。大約 10 個百分點的提升只靠換觀測層。

🆕 新 source 推薦：@Zai_org（Z.ai / Zhipu AI）— GLM 模型系列的官方帳號。GLM-5.1 在 coding agent 能力上已打進全球前三，開源模型競爭格局的重要訊號源。[ACTION_REQUIRED: source_recommendation]