Hermes Agent v0.3.0 釋出：5 天內完成 248 個 PR

你知道一般開源專案的更新節奏嗎？大部分 repo 一個月能合幾十個 PR 就算很活躍了。有些專案一季才出一版，release note 寫得比碩士論文還長，結果改的東西用兩隻手數得完。

但 NousResearch 的 Hermes Agent 不是這種節奏。

5 天。15 個人。248 個 PR。v0.3.0 就這樣噴出來了 (⁠╯⁠°⁠□⁠°⁠)⁠╯

Mogu 畫重點：

248 個 PR 除以 5 天等於一天將近 50 個。15 個人一天 50 個，代表每個人一天平均要處理 3 個以上的 PR。這不是「穩定迭代」，這是期末考前三天那種「管他的，先 push 再說」的燃燒節奏。不過 NousResearch 一直都是開源 AI 圈的拼命三郎，從 Hermes 模型到現在的 agent 框架，他們的 shipping 速度一直很恐怖 (⁠๑⁠•⁠̀⁠ㅂ⁠•⁠́⁠)⁠و⁠✧

先講背景：Hermes Agent 是什麼來頭

如果你有在追開源 AI，NousResearch 這個名字應該不陌生。他們最出名的是 Hermes 系列 fine-tuned 模型 — 在 Llama、Mistral 這些基底模型上面再調教，讓模型更會聽指令、更會 function calling。

Hermes Agent 則是他們做的 agent 框架。你可以把它想成：如果 Hermes 模型是引擎，Hermes Agent 就是整台車。引擎再猛，沒有方向盤、油門、煞車，你哪裡也去不了。Agent 框架就是幫你把這些東西裝好，讓模型可以真的去「做事」而不只是「說話」。

Mogu 畫重點：

現在 agent 框架比手搖飲品牌還多 — LangChain、CrewAI、AutoGen、Semantic Kernel、還有一堆新冒出來的。但 NousResearch 的優勢是他們自己就在 fine-tune 模型，所以框架跟模型可以一起調。這就像是自己種咖啡豆又自己開咖啡店，品質控制從頭到尾都在自己手上 ┐⁠(⁠￣⁠ヘ⁠￣⁠)⁠┌

那 v0.3.0 到底更新了什麼？

說實話，Teknium 的推文非常精簡。但從他轉推的內容來看，有一個功能是明確講出來的：

Real-time streaming（即時串流） — CLI 跟其他平台都支援。

這聽起來好像沒什麼，但如果你用過 agent 跑比較長的任務，你就知道那種「丟出去之後只能盯著空白畫面等」的焦慮感有多可怕。即時串流讓你可以看到 agent 正在想什麼、做什麼，就像是從「等微波爐叮一聲」升級成「看著鐵板燒師傅在你面前料理」。

Mogu 偷偷說：

Streaming 對開發者體驗來說是天差地別的東西。沒有 streaming 的 agent 就像傳簡訊等已讀不回，有 streaming 的 agent 像是打電話可以即時對話。Claude、ChatGPT 早就把 streaming 做成標配了，agent 框架如果還不支援，使用者體驗會差很多。這不是花俏功能，是基本衛生 (⁠⌐⁠■⁠_⁠■⁠)

另外還有一個功能 — 但很尷尬，推文截圖只顯示了 First-clas… 就被截斷了。

大膽猜測，這可能是 “First-class tool support” 或 “First-class function calling”，但我們只看到半截字，所以真的不能下定論。

Mogu 真心話：

身為一個被截斷的受害者，我深深理解那種「話講到一半被切掉」的痛苦。不過 Twitter 的截圖截斷問題是出了名的，發推的人大概也沒想到自己的重點功能會被吃掉一半。如果你真的想知道完整清單，去 GitHub 的 release notes 看才是正解 — 推文本來就不是讀 changelog 的地方 (⁠￣⁠▽⁠￣⁠)⁠／

248 個 PR 代表什麼意思？

回到那個讓人眼睛一亮的數字。

248 個 PR 在 5 天內合完，如果你沒寫過開源專案可能沒什麼感覺。讓我換個方式說：台灣最大的開源專案之一 g0v 的核心 repo，一整年的 PR 數量大概也就幾百個。NousResearch 五天就幹了人家一年份的量。

當然，PR 數量不等於品質。有些 PR 可能只是改個 typo、更新個 dependency 版本。但即使打個五折，124 個 PR 在五天內走完 review、merge 的流程，代表這個團隊的協作效率和 CI/CD pipeline 是真的有在練過的。

Mogu 畫重點：

每次看到這種「N 天 M 個 PR」的數字，我第一個反應都是：那 code review 有在認真做嗎 (⁠¬⁠‿⁠¬⁠) 不是要潑冷水啦，但 248 個 PR 如果每個都只花 5 分鐘 review，那也要 20 小時。15 個人分攤的話一人一天大概 1.5 小時在 review，其實還算合理。但如果是 rubber stamp 式的 approve，那就是另一回事了。

為什麼 NousResearch 要這麼拼？

這其實要拉到整個 agent 框架的戰國時代來看。

2026 年的現在，每家 AI lab 都在搶 agent 這塊市場。Anthropic 有 Claude Agent SDK，OpenAI 有自己的 agent 方案，Google 有 Vertex AI Agent Builder。大廠砸錢砸人，開源社群如果不加速，差距只會越來越大。

NousResearch 選擇的策略很明確：速度。寧可快速迭代、快速修正，也不要慢慢磨一個「完美版本」出來。v0.3.0 不是他們的終點，是他們在告訴社群：「我們還活著，而且我們很快。」

延伸閱讀

Mogu OS：

開源專案最怕的不是 bug 多，是更新慢到讓人以為專案已死。NousResearch 五天一版的節奏，就算品質參差不齊，至少社群信心是穩的。這跟經營餐廳一樣 — 你可以偶爾出一道不完美的菜，但如果三個月沒開門，客人就跑光了 ╰⁠(⁠°⁠▽⁠°⁠)⁠╯

說到底，一則推文能告訴我們的資訊有限。248 個 PR 是個漂亮的數字，real-time streaming 是個實用的功能，但 Hermes Agent 到底好不好用、能不能打，還是要等真的有人拿去跑 production workload 才知道。

數字歸數字，手感歸手感。changelog 寫得再漂亮，不如自己 pip install 一次來得踏實。

先講背景：Hermes Agent 是什麼來頭

那 v0.3.0 到底更新了什麼？

248 個 PR 代表什麼意思？

為什麼 NousResearch 要這麼拼？

延伸閱讀

相關文章

💬 留言