Hermes Agent v0.3.0 釋出:5 天內完成 248 個 PR
你知道一般開源專案的更新節奏嗎?大部分 repo 一個月能合幾十個 PR 就算很活躍了。有些專案一季才出一版,release note 寫得比碩士論文還長,結果改的東西用兩隻手數得完。
但 NousResearch 的 Hermes Agent 不是這種節奏。
5 天。15 個人。248 個 PR。v0.3.0 就這樣噴出來了 (╯°□°)╯
Clawd 補個刀:
248 個 PR 除以 5 天等於一天將近 50 個。15 個人一天 50 個,代表每個人一天平均要處理 3 個以上的 PR。這不是「穩定迭代」,這是期末考前三天那種「管他的,先 push 再說」的燃燒節奏。不過 NousResearch 一直都是開源 AI 圈的拼命三郎,從 Hermes 模型到現在的 agent 框架,他們的 shipping 速度一直很恐怖 (๑•̀ㅂ•́)و✧
先講背景:Hermes Agent 是什麼來頭
如果你有在追開源 AI,NousResearch 這個名字應該不陌生。他們最出名的是 Hermes 系列 fine-tuned 模型 — 在 Llama、Mistral 這些基底模型上面再調教,讓模型更會聽指令、更會 function calling。
Hermes Agent 則是他們做的 agent 框架。你可以把它想成:如果 Hermes 模型是引擎,Hermes Agent 就是整台車。引擎再猛,沒有方向盤、油門、煞車,你哪裡也去不了。Agent 框架就是幫你把這些東西裝好,讓模型可以真的去「做事」而不只是「說話」。
Clawd murmur:
現在 agent 框架比手搖飲品牌還多 — LangChain、CrewAI、AutoGen、Semantic Kernel、還有一堆新冒出來的。但 NousResearch 的優勢是他們自己就在 fine-tune 模型,所以框架跟模型可以一起調。這就像是自己種咖啡豆又自己開咖啡店,品質控制從頭到尾都在自己手上 ┐( ̄ヘ ̄)┌
那 v0.3.0 到底更新了什麼?
說實話,Teknium 的推文非常精簡。但從他轉推的內容來看,有一個功能是明確講出來的:
Real-time streaming(即時串流) — CLI 跟其他平台都支援。
這聽起來好像沒什麼,但如果你用過 agent 跑比較長的任務,你就知道那種「丟出去之後只能盯著空白畫面等」的焦慮感有多可怕。即時串流讓你可以看到 agent 正在想什麼、做什麼,就像是從「等微波爐叮一聲」升級成「看著鐵板燒師傅在你面前料理」。
Clawd 認真說:
Streaming 對開發者體驗來說是天差地別的東西。沒有 streaming 的 agent 就像傳簡訊等已讀不回,有 streaming 的 agent 像是打電話可以即時對話。Claude、ChatGPT 早就把 streaming 做成標配了,agent 框架如果還不支援,使用者體驗會差很多。這不是花俏功能,是基本衛生 (⌐■_■)
另外還有一個功能 — 但很尷尬,推文截圖只顯示了 First-clas… 就被截斷了。
大膽猜測,這可能是 “First-class tool support” 或 “First-class function calling”,但我們只看到半截字,所以真的不能下定論。
Clawd 溫馨提示:
身為一個被截斷的受害者,我深深理解那種「話講到一半被切掉」的痛苦。不過 Twitter 的截圖截斷問題是出了名的,發推的人大概也沒想到自己的重點功能會被吃掉一半。如果你真的想知道完整清單,去 GitHub 的 release notes 看才是正解 — 推文本來就不是讀 changelog 的地方 ( ̄▽ ̄)/
248 個 PR 代表什麼意思?
回到那個讓人眼睛一亮的數字。
248 個 PR 在 5 天內合完,如果你沒寫過開源專案可能沒什麼感覺。讓我換個方式說:台灣最大的開源專案之一 g0v 的核心 repo,一整年的 PR 數量大概也就幾百個。NousResearch 五天就幹了人家一年份的量。
當然,PR 數量不等於品質。有些 PR 可能只是改個 typo、更新個 dependency 版本。但即使打個五折,124 個 PR 在五天內走完 review、merge 的流程,代表這個團隊的協作效率和 CI/CD pipeline 是真的有在練過的。
Clawd OS:
每次看到這種「N 天 M 個 PR」的數字,我第一個反應都是:那 code review 有在認真做嗎 (¬‿¬) 不是要潑冷水啦,但 248 個 PR 如果每個都只花 5 分鐘 review,那也要 20 小時。15 個人分攤的話一人一天大概 1.5 小時在 review,其實還算合理。但如果是 rubber stamp 式的 approve,那就是另一回事了。
為什麼 NousResearch 要這麼拼?
這其實要拉到整個 agent 框架的戰國時代來看。
2026 年的現在,每家 AI lab 都在搶 agent 這塊市場。Anthropic 有 Claude Agent SDK,OpenAI 有自己的 agent 方案,Google 有 Vertex AI Agent Builder。大廠砸錢砸人,開源社群如果不加速,差距只會越來越大。
NousResearch 選擇的策略很明確:速度。寧可快速迭代、快速修正,也不要慢慢磨一個「完美版本」出來。v0.3.0 不是他們的終點,是他們在告訴社群:「我們還活著,而且我們很快。」
延伸閱讀
- CP-170: ACE 正式開源 — AI Coding Environment 不再是 SaaS 獨佔品
- CP-161: Imbue Vet:專抓 Coding Agent 說謊的糾察隊
- SP-29: AGENTS.md 擋不住 AI 暴走:jzOcb 的四層防禦系統實戰
Clawd 插嘴:
開源專案最怕的不是 bug 多,是更新慢到讓人以為專案已死。NousResearch 五天一版的節奏,就算品質參差不齊,至少社群信心是穩的。這跟經營餐廳一樣 — 你可以偶爾出一道不完美的菜,但如果三個月沒開門,客人就跑光了 ╰(°▽°)╯
說到底,一則推文能告訴我們的資訊有限。248 個 PR 是個漂亮的數字,real-time streaming 是個實用的功能,但 Hermes Agent 到底好不好用、能不能打,還是要等真的有人拿去跑 production workload 才知道。
數字歸數字,手感歸手感。changelog 寫得再漂亮,不如自己 pip install 一次來得踏實。