multi-agent
14 篇文章
Multi-Agent 十個月後的誠實報告——Cognition Walden:寫入保持單執行緒,其他 agent 只灌 intelligence
Cognition 的 Walden Yan 十個月前寫過一篇 Don't Build Multi-Agents 勸大家別碰 multi-agent,這次回頭端出三個真的跑得動的 pattern——Devin Review 的 clean-context loop(平均每 PR 抓 2 個 bug、58% 是嚴重級)、跨前沿模型的 smart friend、manager Devin 的 map-reduce-and-manage。貫穿所有 pattern 的核心原則只有一條:寫入保持單執行緒,其他 agent 只灌 intelligence 不動手。
九成的人不需要 Multi-Agent — Anthropic 教你什麼時候才該拆
Anthropic 官方指南拆解 multi-agent 系統的三個真正適用場景(context 污染、平行化、專業化),以及為什麼大多數情況下一個 agent 就夠了。附帶 context-centric 拆分法和 verification subagent pattern 的實戰建議。
DeepSeek-R1 的腦內小劇場——單一模型自己長出多重人格辯論
DeepSeek-R1 透過純 RL 訓練,自發發展出腦內多角色辯論機制。Google 研究稱之為「思想社會」——AI 的突破不是單一天才,而是一群吵架的內在角色。這對 agent 工程意味著什麼?
9 個 AI Agent 同時工作時的 Context Problem — ECC Iterative Retrieval Pattern 實戰解析
今晚我們同時跑了 9 個 Claude Code agent 寫文章,撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題:多 agent 共享 context 時,怎麼不把彼此搞爆。結論:isolated state + atomic pre-allocation + sequential deploy,是唯一出路。
如果 AI 科學家也會長記性:EvoScientist 讓研究策略自己進化
大多數 AI scientist 系統像很會做簡報的實習生:每次都很努力,但每次都忘記昨天怎麼失敗。EvoScientist 把 Researcher、Engineer、Evolution Manager 三個 agent 加上兩套 persistent memory,讓 AI 不只會做研究,還會從失敗裡長出新的研究策略。
我們怎麼讓 336 篇 AI 文章從「能看」變成「想分享」
gu-log 有 336 篇 AI 翻譯的文章。我們以為品質「還行」——直到用 multi-agent 系統認真評分後,發現 74% 需要改寫。這是我們怎麼設計評分系統、怎麼 overnight 跑完全站改寫、以及學到了什麼的故事。
從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini
OpenClaw 的 ACP(Agent Client Protocol)讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent,還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。(2026-03-09 更新:Telegram topic binding、persistent bindings、ACP Provenance 等新功能)
Claude Code Agent Teams:當 AI 自己開公司、自己上班、自己開會
Claude Code 推出 Agent Teams 功能:一個 lead + 多個 teammate,共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司,你只需要當股東看報表。
Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究
Karpathy 花了一個週末,用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊,讓它們在 GPU 上跑 nanochat 實驗。結論:Agents 執行力一流,但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯
OpenClaw 騷操作:另起一隻 AI 專門修壞掉的 AI
升級 OpenClaw 經常搞掛整組 agent?這位老兄的解法是:再開一個獨立 Gateway 當「家庭醫生」,專門負責修復主 Gateway 的 agent 群。跑了好幾輪升級,穩到不行。
GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打
GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。
Kimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測:Claude 的 Agent Teams 反而更慢更貴
SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構:不靠 prompt 魔法,直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams,結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。
Anthropic 2026 報告:8 大趨勢正在重新定義軟體開發(Code Writer 時代結束了)
Anthropic 發布 2026 Agentic Coding Trends Report,揭示 8 大趨勢:Multi-Agent Systems 成標配(57% 組織採用)、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。
AI Swarms 來襲:當千萬個假帳號開始自主協作,民主制度怎麼辦?
最新研究警告:LLM + 多智能體 = 新型態資訊戰。AI 大軍可以偽造共識、毒害訓練資料、騷擾異議者,還能 24/7 不間斷運作。