multi-agent - 標籤

四模型聯軍：一套讓 Fable 當 Tech Lead 的 Claude Code 編制

GP-247 2026-07-02 · @diegocabezas01 on X

把 Fable 5 當指揮官、Opus 當深度思考手、Sonnet 當苦力、Codex 當平行宇宙工程師——一套在 Claude Code 裡搭起來的多模型編排架構，讓最貴的腦袋只做最關鍵的事。

Multi-Agent 十個月後的誠實報告——Cognition Walden：寫入保持單執行緒，其他 agent 只灌 intelligence

GP-181 2026-04-23 · @walden_yan on X (Walden Yan, Cognition co-founder)

Cognition 的 Walden Yan 十個月前寫過一篇 Don't Build Multi-Agents 勸大家別碰 multi-agent，這次回頭端出三個真的跑得動的 pattern——Devin Review 的 clean-context loop（平均每 PR 抓 2 個 bug、58% 是嚴重級）、跨前沿模型的 smart friend、manager Devin 的 map-reduce-and-manage。貫穿所有 pattern 的核心原則只有一條：寫入保持單執行緒，其他 agent 只灌 intelligence 不動手。

agent-engineering cognition devin context-engineering

九成的人不需要 Multi-Agent — Anthropic 教你什麼時候才該拆

GP-172 2026-04-13 · Anthropic Blog

Anthropic 官方指南拆解 multi-agent 系統的三個真正適用場景（context 污染、平行化、專業化），以及為什麼大多數情況下一個 agent 就夠了。附帶 context-centric 拆分法和 verification subagent pattern 的實戰建議。

shroom-picks anthropic ai-agents architecture best-practices

DeepSeek-R1 的腦內小劇場——單一模型自己長出多重人格辯論

MP-266 2026-04-08 · @PawelHuryn on X

DeepSeek-R1 透過純 RL 訓練，自發發展出腦內多角色辯論機制。Google 研究稱之為「思想社會」——AI 的突破不是單一天才，而是一群吵架的內在角色。這對 agent 工程意味著什麼？

mogu-picks deepseek reinforcement-learning reasoning

9 個 AI Agent 同時工作時的 Context Problem — ECC Iterative Retrieval Pattern 實戰解析

GP-153 2026-04-02 · @affaanmustafa on GitHub

今晚我們同時跑了 9 個 Claude Code agent 寫文章，撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題：多 agent 共享 context 時，怎麼不把彼此搞爆。結論：isolated state + atomic pre-allocation + sequential deploy，是唯一出路。

shroom-picks claude-code ecc distributed-systems

如果 AI 科學家也會長記性：EvoScientist 讓研究策略自己進化

GP-154 2026-04-02 · EvoScientist on arXiv

大多數 AI scientist 系統像很會做簡報的實習生：每次都很努力，但每次都忘記昨天怎麼失敗。EvoScientist 把 Researcher、Engineer、Evolution Manager 三個 agent 加上兩套 persistent memory，讓 AI 不只會做研究，還會從失敗裡長出新的研究策略。

shroom-picks ai-scientist persistent-memory scientific-discovery

我們怎麼讓 336 篇 AI 文章從「能看」變成「想分享」

SD-10 2026-03-22 · ShroomDog Lab

gu-log 有 336 篇 AI 翻譯的文章。我們以為品質「還行」——直到用 multi-agent 系統認真評分後，發現 74% 需要改寫。這是我們怎麼設計評分系統、怎麼 overnight 跑完全站改寫、以及學到了什麼的故事。

ai-quality llm-as-judge agentic-coding ralph-loop content-quality

從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini

GP-89 2026-03-09 · OpenClaw Docs

OpenClaw 的 ACP（Agent Client Protocol）讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent，還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。（2026-03-09 更新：Telegram topic binding、persistent bindings、ACP Provenance 等新功能）

openclaw acp agent-client-protocol ai-agents codex claude-code gemini agentic-coding

Claude Code Agent Teams：當 AI 自己開公司、自己上班、自己開會

GP-105 2026-03-05 · Anthropic Docs

Claude Code 推出 Agent Teams 功能：一個 lead + 多個 teammate，共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司，你只需要當股東看報表。

claude-code agent-teams

Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究

MP-135 2026-03-01 · Andrej Karpathy (@karpathy)

Karpathy 花了一個週末，用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊，讓它們在 GPU 上跑 nanochat 實驗。結論：Agents 執行力一流，但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯

karpathy ai-research agentic-coding nanochat claude-code codex

OpenClaw 騷操作：另起一隻 AI 專門修壞掉的 AI

GP-77 2026-02-22 · 凡人小北 @frxiaobei

升級 OpenClaw 經常搞掛整組 agent？這位老兄的解法是：再開一個獨立 Gateway 當「家庭醫生」，專門負責修復主 Gateway 的 agent 群。跑了好幾輪升級，穩到不行。

openclaw architecture self-healing sre

GitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

MP-82 2026-02-15 · GitHub Blog

GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。

github copilot claude-code codex code-review developer-tools agentic-coding

Kimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測：Claude 的 Agent Teams 反而更慢更貴

MP-59 2026-02-10 · SemiAnalysis (@SemiAnalysis_)

SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構：不靠 prompt 魔法，直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams，結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。

agent-swarms kimi moonshot semianalysis claude-code reinforcement-learning agentic-coding benchmark

Anthropic 2026 報告：8 大趨勢正在重新定義軟體開發（Code Writer 時代結束了）

GP-46 2026-02-10 · Anthropic

Anthropic 發布 2026 Agentic Coding Trends Report，揭示 8 大趨勢：Multi-Agent Systems 成標配（57% 組織採用）、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。

claude-code agentic-coding software-engineering ai enterprise

AI Swarms 來襲：當千萬個假帳號開始自主協作，民主制度怎麼辦？

MP-28 2026-02-04 · Science / arXiv

最新研究警告：LLM + 多智能體 = 新型態資訊戰。AI 大軍可以偽造共識、毒害訓練資料、騷擾異議者，還能 24/7 不間斷運作。

ai-safety democracy