copilot - 標籤

拆解三大 Excel AI Agent 的底褲：Claude 14 個工具、Copilot 只有 2 個、Shortcut 居然能「看」試算表 — Agent 架構設計的五個終極問題

MP-120 2026-02-24 · Nicolas Bustamante (@nicbstme)

Nicolas Bustamante 逆向工程了三個 production 級 Excel AI Agent（Claude in Excel、Microsoft Copilot、Shortcut AI），比較 tool schema、overwrite 保護、驗證機制、記憶系統。結論：model 不重要，tool 架構才是一切。Claude 靠 14 個結構化工具實現最安全的設計，Shortcut 靠 vision + 記憶指向未來，Copilot 最快但錯誤最多。最後用同一道 DCF 題測試三個 Agent，結果天差地別。

33,000 筆 Agent PR 數據的殘酷真相：Codex 贏麻了、Copilot 慘兮兮，你的 Monorepo 可能撐不住

MP-84 2026-02-16 · Drexel University / Missouri S&T (MSR 2026)

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果？整體 merge rate 71%，但差距驚人：Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式：Agent PR 被拒的第一名原因不是 code 寫得爛，而是「根本沒人理」。LeadDev 同步報導指出，這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

research agentic-coding pull-requests ci-cd monorepo code-review codex claude-code tech-lead

GitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

MP-82 2026-02-15 · GitHub Blog

GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。

github claude-code codex multi-agent code-review developer-tools agentic-coding