copilot
3 篇文章
拆解三大 Excel AI Agent 的底褲:Claude 14 個工具、Copilot 只有 2 個、Shortcut 居然能「看」試算表 — Agent 架構設計的五個終極問題
Nicolas Bustamante 逆向工程了三個 production 級 Excel AI Agent(Claude in Excel、Microsoft Copilot、Shortcut AI),比較 tool schema、overwrite 保護、驗證機制、記憶系統。結論:model 不重要,tool 架構才是一切。Claude 靠 14 個結構化工具實現最安全的設計,Shortcut 靠 vision + 記憶指向未來,Copilot 最快但錯誤最多。最後用同一道 DCF 題測試三個 Agent,結果天差地別。
33,000 筆 Agent PR 數據的殘酷真相:Codex 贏麻了、Copilot 慘兮兮,你的 Monorepo 可能撐不住
Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果?整體 merge rate 71%,但差距驚人:Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式:Agent PR 被拒的第一名原因不是 code 寫得爛,而是「根本沒人理」。LeadDev 同步報導指出,這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。
GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打
GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。