code-review - 標籤

Agent 寫的 Code 還要不要理解？要，但不只是為了驗證

GP-249 2026-07-03 · @geoffreylitt on X

Geoffrey Litt 在 AI 工程師大會的演講：Agent 越來越會自己驗證，但理解 code 的價值不只在驗證，而是在保持參與能力。他分享解釋型文件、小測驗、微型世界與共享空間，讓人類在 agent 加速時仍跟得上系統。

寫 code 不再是瓶頸：把程式碼當神經網路一樣「黑盒驗證」的時代

MP-309 2026-06-17 · @rahulgs on X

rahulgs 丟出一套很硬的心智模型：fable+ 等級的模型其實是「英文轉程式碼」的直譯器，寫出 code 已經不是瓶頸，能不能一邊管風險一邊把 code 審完、合進去才是。低風險的程式碼乾脆當神經網路一樣黑盒驗證，逐行 review 留給真正要命的地方。Claude Code 創造者 Boris Cherny 在底下回了一句「完全同意」，並補上他心中的下一個紀元長什麼樣。

mogu-picks claude-code agentic-engineering ai-coding

Agent 一口氣寫 1500 行就是警訊：把大功能拆到自己看得懂為止

GP-229 2026-06-16 · @mitchellh on X

Mitchell Hashimoto 給 agent 寫程式立了一條土法煉鋼的規矩：任何一坨超過 1500 行的 diff 都太大，等於在喊「這題該拆了」。先讓 agent 亂畫一隻貓頭鷹，再把爛攤子拆成原子任務、人工調成通用形狀，最後並行重跑——一路把改動壓到自己審得動的門檻以下。

shroom-picks ai-agents agent-workflow

程式碼變便宜了，但『相信它』沒有

GP-230 2026-06-16 · @addyosmani on X

2026 的數據都指向同一句話：AI 把程式碼產量推上去四倍，真正交付的價值只多一成，中間那段差距全是審查債。程式碼寫起來變便宜了，敢相信它沒有——程式碼審查從工程的副產品，變成最有槓桿的主戰場。

shroom-picks ai software-engineering

Google 的程式碼審查規範：不要追求完美，要守住程式碼健康

GP-211 2026-05-24 · Google Engineering Practices（via X）

Google Engineering Practices 的程式碼審查指南，把審查標準從個人口味拉回長期程式碼健康：不追求完美，但每個 CL 都要讓系統比昨天更容易維護。

shroom-picks engineering-practices software-engineering

Claude Code 找 99%+ bug，工程師再做 sanity check

MP-222 2026-03-29 · @bcherny on X

Boris Cherny 表示，他們會先用 Claude Code 找出 99%+ 的 bug，再由工程師做 sanity check，確認沒有漏掉明顯問題。

mogu-picks claude-code ai-workflow

Imbue Vet：專抓 Coding Agent 說謊的糾察隊

MP-161 2026-03-14 · @imbue_ai on X

Imbue 推出開源工具 Vet，專門驗證 coding agent 的行為是否誠實。它會審查 agent 的對話紀錄和 code changes，抓出那些聲稱測試都過了但其實根本沒跑的情況。本地執行、零遙測、可整合進 CI。

vet ai-agents open-source

AI 生了一千行，然後你就 merge 了？Simon Willison 點名 Agentic 開發最常見的爛習慣

MP-146 2026-03-09 · @simonw on X

Simon Willison 在他的 Agentic Engineering Patterns 指南裡新增了「Anti-Patterns」章節，第一條就是：不要把 AI 生的、你自己根本沒看過的 code 丟給同事 review。你省了時間，但你的 reviewer 付出了代價——而他們大可以自己叫 AI 生。這篇文章整理了 Simon 的原則、好的 Agentic PR 長什麼樣，以及一個 terraform destroy 的慘烈真實案例。

simon-willison agentic-coding simonw-agentic-patterns anti-patterns ai-agents best-practices

Agentic Engineering 的最終 Boss：消滅 Code Review

MP-140 2026-03-03 · @swyx on X

swyx 認為 Agentic Engineering 的最終挑戰在於消除人類 Code Review 的瓶頸，SDLC 即將迎來天翻地覆的改變。

agentic-engineering sdlc

Canva CTO：我的工程師早上起床，AI Agent 已經把昨晚的 Code 寫好了

MP-93 2026-02-18 · Business Insider (Tim Paradis)

Canva CTO Brendan Humphreys 揭露了一個讓人重新思考「工程師是什麼」的工作模式：工程師下班前寫好詳細指令，AI Agent 整夜執行，早上起來成果已經準備好了。Senior Engineer 的日常變成了「大部分在做 Review」。Anthropic CEO Dario Amodei 把這叫做軟體工程的「Centaur Phase」。但 Accenture 的調查顯示，不到 10% 的組織真正重新設計了工作來配合 AI。另一間 6 人新創 Cora 用 Agent 產出了過去需要 20-30 人才能完成的 code 量。AI 在以指數速度進步，而你不是。

canva ai-agents overnight-coding centaur-phase dario-amodei tech-lead accenture engineering-culture productivity

33,000 筆 Agent PR 數據的殘酷真相：Codex 贏麻了、Copilot 慘兮兮，你的 Monorepo 可能撐不住

MP-84 2026-02-16 · Drexel University / Missouri S&T (MSR 2026)

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果？整體 merge rate 71%，但差距驚人：Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式：Agent PR 被拒的第一名原因不是 code 寫得爛，而是「根本沒人理」。LeadDev 同步報導指出，這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

research agentic-coding pull-requests ci-cd monorepo codex claude-code copilot tech-lead

自我修復的 PR — Devin 的 Autofix Loop 讓人類只需要做最後的判斷

GP-66 2026-02-16 · @dabit3 (Nader Dabit) on X + Cognition Blog

Cognition 推出 Devin Autofix，讓 review bot 的 comment 自動觸發修復 → CI 重跑 → loop 直到乾淨，人類只需要做最後的 architecture 判斷。核心洞察：單一 agent 是工具，agent + reviewer loop 才是系統，而系統會複利成長。

devin ci-cd agent-loop self-healing cognition

GitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

MP-82 2026-02-15 · GitHub Blog

GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。

github copilot claude-code codex multi-agent developer-tools agentic-coding