agentic-coding
70 篇文章
Lightning Talk:叫 Claude 幫你蓋一個 Ralph Loop
3 分鐘 lightning talk 投影片。AI 什麼都讀過,但有些概念它還不知道——你知道、它不知道,這就是你的槓桿。
Claude Code 的 5 個反面教材 — AI 時代的 Bad Design Patterns
Claude Code 原始碼洩漏,社群盯著 KAIROS 和 model codenames 看。但裡面還有另一面:5 個讓 $2.5B ARR 產品顯得很尷尬的設計決策。這些不是 Anthropic 獨有的問題——它們是 AI 生成 code 的系統性陷阱,你的 codebase 裡很可能也有。
我們怎麼讓 336 篇 AI 文章從「能看」變成「想分享」
gu-log 有 336 篇 AI 翻譯的文章。我們以為品質「還行」——直到用 multi-agent 系統認真評分後,發現 74% 需要改寫。這是我們怎麼設計評分系統、怎麼 overnight 跑完全站改寫、以及學到了什麼的故事。
寫了 11 章才敢回答的問題:到底什麼是 Agentic Engineering?
Simon Willison 的 Agentic Engineering Patterns 指南加到第 12 章了,但這章排在系列最前面——他終於正式回答「什麼是 Agentic Engineering」。答案意外地簡潔:讓會跑 code 的 agent 幫你開發軟體。但真正有趣的是他花了 11 章實戰經驗後才敢下這個定義。
AI 寫的 Code 品質變差?那是你的選擇,不是 AI 的錯
Simon Willison 的 Agentic Engineering Patterns 第三章:AI 應該幫我們產出更好的 code,不是更差的。技術債的成本被 coding agent 壓到趨近零,你再也沒有藉口不 refactor。加上 agent 能平行跑 prototype,選架構不再是賭博。
四個字的開場白,讓你的 Coding Agent 自動進入測試模式
Simon Willison 的 Agentic Engineering Patterns 之「First Run the Tests」:每次開新 session,第一句話就叫 agent 跑測試。四個字,三層效果——agent 會知道怎麼跑 test、知道 codebase 多大、而且自動進入「我要維護測試」的心態。
Simon Willison 的 Agentic Engineering 爐邊對談:測試免費了、程式品質是你的選擇
Simon Willison 在 Pragmatic Summit 分享了他的 agentic engineering 實戰方法:五個 token 啟動 TDD、Showboat 做手動驗證、用六個框架反推出標準再實作、以及 code quality 是一個有意識的選擇。
AI 生了一千行,然後你就 merge 了?Simon Willison 點名 Agentic 開發最常見的爛習慣
Simon Willison 在他的 Agentic Engineering Patterns 指南裡新增了「Anti-Patterns」章節,第一條就是:不要把 AI 生的、你自己根本沒看過的 code 丟給同事 review。你省了時間,但你的 reviewer 付出了代價——而他們大可以自己叫 AI 生。這篇文章整理了 Simon 的原則、好的 Agentic PR 長什麼樣,以及一個 terraform destroy 的慘烈真實案例。
從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini
OpenClaw 的 ACP(Agent Client Protocol)讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent,還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。(2026-03-09 更新:Telegram topic binding、persistent bindings、ACP Provenance 等新功能)
從「寫 Code 助手」到「自動駕駛的程式碼庫」:Cursor Automations 如何改變團隊工作流
Cursor 推出 always-on background agents (Automations),不再只是幫助工程師寫程式碼,而是自動修 CI、自動審核 PR、執行安全審查並建立團隊記憶。這標誌著從 Coding Assistant 向 Self-Driving Codebase 的 Paradigm Shift。
叫 AI 自己按按看:Simon Willison 的 Agentic Manual Testing,填補自動化測試抓不到的盲區
Simon Willison 提出 Agentic Manual Testing 概念:讓 AI agent 像人類一樣手動操作程式碼和 UI,抓出自動化測試遺漏的 bug。搭配 Playwright、Rodney、Showboat 等工具,把「測試通過但其實壞了」的窘境變成歷史。
世界級 Agentic Engineer 的真相 — 少裝一點,反而飛更快
這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。
Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究
Karpathy 花了一個週末,用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊,讓它們在 GPU 上跑 nanochat 實驗。結論:Agents 執行力一流,但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯
AI 生的 Code 看不懂?讓 Agent 幫你做動畫解釋 — Simon Willison 的 Interactive Explanations
Simon Willison Agentic Engineering Patterns 第五章:Interactive Explanations。核心主張:與其硬啃 AI 生成的 code,不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。
claude -p 完全攻略:把 Claude CLI 變成你的 Agentic App 後端
Anthropic 砍了第三方 OAuth token,只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p(print mode)的所有用法:5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming,到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。
Claude 原生律師事務所:一個律師如何用 AI 幹掉百人大所
一個只有兩人的精品律師事務所,靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究,全部用 Claude Skills 編碼十年執業經驗。這篇不是理論,是每天在用的 workflow — 而且結論是:通用 AI 打爆所有法律垂直 AI 產品。
Cursor CEO 說出口了:軟體開發第三紀元來臨 — Tab 時代結束、Agent 時代也快了,接下來是「工廠模式」
Cursor CEO Michael Truell 用三組數據宣告軟體開發的第三紀元:Agent 用量一年暴增 15 倍、Tab:Agent 使用者比翻轉為 1:2、Cursor 內部 35% 的 PR 來自雲端 AI Agent 自主完成。開發者的角色正在從「寫 code」變成「設計工廠」(╯°□°)╯
你會的東西都是武器 — Simon Willison 的「囤積式開發」哲學
Simon Willison Agentic Engineering Patterns 第四章:Hoard Things You Know How to Do。核心主張:你解決過的問題都該留下 working code,因為 coding agent 能把你的舊 code 當成食材,重新組合出你從沒想過的新料理。
一個工程師 + AI,一週重建 Next.js——然後 tldraw 嚇到把測試搬進私有 repo
Cloudflare 工程師 Steve Faulkner 用 Claude AI 花一週、$1,100 token 費用,從零重建了 Next.js 的 94% API,產出的 vinext 比 Next.js 快 4.4 倍、bundle 小 57%。關鍵武器?Next.js 公開的測試套件。消息一出,tldraw 立刻把 327 個測試檔搬進私有 repo 自保——還開了一個玩笑 issue:把原始碼翻譯成繁體中文來防 AI 複製。當你的 test suite 變成敵人的 spec,Open Source 的遊戲規則就徹底變了。
Programming 變得面目全非:Karpathy 說 2025 年 12 月是分水嶺
Karpathy 說 coding agents 在 2025 年 12 月突然 work 了——不是漸進式進步,是斷裂式轉變。他花 30 分鐘用一句英文建好 DGX Spark 視訊分析 dashboard,三個月前那是整個週末的工作量。Programming 正在變得面目全非:你不再打字寫 code,你在用英文指揮 AI agents。最高 leverage = agentic engineering。