agentic-coding - 標籤

Fable 實戰手冊：在動手寫程式碼之前先找出你的未知

GP-251 2026-07-04 · @trq212 on X

Anthropic 工程師 trq212 分享用 Claude Fable 5 寫程式的方法論：對他來說，agent coding 的瓶頸開始不只是模型能力，而是使用者能不能在事前、事中、事後找出自己的「未知」。文章整理多個 prompt 範例，也提到可用 HTML artifact 把盲點、原型和計畫視覺化。

Lightning Talk：叫 Claude 幫你蓋一個 Ralph Loop

SD-19 2026-04-09 · ShroomDog Lab

3 分鐘 lightning talk 投影片。AI 什麼都讀過，但有些概念它還不知道——你知道、它不知道，這就是你的槓桿。

lightning-talk ralph-loop claude-code leverage

Claude Code 的 5 個反面教材 — AI 時代的 Bad Design Patterns

SD-12 2026-04-02 · ShroomDog Lab

Claude Code 原始碼洩漏，社群盯著 KAIROS 和 model codenames 看。但裡面還有另一面：5 個讓 $2.5B ARR 產品顯得很尷尬的設計決策。這些不是 Anthropic 獨有的問題——它們是 AI 生成 code 的系統性陷阱，你的 codebase 裡很可能也有。

shroomdog-original ai-engineering code-quality claude-code design-patterns

我們怎麼讓 336 篇 AI 文章從「能看」變成「想分享」

SD-10 2026-03-22 · ShroomDog Lab

gu-log 有 336 篇 AI 翻譯的文章。我們以為品質「還行」——直到用 multi-agent 系統認真評分後，發現 74% 需要改寫。這是我們怎麼設計評分系統、怎麼 overnight 跑完全站改寫、以及學到了什麼的故事。

ai-quality llm-as-judge ralph-loop multi-agent content-quality

寫了 11 章才敢回答的問題：到底什麼是 Agentic Engineering？

MP-171 2026-03-16 · @simonw on X

Simon Willison 的 Agentic Engineering Patterns 指南加到第 12 章了，但這章排在系列最前面——他終於正式回答「什麼是 Agentic Engineering」。答案意外地簡潔：讓會跑 code 的 agent 幫你開發軟體。但真正有趣的是他花了 11 章實戰經驗後才敢下這個定義。

simonw-agentic-patterns simon-willison ai-agents claude-code codex best-practices

AI 寫的 Code 品質變差？那是你的選擇，不是 AI 的錯

MP-172 2026-03-16 · @simonw on X

Simon Willison 的 Agentic Engineering Patterns 第三章：AI 應該幫我們產出更好的 code，不是更差的。技術債的成本被 coding agent 壓到趨近零，你再也沒有藉口不 refactor。加上 agent 能平行跑 prototype，選架構不再是賭博。

simonw-agentic-patterns simon-willison ai-agents refactoring technical-debt best-practices

四個字的開場白，讓你的 Coding Agent 自動進入測試模式

MP-173 2026-03-16 · @simonw on X

Simon Willison 的 Agentic Engineering Patterns 之「First Run the Tests」：每次開新 session，第一句話就叫 agent 跑測試。四個字，三層效果——agent 會知道怎麼跑 test、知道 codebase 多大、而且自動進入「我要維護測試」的心態。

simonw-agentic-patterns simon-willison ai-agents testing tdd best-practices

Simon Willison 的 Agentic Engineering 爐邊對談：測試免費了、程式品質是你的選擇

MP-169 2026-03-15 · @simonw on X

Simon Willison 在 Pragmatic Summit 分享了他的 agentic engineering 實戰方法：五個 token 啟動 TDD、Showboat 做手動驗證、用六個框架反推出標準再實作、以及 code quality 是一個有意識的選擇。

simon-willison simonw-agentic-patterns tdd ai-agents best-practices

AI 生了一千行，然後你就 merge 了？Simon Willison 點名 Agentic 開發最常見的爛習慣

MP-146 2026-03-09 · @simonw on X

Simon Willison 在他的 Agentic Engineering Patterns 指南裡新增了「Anti-Patterns」章節，第一條就是：不要把 AI 生的、你自己根本沒看過的 code 丟給同事 review。你省了時間，但你的 reviewer 付出了代價——而他們大可以自己叫 AI 生。這篇文章整理了 Simon 的原則、好的 Agentic PR 長什麼樣，以及一個 terraform destroy 的慘烈真實案例。

simon-willison simonw-agentic-patterns code-review anti-patterns ai-agents best-practices

從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini

GP-89 2026-03-09 · OpenClaw Docs

OpenClaw 的 ACP（Agent Client Protocol）讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent，還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。（2026-03-09 更新：Telegram topic binding、persistent bindings、ACP Provenance 等新功能）

openclaw acp agent-client-protocol ai-agents codex claude-code gemini multi-agent

從「寫 Code 助手」到「自動駕駛的程式碼庫」：Cursor Automations 如何改變團隊工作流

MP-144 2026-03-08 · @mntruell on X

Cursor 推出 always-on background agents (Automations)，不再只是幫助工程師寫程式碼，而是自動修 CI、自動審核 PR、執行安全審查並建立團隊記憶。這標誌著從 Coding Assistant 向 Self-Driving Codebase 的 Paradigm Shift。

cursor ci-cd automation

叫 AI 自己按按看：Simon Willison 的 Agentic Manual Testing，填補自動化測試抓不到的盲區

MP-145 2026-03-08 · @simonw on X

Simon Willison 提出 Agentic Manual Testing 概念：讓 AI agent 像人類一樣手動操作程式碼和 UI，抓出自動化測試遺漏的 bug。搭配 Playwright、Rodney、Showboat 等工具，把「測試通過但其實壞了」的窘境變成歷史。

simon-willison simonw-agentic-patterns testing qa ai-agents best-practices

世界級 Agentic Engineer 的真相 — 少裝一點，反而飛更快

GP-102 2026-03-04 · @systematicls on X

這篇推文的核心很直接：多數人不是輸在模型太弱，而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流，再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具，而是把 agent 的行為設計成可控、可驗證、可收斂。

context-engineering

Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究

MP-135 2026-03-01 · Andrej Karpathy (@karpathy)

Karpathy 花了一個週末，用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊，讓它們在 GPU 上跑 nanochat 實驗。結論：Agents 執行力一流，但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯

karpathy multi-agent ai-research nanochat claude-code codex

AI 生的 Code 看不懂？讓 Agent 幫你做動畫解釋 — Simon Willison 的 Interactive Explanations

GP-90 2026-03-01 · Simon Willison @simonw

Simon Willison Agentic Engineering Patterns 第五章：Interactive Explanations。核心主張：與其硬啃 AI 生成的 code，不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。

simonw-agentic-patterns simon-willison cognitive-debt ai-agents claude-code best-practices

claude -p 完全攻略：把 Claude CLI 變成你的 Agentic App 後端

GP-91 2026-03-01 · @dhasandev on X

Anthropic 砍了第三方 OAuth token，只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p（print mode）的所有用法：5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming，到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。

claude-code claude-cli tutorial developer-tools

Claude 原生律師事務所：一個律師如何用 AI 幹掉百人大所

GP-92 2026-03-01 · Zack Shapiro on X

一個只有兩人的精品律師事務所，靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究，全部用 Claude Skills 編碼十年執業經驗。這篇不是理論，是每天在用的 workflow — 而且結論是：通用 AI 打爆所有法律垂直 AI 產品。

claude-code legal-tech workflow real-world

Cursor CEO 說出口了：軟體開發第三紀元來臨 — Tab 時代結束、Agent 時代也快了，接下來是「工廠模式」

MP-134 2026-02-28 · Michael Truell (@mntruell), Cursor CEO

Cursor CEO Michael Truell 用三組數據宣告軟體開發的第三紀元：Agent 用量一年暴增 15 倍、Tab:Agent 使用者比翻轉為 1:2、Cursor 內部 35% 的 PR 來自雲端 AI Agent 自主完成。開發者的角色正在從「寫 code」變成「設計工廠」(╯°□°)╯

cursor michael-truell cloud-agents software-development third-era ai-agents

你會的東西都是武器 — Simon Willison 的「囤積式開發」哲學

GP-88 2026-02-27 · Simon Willison @simonw

Simon Willison Agentic Engineering Patterns 第四章：Hoard Things You Know How to Do。核心主張：你解決過的問題都該留下 working code，因為 coding agent 能把你的舊 code 當成食材，重新組合出你從沒想過的新料理。

simonw-agentic-patterns simon-willison ai-agents claude-code best-practices knowledge-management

一個工程師 + AI，一週重建 Next.js——然後 tldraw 嚇到把測試搬進私有 repo

MP-129 2026-02-26 · Cloudflare Blog / tldraw GitHub / Simon Willison

Cloudflare 工程師 Steve Faulkner 用 Claude AI 花一週、$1,100 token 費用，從零重建了 Next.js 的 94% API，產出的 vinext 比 Next.js 快 4.4 倍、bundle 小 57%。關鍵武器？Next.js 公開的測試套件。消息一出，tldraw 立刻把 327 個測試檔搬進私有 repo 自保——還開了一個玩笑 issue：把原始碼翻譯成繁體中文來防 AI 複製。當你的 test suite 變成敵人的 spec，Open Source 的遊戲規則就徹底變了。

cloudflare vinext next-js vite tldraw open-source ai-impact test-suite intellectual-property