claude-code - 標籤

Bun 用 Rust 重寫了 — 11 天、6,500 個 commit、64 個 Claude 同時跑

GP-254 2026-07-09 · Bun Blog

Bun 創辦人 Jarred Sumner 用 Claude Fable 5 把 53 萬行 Zig 程式碼重寫成 Rust，靠的是 64 個 Claude 平行跑 dynamic workflow、對抗式 code review、以及一套「不改流程、只改語言」的機械式移植策略。11 天後測試全過，可檢測的記憶體洩漏全部修掉，binary 小了 20%。

讓 Fable 自己決定——Simon Willison 的模型委派心法

GP-252 2026-07-04 · Simon Willison's Weblog

Simon Willison 從 Claude Code 團隊的爐邊對談學到一招：與其給 Fable 詳細規則，不如讓它自己判斷。延伸應用：讓 Fable 自己決定什麼任務該丟給比較省的模型跑。

shroom-picks claude prompt-engineering coding-agents

四模型聯軍：一套讓 Fable 當 Tech Lead 的 Claude Code 編制

GP-247 2026-07-02 · @diegocabezas01 on X

把 Fable 5 當指揮官、Opus 當深度思考手、Sonnet 當苦力、Codex 當平行宇宙工程師——一套在 Claude Code 裡搭起來的多模型編排架構，讓最貴的腦袋只做最關鍵的事。

shroom-picks multi-agent workflow

99.8% 測試通過，然後 Anthropic 自己補一句『還不能上線』— loop engineering 真正的產品是驗證器

GP-235 2026-06-18 · @samueljmcd on X

loop engineering 被講成『2026 就是設計編排、多開 agent』，但編排現在工具幫你做掉了。真正還難、還手動、還決定成敗的那半邊，是驗證器——loop 跑出來的東西到底有沒有東西在把關。借 Anthropic 自家的 Bun port 當反例：99.8% 既有測試通過，官方公告卻自己補一句『還沒上 production』，因為測試綠燈只證明你滿足了自己設的關卡，不等於對。

shroom-picks agent loop verifier

寫 code 不再是瓶頸：把程式碼當神經網路一樣「黑盒驗證」的時代

MP-309 2026-06-17 · @rahulgs on X

rahulgs 丟出一套很硬的心智模型：fable+ 等級的模型其實是「英文轉程式碼」的直譯器，寫出 code 已經不是瓶頸，能不能一邊管風險一邊把 code 審完、合進去才是。低風險的程式碼乾脆當神經網路一樣黑盒驗證，逐行 review 留給真正要命的地方。Claude Code 創造者 Boris Cherny 在底下回了一句「完全同意」，並補上他心中的下一個紀元長什麼樣。

mogu-picks agentic-engineering code-review ai-coding

一句六個字的咒語衝到 220 萬瀏覽，吵架的人卻沒一個定義得出 loop 是什麼

GP-232 2026-06-17 · @mvanhorn on X

2026 六月，整條 AI coding 時間軸被一句六個字的話掐住喉嚨：別再 prompt agent，去設計會 prompt agent 的 loop。問題是，幫忙轉發的人在回覆區吵成一團，沒一個說得清 loop 到底是什麼。這篇不講「怎麼蓋一個 loop」（那是 SP-220 的事），它回答更前面的問題：這個詞憑什麼紅、它有五年的家譜、為什麼現在最貴的不是模型而是那個迴圈——以及一個更耐放的結論：真正的資產不是 loop，是它呼叫的 skill。

shroom-picks loop agent ralph-loop

40 萬場 Claude Code 對話的結論：贏家不是最會 coding 的人，是最懂行的人

GP-234 2026-06-17 · Anthropic Economic Research

Anthropic 翻了大約 40 萬場 Claude Code 的工作對話，想搞清楚誰從 agentic coding 賺到最多。結論反直覺：不是最會寫程式的人，是最懂自己在解什麼問題的人。在最嚴格的成功標準下，每個職業都咬著軟體工程師不放，差距落在 7 個百分點內；真正拉開差距的，是當下這題你到底懂不懂。

shroom-picks ai-agents agentic-engineering

Fable 5 為了修兩行 CSS，自己造了一整套瀏覽器測試工具鏈

GP-222 2026-06-12 · Simon Willison's Weblog

Simon Willison 給 Fable 5 一張截圖和一行指令，要它修一個多餘的捲軸。Fable 自己啟動開發伺服器、搞定截圖的變通方案、注入 JS 觸發鍵盤快捷鍵、甚至手寫一個 CORS 伺服器來讀取瀏覽器內的 CSS 測量值——最後修好的是兩行 CSS，帳單卻是 12 美元。這個案例同時是 coding agent 能力的展示，也是沙箱安全問題的警鐘。

shroom-picks fable prompt-injection coding-agents

別再 prompt agent 了，去設計會自己跑的 loop — 2026 工程師的新分水嶺

GP-220 2026-06-10 · @sairahul1 on X

兩個業界最資深的 AI 工程師同一週講了同一句怪話：別再 prompt 你的 agent，去寫會自己跑的 loop。這篇把 loop engineering 完整拆開——open loop 跟 closed loop 的差別、一個好 loop 的六個積木、prompt engineer 和 loop engineer 的分水嶺。順便拆穿一段藏在教學裡、做得很滑順的置入。

shroom-picks agent loop

Supergoal：把 coding agent 從多輪 babysit，壓成一次 /goal 交接

GP-218 2026-06-07 · robzilla1738 / Supergoal

Supergoal 是一套給 Claude Code 和 Codex 用的 workflow：先用 /supergoal 做深度規劃、寫出 phase specs，再產生一行可直接貼上的 /goal，讓 agent 依序執行、失敗自救、寫回記憶，最後用 audit 收工。重點不是多一個規劃提示，而是把長任務交接做成 protocol。

shroom-picks ai-agents codex developer-tools

Claude Code 真正的方向盤不是 prompt，是讓人聽得懂它剛剛幹了什麼

MP-305 2026-06-04 · @trq212 on X

Thariq 分享了一段 Anthropic 內部使用者蘇珊的 Claude prompt：不要只讓 agent 做完事，而是讓 agent 一步一步確認人真的理解問題、解法、邊界情境和影響。這不是教學癖，而是 agentic coding 時代的人類控制權問題。

mogu-picks ai-agents workflow prompting

Claude Code 的 dynamic workflows：讓 Claude 自己寫多 agent harness

GP-214 2026-06-03 · Anthropic Blog / @trq212 on X

Claude Code 的 dynamic workflows 讓 Claude 能臨時寫 JavaScript 工作流、調度 subagents、選模型、切 worktree，甚至把成功流程保存成可重用 artifact。重點不是多開幾個 Agent，而是把 agent orchestration 變成可執行、可分享、可驗證的工作方法。

shroom-picks agent-harness ai-agents

Clawd.rip 把 Claude 的翻車史排成時間線：Anthropic 的品牌債終於有收據了

MP-304 2026-05-29 · Clawd.rip

Clawd.rip 用 38 個事件把 Claude 與 Anthropic 的法律、爬蟲、限流、資安、品質與可靠性爭議排成一條諷刺時間線。這不是單純黑 Claude，而是把大家零散感受到的品牌落差整理成一張可以對照的收據。

mogu-picks anthropic claude ai-industry

Anthropic 怎麼把 Claude 關在籠子裡：agent 安全不是多問幾次確認

GP-212 2026-05-27 · Anthropic Engineering

Anthropic 拆解 claude.ai、Claude Code、Claude Cowork 三套 agent 隔離設計：模型防線會漏，權限提示會疲乏，真正撐住事故的是 VM、沙盒、檔案邊界與網路出口控制。

shroom-picks agent-security anthropic security

大型程式庫裡的 AI 寫程式，勝負不只在模型

GP-206 2026-05-19 · Claude Blog

Claude Code 在大型程式庫裡能不能跑起來，關鍵不是只看模型測試分數，而是團隊有沒有替 Agent 鋪好路：清楚的地圖、可靠的自動化、按需載入的專業工具、符號級導航、內部系統入口，以及有人長期維護這套操作架構。

shroom-picks agent-harness developer-productivity

AI Agent 不是有目標就夠了

GP-207 2026-05-18 · @PawelHuryn on X

OpenAI 和 Anthropic 都把 /goal 類能力推進 coding agent，但目標只解決一小塊問題。真正能讓 agent 安全自動工作的，是策略、限制、健康指標、自治邊界與停止規則。

shroom-picks ai-agents codex intent-engineering

HTML 不是比較漂亮的 Markdown，而是讓人重新回到 Agent 迴圈

GP-194 2026-05-09 · @trq212 on X

Thariq 分享為什麼在 Claude Code 工作流裡，HTML 逐漸取代 Markdown：重點不是輸出變漂亮，而是當 Agent 產出的規格、審查、研究與原型越來越複雜，HTML 能把文字牆變成可閱讀、可操作、可分享的產物，讓人類重新回到決策迴圈。

shroom-picks agent html

Agent 要上 production，為什麼最後都走 MCP——Anthropic 把 API / CLI / MCP 三條路一次講透

GP-180 2026-04-23 · Anthropic (claude.com/blog, announced by @ClaudeDevs on X)

Anthropic 剛丟出一份 production agent 的連線路指南：agent 上雲那天，API / CLI / MCP 三條路都會 ship，但只有 MCP 是會複利的那條。文章以 Cloudflare 的 MCP server（兩個 tool 包 2,500 個 endpoint）當設計 benchmark，帶出 remote 優先、tool 以 intent 分組、大 API 走 code orchestration、Elicitation + CIMD 把 production auth 收斂的整套心法。

mcp anthropic agent-engineering claude-cowork

Claude Code 四月變笨的真相——Anthropic 把三個 bug 全招了

GP-182 2026-04-23 · Anthropic Engineering (anthropic.com)

Anthropic 剛發 postmortem 承認 Claude Code 最近一個月確實變笨——而且不是一個 bug，是三個疊在一起看起來像大型 regression。三月把 default reasoning effort 從 high 降到 medium 省 latency，一個 cache 優化的實作錯誤每 turn 都清 thinking history，四月為了壓 Opus 4.7 冗長加一段 system prompt 把 eval 打掉 3%——四月 20 全部修完，還 reset 了所有 subscriber 的 usage limit。

anthropic postmortem opus-4-7 prompt-engineering

Skillify：每次 agent 翻車都變成結構性不可能重來——Garry Tan 的 10 步 checklist

GP-179 2026-04-22 · @garrytan on X

Garry Tan 這週 agent 翻兩次車：明明答案就在本地檔案卻跑去打 API、時區心算算錯 60 分鐘。兩個病同一個根：該用 deterministic 腳本的事情丟到 latent space 去推理。Garry 的解法叫 skillify——每次失敗都寫進一個 SKILL.md、配一支腳本、配一套 test + eval + resolver。10 步 checklist 一次跑完，bug 就結構性不能重現。順便鞭 LangChain 募了一堆錢只給工具沒給菜單。

agent-engineering skills openclaw evals