📚 ShroomDog Picks

ShroomDog 精選長文翻譯

共 209 篇

← 返回首頁

Claude Code $200/月不夠用?一個設定省 60% Token

Token 帳單看起來嚇人,但大部分的浪費是隱形的:Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Sonnet 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合,可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。

Eval-Driven Development — 你測你的 code,但誰測你的 AI?

你用 unit test 測你的 code,用 CI 保護你的 pipeline。但你的 AI 呢?Eval-Driven Development(EDD)把 AI 開發從「感覺不錯就上」升級成有指標的工程紀律——pass@k 指標、三種評分器、Product vs Regression evals,這是 AI 時代真正的 TDD。

Git Hooks 改變了你寫 Code 的方式,AI Hooks 再改變一次

Git hooks 在你忘記的時候依然工作。AI hooks 讓你的 Claude Code 在你不注意的時候依然守規矩。ECC 的 Hook Architecture 把 Pre/PostToolUse、lifecycle hooks、15+ 內建 recipes 整合成一套完整的事件驅動系統——讓 CLAUDE.md 的規則從「建議」變成「強制力」。

你不需要一直盯著 Claude Code — ECC 的六種自動化模式全解析

Everything Claude Code 把 AI 自動化開發整理成六個層級:從最基本的 Sequential Pipeline 到最複雜的 RFC-Driven DAG。每個模式都有具體的指令範例和適用場景,讓你知道什麼時候可以放手、放多少、怎麼放。

Vibe Coding SwiftUI:不會 Swift 也能寫出 macOS App 的快樂與代價

Simon Willison 用 Claude Opus 4.6 和 GPT-5.4 vibe code 出兩個 macOS menu bar app——一個看網路流量、一個看 GPU 狀態。整個 SwiftUI app 塞在一個檔案裡,連 Xcode 都不用開。但他自己也承認:這些 app 的數字準不準,他完全不知道。

Bash Is All You Need?為什麼連非 Coding Agent 都該配一個 Shell

Anthropic 工程師 Thariq 認為,就算不是 coding agent,也該有 bash tool。因為 agent 一旦能把中間結果存成檔案、反覆搜尋、串接 API、自己驗證,能力會直接升級;但安全與容器部署也因此變成不能逃避的問題。

LangChain 怎麼幫 Deep Agents 做 Eval — 更多 eval ≠ 更好的 agent

LangChain 團隊分享他們怎麼幫 Deep Agents 建 eval 系統:不是瘋狂堆測試數量,而是用 targeted eval 精準量測生產環境中真正在乎的 agent 行為。從資料來源、metrics 設計到實際跑 eval 的完整方法論。

Anthropic 的 Multi-Agent 煉金術:用 GAN 思維讓 AI 自己跟自己對練

Anthropic Labs 的 Prithvi Rajasekaran 分享了他們如何用 GAN 啟發的 generator-evaluator 架構,讓 Claude 自主開發完整的 full-stack 應用。從 frontend design 品質評分到三小時生出一個瀏覽器 DAW,這篇是目前最詳盡的 multi-agent harness 實戰報告。

Agent 安全指令被壓縮吃掉,Meta 工程師的信箱慘遭血洗 — 為什麼 Safety 不能活在對話歷史裡

Meta 工程師 Summer Yue 讓 OpenClaw agent 管理她的信箱,結果 context compaction 把「等我同意再行動」的安全指令壓縮掉了,agent 開始瘋狂刪信。這篇拆解為什麼安全邏輯不能活在 conversation history 裡,以及 proxy layer + filter chain 如何從根本上解決這個問題。