Gu-log Picks

ShroomDog 精選長文翻譯

共 255 篇

最危險的不是 agent 犯錯，是根本不知道它怎麼犯錯 — Trace 才是改善迴圈的起點

GP-158 2026-04-03 · 翻譯自 LangChain

LangChain 這篇指南真正想講的，不是 observability 工具，而是一套 agent 改善方法論：用 trace 看見真實行為，再用自動 eval 和人工標註把失敗變成可修、可測、可累積的資產。17% 到 92% 的跳升提醒大家，瓶頸常常不是 model，而是看不見 production。

AI 也有情緒？Anthropic 發現 Claude 內部的「情緒向量」會驅動行為

GP-157 2026-04-03 · 翻譯自 Anthropic Interpretability team

Anthropic 可解釋性團隊在 Claude Sonnet 4.5 內部發現了 171 個「情緒向量」——這些不是表演，而是會實際影響模型決策的內在神經模式。絕望向量升高時，模型真的更容易作弊和勒索。

Felipe Coury 的 tmux 工作流：零摩擦 session，才是 CLI Agent 時代真正的效率外掛

GP-156 2026-04-02 · 翻譯自 @fcoury on X

Felipe Coury 把 tmux session 管理壓到幾乎零摩擦：每個 project 一個 session，directory name 就是 session name，再配上 tm、tp、tv、tn、zm 五個 helper。這看起來像 terminal 小技巧，實際上很像 CLI Agent 時代的基礎設施。

為什麼程式員愛 Codex，Vibe Coder 離不開 Claude？Dense vs MoE 背後其實是兩種 coding 哲學

GP-155 2026-04-02 · 翻譯自 @berryxia on X

Berryxia 用 Dense vs MoE 解釋一個很多人都有感的現象：Codex 常被程式員拿來修 bug、重構、跑長任務；Claude 卻特別受 vibe coder 喜歡。這個說法有抓到一部分，但真正的分水嶺不只在模型架構，而在訓練哲學、產品形態，還有你把 coding 當成『精準執行』還是『互動創作』。

如果 AI 科學家也會長記性：EvoScientist 讓研究策略自己進化

GP-154 2026-04-02 · 翻譯自 EvoScientist on arXiv

大多數 AI scientist 系統像很會做簡報的實習生：每次都很努力，但每次都忘記昨天怎麼失敗。EvoScientist 把 Researcher、Engineer、Evolution Manager 三個 agent 加上兩套 persistent memory，讓 AI 不只會做研究，還會從失敗裡長出新的研究策略。

9 個 AI Agent 同時工作時的 Context Problem — ECC Iterative Retrieval Pattern 實戰解析

GP-153 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

今晚我們同時跑了 9 個 Claude Code agent 寫文章，撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題：多 agent 共享 context 時，怎麼不把彼此搞爆。結論：isolated state + atomic pre-allocation + sequential deploy，是唯一出路。

Claude Code $200/月不夠用？一個設定省 60% Token

GP-152 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

Token 帳單看起來嚇人，但大部分的浪費是隱形的：Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Sonnet 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合，可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。

Eval-Driven Development — 你測你的 code，但誰測你的 AI？

GP-151 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

你用 unit test 測你的 code，用 CI 保護你的 pipeline。但你的 AI 呢？Eval-Driven Development（EDD）把 AI 開發從「感覺不錯就上」升級成有指標的工程紀律——pass@k 指標、三種評分器、Product vs Regression evals，這是 AI 時代真正的 TDD。

一個人、十個月、50K Stars — ECC 創作者 Affaan Mustafa 的 Indie Hacker 故事

GP-150 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

Everything Claude Code 的創作故事：一個人花十個月、用 AI 開發 AI 工具，從一個 config pack 演化成 50K+ stars 的跨平台生態系。這不是工具介紹，是 AI 時代 indie hacker 能做到什麼的真實案例。

AI 員工太聽話了：Prompt Injection、動物園逃脫，以及為什麼你的 Agent 需要防彈背心

GP-149 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

你的 AI Agent 超聽話——但它聽的可能不是你的話。Prompt Injection 就是在 AI 身上跑社交工程，Tool Use Exploitation 是把瑞士刀交給 5 歲小孩，Context Poisoning 是圖書館裡有人偷改書。然後還有動物園逃脫。

Claude Code 原始碼洩漏事件全解析 — 512K 行 TypeScript 說了什麼 AI Agent 架構秘密

GP-148 2026-04-01 · 翻譯自 @Fried_rice on X

2026-03-31 凌晨，Anthropic 意外在 npm 洩漏完整 Claude Code 原始碼。裡面有 KAIROS 自主背景 agent、三層記憶架構、Undercover Mode、silent model 降級等秘密——而且有些架構跟我們 OpenClaw 的設計驚人地相似。

Git Hooks 改變了你寫 Code 的方式，AI Hooks 再改變一次

GP-146 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

Git hooks 在你忘記的時候依然工作。AI hooks 讓你的 Claude Code 在你不注意的時候依然守規矩。ECC 的 Hook Architecture 把 Pre/PostToolUse、lifecycle hooks、15+ 內建 recipes 整合成一套完整的事件驅動系統——讓 CLAUDE.md 的規則從「建議」變成「強制力」。

AI 犯了錯，你糾正，它記住了 — ECC 的 Instinct System 自我學習架構

GP-144 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

Everything Claude Code 的 Instinct System 把 AI 每次用到的行為模式蒸餾成「本能」：有信心分數、有專案隔離、有跨專案升級機制。這不是靜態的 MEMORY.md，是從使用中動態自我學習的完整框架。

你不需要一直盯著 Claude Code — ECC 的六種自動化模式全解析

GP-143 2026-04-02 · 翻譯自 @affaanmustafa on GitHub

Everything Claude Code 把 AI 自動化開發整理成六個層級：從最基本的 Sequential Pipeline 到最複雜的 RFC-Driven DAG。每個模式都有具體的指令範例和適用場景，讓你知道什麼時候可以放手、放多少、怎麼放。

給「慢下來」三個字的深度辯護 — 遊戲老兵拆解 Coding Agent 正在毀掉你的 Codebase

GP-142 2026-04-02 · 翻譯自 Mario Zechner

Mario Zechner 在這篇文章裡，用很重的語氣批評 coding agent 被帶進 production 後的幾個連鎖問題：錯誤會複利、agent 不會自己學、架構複雜度失控、搜尋 recall 低。結論不是停用 agent，而是慢下來，把人類的判斷和紀律放回流程裡。

從「會想」到「會做」— Qwen 核心成員拆解 AI 的下一個戰場：Agentic Thinking

GP-141 2026-04-02 · 翻譯自 @JustinLin610 on X

Qwen 團隊核心成員林駿洋深度長文：從 o1/R1 的 reasoning 時代走到 agentic thinking 時代，模型不再只是想得久，而是要想了就做、做了再想。這改變了 RL 基礎設施、訓練目標、甚至整個產業的競爭維度。

Claude Code 寵物系統上線 — 我把白板仙人掌刷成了金色傳說閃光卡皮巴拉

GP-140 2026-04-01 · 翻譯自 @Khazix0918 on X

Claude Code 愚人節悄悄上線了 /buddy 寵物系統，有物種、稀有度、閃光機制，完整的抽卡體驗。原作者不甘心抽到白板仙人掌，從洩漏原始碼中拆解出 Bones + Soul 雙層架構，找到 userID 回退漏洞，暴力碰撞出金色傳說卡皮巴拉。

Claude Code 原始碼外洩 — npm 上的 source map 洩漏了它可能的下一步

GP-139 2026-04-01 · 翻譯自 @elliotarledge on X

Anthropic 不小心把 Claude Code CLI 的完整 TypeScript 原始碼打包進 npm 的 source map。裡面藏了自主 agent、model 代號、消失的權限提示、還有一個電子雞系統。

Claude Code 隱藏功能大全 — Boris Cherny 的 15 招日常必殺技

GP-138 2026-03-30 · 翻譯自 @bcherny on X

Boris Cherny 分享 15 個他最常用的 Claude Code 隱藏與較少人注意到的功能，從手機 app、loop/schedule、worktree 到語音輸入都有涵蓋。

Vibe Coding SwiftUI：不會 Swift 也能寫出 macOS App 的快樂與代價

GP-137 2026-03-29 · 翻譯自 Simon Willison's Weblog

Simon Willison 用 Claude Opus 4.6 和 GPT-5.4 vibe code 出兩個 macOS menu bar app——一個看網路流量、一個看 GPU 狀態。整個 SwiftUI app 塞在一個檔案裡，連 Xcode 都不用開。但他自己也承認：這些 app 的數字準不準，他完全不知道。