ShroomDog Picks 全部文章

別讓 Codex 教你：用 5 步把 AI 變成學習教練

SP-213 2026-05-30 · 翻譯自 @Moting284 on X

用 Codex 學新工具時，最糟的用法是叫它上課。比較好的方法是叫它幫你找入口、畫粗略地圖、設計最小練習，再逼你講回來並留下麵包屑。

Anthropic 怎麼把 Claude 關在籠子裡：agent 安全不是多問幾次確認

SP-212 2026-05-27 · 翻譯自 Anthropic Engineering

Anthropic 拆解 claude.ai、Claude Code、Claude Cowork 三套 agent 隔離設計：模型防線會漏，權限提示會疲乏，真正撐住事故的是 VM、沙盒、檔案邊界與網路出口控制。

Google 的程式碼審查規範：不要追求完美，要守住程式碼健康

SP-211 2026-05-24 · 翻譯自 Google Engineering Practices（via X）

Google Engineering Practices 的程式碼審查指南，把審查標準從個人口味拉回長期程式碼健康：不追求完美，但每個 CL 都要讓系統比昨天更容易維護。

Codex 不只是寫程式了 — 它正在變成電腦工作的作業系統

SP-210 2026-05-23 · 翻譯自 @jxnlco on X

Codex 的重點正在從「幫工程師改程式」往外擴張：持久 thread、語音、排隊、瀏覽器、MCP、桌面操作、自動化、側邊欄與共享記憶，組成的是一套能把電腦工作從指令推到成果審查的系統。

AI 的拒答開關，可能藏在 0.1% 的神經元裡

SP-209 2026-05-20 · 翻譯自 Nous Research on X

Nous Research 提出 CNA，用對比 prompt 找出控制拒答行為的極少數 MLP 神經元。重點不是 jailbreak，而是對齊微調可能把既有內容辨識結構改造成可定位的拒答閘門。

Codex Goals 官方指南：Agent 不是繼續做，是拿證據收工

SP-208 2026-05-20 · 翻譯自 OpenAI Cookbook

OpenAI 官方指南把 Codex Goals 講成對話串範圍內的完成契約：目標會持續存在，但完成必須靠測試、基準測試、報告或研究證據判定。這篇補上 SP-192、SP-197、SP-207 缺的官方規格角度。

AI Agent 不是有目標就夠了

SP-207 2026-05-18 · 翻譯自 @PawelHuryn on X

OpenAI 和 Anthropic 都把 /goal 類能力推進 coding agent，但目標只解決一小塊問題。真正能讓 agent 安全自動工作的，是策略、限制、健康指標、自治邊界與停止規則。

大型程式庫裡的 AI 寫程式，勝負不只在模型

SP-206 2026-05-19 · 翻譯自 Claude Blog

Claude Code 在大型程式庫裡能不能跑起來，關鍵不是只看模型測試分數，而是團隊有沒有替 Agent 鋪好路：清楚的地圖、可靠的自動化、按需載入的專業工具、符號級導航、內部系統入口，以及有人長期維護這套操作架構。

不要把學習也外包給 AI

SP-205 2026-05-18 · 翻譯自 @addyosmani on X

Addy Osmani 提醒：AI coding 的預設流程會幫人關任務，但不會自動讓人變強。真正的差別不是用不用 AI，而是有沒有把 AI 變成測試理解、補強心智模型的工作流。

如果 Token 不再是限制：OpenClaw 的常駐 Agent 實驗

SP-204 2026-05-16 · 翻譯自 @steipete on X

Peter Steinberger 說，OpenClaw 長期在雲端跑約一百個 Codex。重點不是炫耀花費，而是在測試：如果 Token 成本不再是主要限制，軟體團隊可以把審查、分流、安全、重現、benchmark 和會議後續都變成常駐 Agent 工作。

Bun 轉 Rust，最可惜的是被寫成語言戰

SP-203 2026-05-16 · 翻譯自 @mitchellh on X

Mitchell Hashimoto 看 Bun 從 Zig 轉 Rust，不把它當成 Rust 贏、Zig 輸的語言戰，而是提醒開發者工具公司更該主動管理敘事。真正有趣的是語言越來越可替換，以及崩潰背後到底是語言保證、工程紀律，還是產品速度的問題。

Anthropic 的 2028 AI 領導權：兩個劇本與一場算力競爭

SP-202 2026-05-15 · 翻譯自 Anthropic

Anthropic 在這篇政策文章裡提出兩個 2028 年 AI 領導權劇本：美國與盟友守住算力與模型領先，或 CCP 控制下的 AI 生態追到近前沿。文章主軸是算力、出口管制、模型蒸餾與民主國家能不能先設定規則。

Agent 真正難的不是模型，而是工程現場

SP-201 2026-05-15 · 翻譯自 @HiTw93 on X

一篇從控制迴圈、Harness、上下文工程、工具設計、記憶、多 Agent、評測、追蹤到安全邊界的 Agent 工程指南。核心不是把模型換貴，而是把任務、狀態、驗證與工具邊界做成機器能穩定執行的系統。

Codex CLI 的記憶不是魔法，是一疊可 grep 的 Markdown

SP-200 2026-05-14 · 翻譯自 @mem0ai on X

Mem0 拆解 Codex CLI 記憶：本體不是向量資料庫，而是本機 Markdown、背景摘要、密碼清理與 grep 搜尋。這篇用工程取捨看懂本機小抄和語意記憶層各自適合什麼場景。

語音 Agent 的記憶，比想像中更難

SP-199 2026-05-13 · 翻譯自 @manthanguptaa on X

語音 Agent 不能把文字 Agent 的記憶架構直接搬過來用。Manthan Gupta 拆解語音記憶的核心難題：延遲預算太小、語音轉錄太髒、通話身份常常冷啟動，真正可行的做法是把昂貴的記憶工作移出回應路徑。

AI 寫程式不可怕，沒有棘輪才可怕

SP-198 2026-05-12 · 翻譯自 @garrytan on X

Garry Tan 認為，AI 寫程式真正的突破不是寫得更快，而是讓 90% 測試覆蓋率、文件與評測變成可持續的品質棘輪。每次修改都把學到的教訓鎖進系統，讓軟體複雜度只能往更可靠的方向累積。

Codex 目標模式不是魔法：迴圈要有終點、測試和記憶

SP-197 2026-05-12 · 翻譯自 @ChrisHayduk on X

Codex 的 /goal 不是把任務丟進去就會自動變好的許願池。Chris Hayduk 的重點很工程化：給 Agent 可量測的終點、夠快的測試迴圈，再用 Markdown 檔案當長期工作記憶。

Meta-Meta-Prompting：Garry Tan 的第二大腦不是聊天機器人，是會複利的個人作業系統

SP-196 2026-05-11 · 翻譯自 @garrytan on X

Garry Tan 把個人 AI 從聊天視窗推到作業系統：書籍鏡像、會自動準備會議的知識庫、能產生 Skill 的 Skill，以及薄 Harness、厚 Skill、厚資料的架構。真正的重點不是哪個模型最強，而是個人脈絡如何變成每天複利的系統。

Skill 賣不動，不是因為沒價值，而是因為收錢的位置錯了

SP-195 2026-05-09 · 翻譯自 Yage AI / Superlinear Academy

Yage AI 認為 OpenAI 和 Cursor 都從 Skill 走向 Plugin，但兩家公司要解的題不同：OpenAI 在建立執行層防線，Cursor 在建立編輯器差異化。這篇重寫成 gu-log 版本：Skill 不是沒價值，而是價值創造和價值收取被拆開了。

HTML 不是比較漂亮的 Markdown，而是讓人重新回到 Agent 迴圈

SP-194 2026-05-09 · 翻譯自 @trq212 on X

Thariq 分享為什麼在 Claude Code 工作流裡，HTML 逐漸取代 Markdown：重點不是輸出變漂亮，而是當 Agent 產出的規格、審查、研究與原型越來越複雜，HTML 能把文字牆變成可閱讀、可操作、可分享的產物，讓人類重新回到決策迴圈。

📚 ShroomDog Picks