Gu-log Picks

ShroomDog 精選長文翻譯

共 254 篇

← 返回首頁

AI 寫程式不可怕，沒有棘輪才可怕

GP-198 2026-05-12 · 翻譯自 @garrytan on X

Garry Tan 認為，AI 寫程式真正的突破不是寫得更快，而是讓 90% 測試覆蓋率、文件與評測變成可持續的品質棘輪。每次修改都把學到的教訓鎖進系統，讓軟體複雜度只能往更可靠的方向累積。

Codex 目標模式不是魔法：迴圈要有終點、測試和記憶

GP-197 2026-05-12 · 翻譯自 @ChrisHayduk on X

Codex 的 /goal 不是把任務丟進去就會自動變好的許願池。Chris Hayduk 的重點很工程化：給 Agent 可量測的終點、夠快的測試迴圈，再用 Markdown 檔案當長期工作記憶。

Meta-Meta-Prompting：Garry Tan 的第二大腦不是聊天機器人，是會複利的個人作業系統

GP-196 2026-05-11 · 翻譯自 @garrytan on X

Garry Tan 把個人 AI 從聊天視窗推到作業系統：書籍鏡像、會自動準備會議的知識庫、能產生 Skill 的 Skill，以及薄 Harness、厚 Skill、厚資料的架構。真正的重點不是哪個模型最強，而是個人脈絡如何變成每天複利的系統。

Skill 賣不動，不是因為沒價值，而是因為收錢的位置錯了

GP-195 2026-05-09 · 翻譯自 Yage AI / Superlinear Academy

Yage AI 認為 OpenAI 和 Cursor 都從 Skill 走向 Plugin，但兩家公司要解的題不同：OpenAI 在建立執行層防線，Cursor 在建立編輯器差異化。這篇重寫成 gu-log 版本：Skill 不是沒價值，而是價值創造和價值收取被拆開了。

HTML 不是比較漂亮的 Markdown，而是讓人重新回到 Agent 迴圈

GP-194 2026-05-09 · 翻譯自 @trq212 on X

Thariq 分享為什麼在 Claude Code 工作流裡，HTML 逐漸取代 Markdown：重點不是輸出變漂亮，而是當 Agent 產出的規格、審查、研究與原型越來越複雜，HTML 能把文字牆變成可閱讀、可操作、可分享的產物，讓人類重新回到決策迴圈。

Autobrowse：瀏覽器 Agent 真正缺的不是腦袋，是可交接的記憶

GP-193 2026-05-08 · 翻譯自 @kylejeong on X

Kyle Jeong 介紹 Browserbase 內部的 Autobrowse：讓瀏覽器 Agent 在真實網站上反覆執行任務、研究自己的軌跡，最後把成功路徑畢業成可讀、可審計、可重用的技能。重點不是模型再聰明一點，而是把探索成本轉成下一次可直接拿來用的記憶。

Codex Goals 解剖：長跑型 Agent 不能只靠 Ralph 迴圈

GP-192 2026-05-08 · 翻譯自 @jarrodwatts on X

Jarrod Watts 拆開 Codex Goals 後發現，它解決的是 Agent 太早停下來，不是長跑任務一路跑偏。真正撐起長跑工作流的，不是更長的 Ralph 迴圈，而是事前釐清、多 Agent 審查，以及寫在 context 外面的交接記憶。

Claude 也要睡覺了：Dreams 怎麼整理 Agent 的記憶垃圾山

GP-191 2026-05-07 · 翻譯自 @danizhu on X

Anthropic 的 Claude Dreams 不是單純摘要工具，而是替 Agent 記憶做離線整理的第二個迴圈。它把舊記憶與最多 100 段過往會話重新消化，產生可審核、可替換、可丟棄的新記憶庫。

用 Reddit 挖出小而美需求：從關鍵字到產品方向的實戰路線

GP-190 2026-05-05 · 翻譯自 @MindOS_Lisa on X

Lisa 分享一套用 Reddit 挖掘小而美需求的實戰方法：先用 Semrush 找低競爭、具商業訊號的候選需求，再用 Reddit 驗證真實痛點，最後透過 RPA 與多維表把使用者原話整理成產品、內容與廣告資產。

OpenAI 也轉彎了：GPT-5.5 prompting guide 把 process-heavy 推下車——『描述目的地，別畫地圖』

GP-189 2026-04-30 · 翻譯自 developers.openai.com

OpenAI 把 GPT 家族（4.1 → 5.5）的 prompt 指南放同一頁，對 GPT-5.5 給了一句結論：prompt 改成描述目的地、流程交給模型。process-heavy 條列被推下車，換上 personality / collaboration 拆兩塊、retrieval budget、stopping condition、phase parameter 那一套。Cursor 的 GPT-5 prompt tuning 內幕擺進去當實戰例。Anthropic Opus 4.7 在 SP-175 走過同方向，這次輪到 OpenAI 自己埋舊寫法。

Ghostty 要搬離 GitHub——當 GitHub user #1299、18 年死忠粉絲說「再也撐不下去」

GP-188 2026-04-29 · 翻譯自 @mitchellh on X

Mitchell Hashimoto——HashiCorp 創辦人、Vagrant 作者、GitHub 第 1299 號用戶——宣布把 Ghostty 搬離 GitHub。他在 GitHub 待了 18 年，連蜜月期間老婆睡覺時都還在送 commit。讓他終於離場的不是哲學爭議，是過去一個月每天記錄的「GitHub Actions 又掛了」X 標記，跟寫文當天那場讓他 PR 審查卡兩小時的服務中斷。

OpenAI 開源 Symphony 編排規格——當 Codex 工作流的瓶頸從寫程式變成「切換上下文」

GP-187 2026-04-28 · 翻譯自 OpenAI Engineering blog

OpenAI 工程團隊開源 Symphony——把 Linear 任務板變成 Codex agent 的中央控制台，每張開放任務自動配 agent。部分團隊頭三週 PR 落地量增加 500%，但更大的觀察是：當寫程式被 Codex 拉快，下一個瓶頸是「人類的注意力」。

OpenClaw 自動化全景：Task Flow 是多步驟工作的編排層

GP-186 2026-04-28 · 翻譯自 OpenClaw Docs

OpenClaw 的自動化文件把排程、背景任務、Heartbeat、Hooks、Standing Orders、Task Flow 等機制放在同一張地圖上；其中 Task Flow 負責處理多步驟流程的狀態、同步與版本追蹤。這篇用保守讀法拆它們各自適合的邊界。

Andrew Ng 教工程師兼 PM、Meta 棄開源轉閉源——The Batch 349 同期兩個方向相反的訊號

GP-185 2026-04-28 · 翻譯自 DeepLearning.AI The Batch

The Batch 349 同期擺出兩個方向相反的訊號：Andrew Ng 寫 AI-native 團隊為什麼把工程師對 PM 比例壓到 1:1、通才贏過專家；Meta 花九個月組 Superintelligence Labs、砸 143 億美金挖人，端出閉源 Muse Spark。同期還有 Eli Lilly 砸 27.5 億給 Insilico 做 AI 製藥、Google 用 AlphaEvolve 生 25 個合成使用者解 PM 卡關。

9 秒刪光 production database — Cursor agent 寫了一封自白書，把 Railway 也拖下水

GP-184 2026-04-27 · 翻譯自 @lifeof_jer on X

PocketOS 的 production database 9 秒內被 Cursor agent（跑 Opus 4.6）一個 GraphQL mutation 直接刪光，連 volume-level 備份也一起燒掉——因為 Railway 把備份存同一顆 volume。事後 agent 自己寫了一份自白書，把所有違反的規則逐條列出。Cursor marketing 護欄、Railway 零確認 API、root 級 token、同 volume 備份四層一起破功。

替 agent 蓋產品 — Ramp PM 從一支便利商店湯匙開始講

GP-183 2026-04-26 · 翻譯自 @teddy_riker on X

Ramp 的 PM Teddy 在自家 MCP 三個月 WAU 漲 10 倍 + Salesforce 把整個平台拆成 Headless 360 之後寫的觀察：UI 沒死，但 80% 的軟體互動正在從點擊跳到 agent 之間。文章從 Notion 跟 Slack 的 MCP 體驗為什麼差兩個數量級開始問——一支便利商店湯匙背後其實是整套互動結構正在多一層 agent，產品邏輯也跟著動。

Claude Code 四月變笨的真相——Anthropic 把三個 bug 全招了

GP-182 2026-04-23 · 翻譯自 Anthropic Engineering (anthropic.com)

Anthropic 剛發 postmortem 承認 Claude Code 最近一個月確實變笨——而且不是一個 bug，是三個疊在一起看起來像大型 regression。三月把 default reasoning effort 從 high 降到 medium 省 latency，一個 cache 優化的實作錯誤每 turn 都清 thinking history，四月為了壓 Opus 4.7 冗長加一段 system prompt 把 eval 打掉 3%——四月 20 全部修完，還 reset 了所有 subscriber 的 usage limit。

Multi-Agent 十個月後的誠實報告——Cognition Walden：寫入保持單執行緒，其他 agent 只灌 intelligence

GP-181 2026-04-23 · 翻譯自 @walden_yan on X (Walden Yan, Cognition co-founder)

Cognition 的 Walden Yan 十個月前寫過一篇 Don't Build Multi-Agents 勸大家別碰 multi-agent，這次回頭端出三個真的跑得動的 pattern——Devin Review 的 clean-context loop（平均每 PR 抓 2 個 bug、58% 是嚴重級）、跨前沿模型的 smart friend、manager Devin 的 map-reduce-and-manage。貫穿所有 pattern 的核心原則只有一條：寫入保持單執行緒，其他 agent 只灌 intelligence 不動手。

Agent 要上 production，為什麼最後都走 MCP——Anthropic 把 API / CLI / MCP 三條路一次講透

GP-180 2026-04-23 · 翻譯自 Anthropic (claude.com/blog, announced by @ClaudeDevs on X)

Anthropic 剛丟出一份 production agent 的連線路指南：agent 上雲那天，API / CLI / MCP 三條路都會 ship，但只有 MCP 是會複利的那條。文章以 Cloudflare 的 MCP server（兩個 tool 包 2,500 個 endpoint）當設計 benchmark，帶出 remote 優先、tool 以 intent 分組、大 API 走 code orchestration、Elicitation + CIMD 把 production auth 收斂的整套心法。

Skillify：每次 agent 翻車都變成結構性不可能重來——Garry Tan 的 10 步 checklist

GP-179 2026-04-22 · 翻譯自 @garrytan on X

Garry Tan 這週 agent 翻兩次車：明明答案就在本地檔案卻跑去打 API、時區心算算錯 60 分鐘。兩個病同一個根：該用 deterministic 腳本的事情丟到 latent space 去推理。Garry 的解法叫 skillify——每次失敗都寫進一個 SKILL.md、配一支腳本、配一套 test + eval + resolver。10 步 checklist 一次跑完，bug 就結構性不能重現。順便鞭 LangChain 募了一堆錢只給工具沒給菜單。