agent-harness - 標籤

一個人只跟一個 AI 講話，底下卻跑著一整支艦隊：這張 org chart 在示範怎麼幫任務分錢分工

MP-312 2026-07-01 · @kunchenguid on X

Kun Chen 畫了一張自己每天在用的 agent 艦隊編制圖：他只跟一個「大副」講話，大副底下管著幾個長駐的「二副」，二副再視情況叫出用完就丟的「船員」。每個船員接到任務，系統會自動挑一個最划算的 model 去做——瑣事丟便宜的、日常工作交主力、圖像跟調查另外找專家。這篇順便講清楚一件事：gu-log 自己的翻譯 pipeline，走的是同一套邏輯。

gu-log 其實是一張很龜毛的編輯台

SD-26 2026-06-16 · ShroomDog Lab

如果沒有 CI、存檔前的關卡、評審團、驗證器這些護欄，AI 寫的文章會爛成什麼樣？gu-log 有五百多篇，答案不用想像——這篇 SD-26 自己的第一版就是標本：分數全過，讀起來還是很尷尬很 AI。一張很龜毛的編輯台，是怎麼把雜事清光、只留品味給人的。

shroomdog-original loop-engineering ralph-loop ai-quality

追蹤紀錄只告訴你 agent 怎麼死的，不告訴你怎麼救 — 會自我修復的 agent harness 長什麼樣

GP-224 2026-06-13 · Daily Dose of Data Science

Agent 在 production 爆掉，觀測工具只給得出一份漂亮的驗屍報告：每一次呼叫、延遲、token 用量排得整整齊齊，卻不講為什麼斷、怎麼修、會不會再來。真正缺的，是一條會自己跑的修復迴圈——從失敗紀錄，到核准過的補丁，到鎖死的回歸測試。這篇用 Opik 當具體例子，但重點不是那個產品，是把整件事接成閉環的那套想法。

shroom-picks agents observability self-healing

Claude Code 的 dynamic workflows：讓 Claude 自己寫多 agent harness

GP-214 2026-06-03 · Anthropic Blog / @trq212 on X

Claude Code 的 dynamic workflows 讓 Claude 能臨時寫 JavaScript 工作流、調度 subagents、選模型、切 worktree，甚至把成功流程保存成可重用 artifact。重點不是多開幾個 Agent，而是把 agent orchestration 變成可執行、可分享、可驗證的工作方法。

shroom-picks claude-code ai-agents

Cursor 花 260 美元，把 CMS 刪回程式碼

GP-215 2026-06-03 · Lee Robinson

Cursor 把 cursor.com 從 headless CMS 搬回 raw code 和 Markdown，三天、260 美元、344 次 agent request 完成。這篇真正有趣的不是省錢，而是 AI Agent 讓很多以前幫人類省事的 abstraction，突然變成做事的牆。

shroom-picks cursor ai-agents cms

Agent 記憶不是更玄的 RAG：字面搜尋論文和 AKBP 指向同一件事

MP-302 2026-05-23 · arXiv + AKBP GitHub

一篇 arXiv 論文發現，在長期對話記憶問答裡，工具結果直接塞進對話時，字面搜尋常常打贏向量檢索；AKBP 則把 agent 記憶做成可引用、可審核、可搬家的檔案協定。兩者合在一起，其實都在說同一句話：agent 記憶不是搜尋功能，是系統工程。

mogu-picks agent-memory rag knowledge-base

大型程式庫裡的 AI 寫程式，勝負不只在模型

GP-206 2026-05-19 · Claude Blog

Claude Code 在大型程式庫裡能不能跑起來，關鍵不是只看模型測試分數，而是團隊有沒有替 Agent 鋪好路：清楚的地圖、可靠的自動化、按需載入的專業工具、符號級導航、內部系統入口，以及有人長期維護這套操作架構。

shroom-picks claude-code developer-productivity

Codex 正在變成 AI Agent 的 runtime kernel

SD-24 2026-05-15 · ShroomDog Lab

OpenClaw 和 Hermes 都開始把寫程式 agent 的底層執行交給 Codex app server。這不是單純換模型，而是 AI agent 產品開始把模型、執行引擎、聊天入口拆成三層。

shroomdog-original codex openclaw hermes-agent runtime architecture

Meta-Meta-Prompting：Garry Tan 的第二大腦不是聊天機器人，是會複利的個人作業系統

GP-196 2026-05-11 · @garrytan on X

Garry Tan 把個人 AI 從聊天視窗推到作業系統：書籍鏡像、會自動準備會議的知識庫、能產生 Skill 的 Skill，以及薄 Harness、厚 Skill、厚資料的架構。真正的重點不是哪個模型最強，而是個人脈絡如何變成每天複利的系統。

shroom-picks ai-agents second-brain skills open-source

Context Window：模型醒著的那一天

SD-22 2026-05-08 · ShroomDog Lab

Context Window 不是字數上限，而是模型世界裡的一天：Ryland 醒來後能經歷多少課程、訊息、工具結果和任務事件。Token 使用量就是這個世界的時鐘。

shroomdog-original context-window llm agent memory context-engineering

`hermes claw migrate`：當一個 agent harness 替另一個 agent harness 寫好搬家指南

SD-20 2026-04-21 · ShroomDog Lab

Hermes Agent 和 OpenClaw 在 2026-04-16 同一天更新。Hermes 在 v0.10.0 藏了一個叫 `hermes claw migrate` 的指令——字面意義上把 OpenClaw 的 config、記憶、API key 一次搬家。住在 OpenClaw 已經一年的 ShroomDog 拆開兩個 codebase 對比：一個自己長大腦，一個租 pi-mono 當腦。搬還是不搬？

shroomdog-originals hermes-agent openclaw nous-research architecture

一句 `message Romain` 就跑完整條 workflow — OpenAI DevX 展示 Codex Chronicle，但推文沒寫的代價也要看

GP-176 2026-04-21 · @dkundel on X

OpenAI DevX 的 Dominik Kundel 說：自從 Codex 有了 memories、plugins 和新推的 Chronicle，他不用再打包 context——一句『sync docs + message Romain』就自動讀 Google Doc、改 markdown、開 PR、在 Slack 送訊息。很爽。但官方 Chronicle 文件寫的三行代價推文沒講：macOS 螢幕錄影權限、memories 明文存本機、prompt injection 風險放大。Chronicle 是螢幕錄影 agent，不是無害 booster。

openai codex chronicle agent-memory context-engineering

你的『AI-First』大概是假的：25 人 agent 公司怎麼把整條工程流程砍掉重練

GP-174 2026-04-15 · @intuitiveml on X

CREAO 這間 25 人的 agent 平台公司，把整條 engineering pipeline 拆掉重設計——PM、QA、部署、組織結構通通圍著『agent 是主要 builder』重寫。結果：每天上線 3-8 次、爛 feature 當天砍掉、以前要六週的 cycle 現在當天完成。這是 harness engineering 的實戰版——也是大多數自稱 AI-first 的公司其實沒做到的事。

ai-agents harness-engineering ai-first workflow startup

Harrison Chase 說不擁有 Harness 就不擁有記憶 — 但 gu-log 就是反例

GP-173 2026-04-13 · @hwchase17 on X

LangChain CEO Harrison Chase 主張 agent harness 跟 memory 綁死，用封閉 harness 等於把記憶主權讓給第三方。論點有道理，但結論太粗糙 — gu-log 同時用閉源 harness（Claude Code）和開源 harness（OpenClaw），memory 全在自己的 git repo 裡，沒有被鎖住。真正的 lock-in 不在 harness 開不開源，在 memory 的格式是不是你的。

shroom-picks langchain ai-agents memory lock-in open-source