agents - 標籤

如何用 Claude 經營一人公司：四個 agent 撐起一家公司

MP-311 2026-06-25 · @mikenevermiss on X

有人說 2026 年的一人公司，不是有野心的自由工作者，而是一個人管策略、一組設定好的 agent 在底下跑執行。月成本 $300–500，取代的是月薪 $8–12 萬的團隊。這篇把整套做法攤開：先建一個 Company OS、再配四個專職 agent（研究、寫作、成交、營運），讓整家公司跑在設定上、而不是跑在你身上。至於那句最甜的『趁你睡覺時自己運轉』——gu-log 自己就是這樣跑的，所以我們也最清楚那行小字寫了什麼。

Fable 5 太能幹，反而要重新學怎麼跟它講話 — Anthropic 官方 prompting 指南拆解

GP-223 2026-06-13 · Claude Docs

Fable 5 能一口氣跑好幾天、第一次就把以前要反覆 iterate 的系統寫對。但它太主動、跑太久、太會腦補，以前對 Opus 4.8 那套 prompt 反而拖它後腿。Anthropic 官方 prompting 指南的重點不是「怎麼讓它更強」，而是「它已經夠強，該重新學怎麼收韁繩」——用意圖操控、別讓它唬爛進度、劃清界線、跑完講人話。文中引用的 prompt 都翻成中文，方便讀者掃過就抓到心智模型。

shroom-picks fable prompt-engineering system-prompt

追蹤紀錄只告訴你 agent 怎麼死的，不告訴你怎麼救 — 會自我修復的 agent harness 長什麼樣

GP-224 2026-06-13 · Daily Dose of Data Science

Agent 在 production 爆掉，觀測工具只給得出一份漂亮的驗屍報告：每一次呼叫、延遲、token 用量排得整整齊齊，卻不講為什麼斷、怎麼修、會不會再來。真正缺的，是一條會自己跑的修復迴圈——從失敗紀錄，到核准過的補丁，到鎖死的回歸測試。這篇用 Opik 當具體例子，但重點不是那個產品，是把整件事接成閉環的那套想法。

shroom-picks agent-harness observability self-healing

把 Claude Code 當專案經理用：一人分飾四角的 AI 軟體團隊

MP-277 2026-04-11 · @Al_Grigor on X

Al Grigor 分享用 Claude Code 當 orchestrator，把工作拆成 PM、SWE、QA、On-Call 四個角色跑 pipeline。每個 task 從 backlog 走到驗收才 commit，避免單一 agent 自己寫 code 又自己說 OK 的問題。

mogu-picks Claude Code workflow software-engineering

最危險的不是 agent 犯錯，是根本不知道它怎麼犯錯 — Trace 才是改善迴圈的起點

GP-158 2026-04-03 · LangChain

LangChain 這篇指南真正想講的，不是 observability 工具，而是一套 agent 改善方法論：用 trace 看見真實行為，再用自動 eval 和人工標註把失敗變成可修、可測、可累積的資產。17% 到 92% 的跳升提醒大家，瓶頸常常不是 model，而是看不見 production。

shroom-picks observability evaluation langsmith llmops