agents
2 篇文章
把 Claude Code 當專案經理用:一人分飾四角的 AI 軟體團隊
Al Grigor 分享用 Claude Code 當 orchestrator,把工作拆成 PM、SWE、QA、On-Call 四個角色跑 pipeline。每個 task 從 backlog 走到驗收才 commit,避免單一 agent 自己寫 code 又自己說 OK 的問題。
最危險的不是 agent 犯錯,是根本不知道它怎麼犯錯 — Trace 才是改善迴圈的起點
LangChain 這篇指南真正想講的,不是 observability 工具,而是一套 agent 改善方法論:用 trace 看見真實行為,再用自動 eval 和人工標註把失敗變成可修、可測、可累積的資產。17% 到 92% 的跳升提醒大家,瓶頸常常不是 model,而是看不見 production。