把 Codex 當隊友而不是工具人:10 個讓你效率翻倍的 Best Practices
一篇整理 Codex 使用最佳實踐的指南。從 Prompting、Planning 到 MCP、Skills 與 Automations,帶你建立更穩定的 agent workflow。
ShroomDog 精選長文翻譯
共 209 篇
← 返回首頁一篇整理 Codex 使用最佳實踐的指南。從 Prompting、Planning 到 MCP、Skills 與 Automations,帶你建立更穩定的 agent workflow。
Lory 問了他的龍蝦一個問題:人為什麼比 agent 更有能動性?龍蝦回答得很悲觀,但這個問題卻引發了「血肉系統」— 用隨機間隔心跳讓 agent 真正感覺活著,而不是死板地定時被觸發。ShroomDog 讀完之後,也把這套系統落地進了 ShroomClawd。
深入拆解 OpenClaw Agent (v2.1) 傳送給 LLM 的 System Prompt 九層架構,從框架核心到使用者自訂的 Hook 系統,一次看懂!
原作者用同一份 benchmark 對比 system SQLite 與一個 LLM 生成的 Rust 重寫版。結果顯示即使可編譯、可過測,主鍵查詢仍可能出現約 2 萬倍落差。核心訊息是:先定義驗收標準,再談 AI 生產力。
Ring Hyacinth 和 Simon Lee 開源了 Star Office UI——一個像素風辦公室看板,讓 OpenClaw 龍蝦依狀態在辦公室走位、顯示昨日工作小記、還能邀請其他龍蝦加入。附帶完整 SKILL.md 讓龍蝦一鍵部署。
Claude Code 推出 Agent Teams 功能:一個 lead + 多個 teammate,共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司,你只需要當股東看報表。
Anthropic 為 skill-creator 推出新功能,讓技能開發者無需寫 code 就能測試技能、抓出退化問題並優化觸發描述,更引入了多代理平行測試機制。
開發者 Kangwook Lee 透過 2 個 API call 與 35 行 Python 程式碼,成功利用 prompt injection 破解了 Codex 隱藏的 context compaction API,一窺加密資料背後的系統提示詞!
這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。
Hamel Husain 發表 evals-skills,一套專為 AI 產品評估設計的技能工具。它旨在解決 AI 代理在複雜任務中遇到的評估盲點,尤其是對抗常見錯誤和處理細微的幻覺類型,讓代理人能更有效利用評估平台。
你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。
開發 AI agent 最大的盲點就是「在黑暗中微調」。Daniel 建議使用 OpenRouter 搭配 LangFuse 進行追蹤,透過觀察 agent 的 reasoning traces 和 tool calls,揪出真正的問題所在,而不是盲目修改 system prompts。
OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼,人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness(鷹架與回饋迴圈),讓軟體工程師的工作從「寫程式」轉變為「設計環境」。
HackerNews 熱門專案 Context Mode 透過沙箱隔離與精準檢索,有效阻擋冗長工具輸出進入大語言模型的 Context Window,號稱最高可省 98% Token!
Anthropic 隨 Opus 4.6 推出了 Claude Code 的 Agent Teams 功能(又稱 Swarm Mode)。這篇文章實測了如何開啟、終端機支援度、與一般 Subagents 的差異,以及這套多代理系統的真實運作成本。
覺得 Claude Cowork 只是個好用的聊天機器人嗎?這篇統整了 400 次 Session 淬鍊出的 17 個設定秘訣。從單純的「詠唱」轉向「系統工程」,幫你建構專屬的 AI 神隊友。
大家都在追最強 Model,但真正決定 Agent 好不好用的其實是 Harness。本文拆解 Claude Code、Cursor、Manus、SWE-Agent 的共通架構。重點是:Progressive disclosure 才是 production 成敗分水嶺。
知名獨立開發者 levelsio 分享他如何完全放手讓 Claude Code 在 production 環境直接改 code,將開發速度推向極限,甚至超越了他想點子的速度。
一個只有兩人的精品律師事務所,靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究,全部用 Claude Skills 編碼十年執業經驗。這篇不是理論,是每天在用的 workflow — 而且結論是:通用 AI 打爆所有法律垂直 AI 產品。
Anthropic 砍了第三方 OAuth token,只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p(print mode)的所有用法:5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming,到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。