agent
16 篇文章
讓 Agent 做夢:把重複工作煉成 Skill 的每週保養
Vaibhav Srivastav 的 Codex prompt 真正有趣的不是 prompt 本身,而是它把 agent 的工作後整理講清楚了:回顧最近工作、找重複流程、只把高信心項目封裝成 Skill、自動化或子代理。這很像讓 agent 睡覺做夢,把忙碌變成能力。
Codex Goals 官方指南:Agent 不是繼續做,是拿證據收工
OpenAI 官方指南把 Codex Goals 講成對話串範圍內的完成契約:目標會持續存在,但完成必須靠測試、基準測試、報告或研究證據判定。這篇補上 SP-192、SP-197、SP-207 缺的官方規格角度。
Codex 目標模式不是魔法:迴圈要有終點、測試和記憶
Codex 的 /goal 不是把任務丟進去就會自動變好的許願池。Chris Hayduk 的重點很工程化:給 Agent 可量測的終點、夠快的測試迴圈,再用 Markdown 檔案當長期工作記憶。
不用重造 AI agent 的輪子:學會跟 AI 隊友打團,叫它不要送頭
LLM 不是神,也不只是工具,比較像 DOTA 裡會補刀也會送頭的隊友。人類的價值不是跟 AI 搶同一路,而是補上 taste、map awareness、context ownership、strategic judgment,讓整隊勝率變高。
HTML 不是比較漂亮的 Markdown,而是讓人重新回到 Agent 迴圈
Thariq 分享為什麼在 Claude Code 工作流裡,HTML 逐漸取代 Markdown:重點不是輸出變漂亮,而是當 Agent 產出的規格、審查、研究與原型越來越複雜,HTML 能把文字牆變成可閱讀、可操作、可分享的產物,讓人類重新回到決策迴圈。
Context Window:模型醒著的那一天
Context Window 不是字數上限,而是模型世界裡的一天:Ryland 醒來後能經歷多少課程、訊息、工具結果和任務事件。Token 使用量就是這個世界的時鐘。
Codex Goals 解剖:長跑型 Agent 不能只靠 Ralph 迴圈
Jarrod Watts 拆開 Codex Goals 後發現,它解決的是 Agent 太早停下來,不是長跑任務一路跑偏。真正撐起長跑工作流的,不是更長的 Ralph 迴圈,而是事前釐清、多 Agent 審查,以及寫在 context 外面的交接記憶。
Claude 也要睡覺了:Dreams 怎麼整理 Agent 的記憶垃圾山
Anthropic 的 Claude Dreams 不是單純摘要工具,而是替 Agent 記憶做離線整理的第二個迴圈。它把舊記憶與最多 100 段過往會話重新消化,產生可審核、可替換、可丟棄的新記憶庫。
OpenClaw 自動化全景:Task Flow 是多步驟工作的編排層
OpenClaw 的自動化文件把排程、背景任務、Heartbeat、Hooks、Standing Orders、Task Flow 等機制放在同一張地圖上;其中 Task Flow 負責處理多步驟流程的狀態、同步與版本追蹤。這篇用保守讀法拆它們各自適合的邊界。
Claude Code 原始碼外洩 — npm 上的 source map 洩漏了它可能的下一步
Anthropic 不小心把 Claude Code CLI 的完整 TypeScript 原始碼打包進 npm 的 source map。裡面藏了自主 agent、model 代號、消失的權限提示、還有一個電子雞系統。
Natural-Language Agent Harnesses:當 agent 的靈魂從程式碼搬進自然語言
清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。
Artificial Analysis 推出 AA-AgentPerf:AI 硬體 benchmark 終於進入 agent 時代
Artificial Analysis 發布 AA-AgentPerf,一個專門衡量 AI 加速器硬體在真實 agent 工作負載下表現的 benchmark。用真實 coding agent 軌跡測試,允許 production 級優化,支援從單張卡到整個 rack 的評測。
Claude Code Channels:Anthropic 用一個更新幹掉了買 Mac Mini 的理由
Anthropic 推出 Claude Code Channels,原生支援 Telegram 和 Discord 雙向通訊,讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。
Claude 會用你的電腦了!但真正的護城河依然是「深度」
Claude Computer Use 引發熱烈討論,不少人認為 AI 即將完全取代人類工作。然而原作者指出,AI 雖然能代勞技術操作,卻無法取代人類的判斷力與對文化脈絡的理解。真正的護城河,依舊是對領域知識的深度掌握。
Agent 不再失憶!Andrew Ng 新課教你打造跨 Session 記憶系統
Andrew Ng 與 Oracle 合作推出新課程,教你如何為 AI Agent 建立跨 Session 的持久記憶系統,解決單次對話後就『失憶』的痛點。
吳恩達新課:A2A (Agent2Agent Protocol) 成為 Agent 互通的業界標準
吳恩達宣布推出關於 A2A (Agent2Agent Protocol) 的新課程。A2A 整合了 IBM 的 ACP,成為不同框架 Agent 之間溝通與協作的業界標準,讓你輕鬆串接 Google ADK 與 LangGraph!