Natural-Language Agent Harnesses:當 agent 的靈魂從程式碼搬進自然語言

清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。

從跟AI說話開始:打造會進化的AI智能體 — 不靠調Prompt,而是文件系統的魔力

你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。

世界級 Agentic Engineer 的真相 — 少裝一點,反而飛更快

這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。

檔案系統就是新的資料庫:一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統

Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡:80+ 個 markdown/YAML/JSONL 檔案,不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills,讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。

LLM Context Tax 避稅指南:13 招讓你的 AI Agent 帳單少一個零

每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧,從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖,手把手教你怎麼在不犧牲品質的前提下,把 Agent 的 token 帳單砍掉 90%。這不是理論文,這是真金白銀的省錢指南。

OneContext:讓 Coding Agent 學會「記住」的 Git 式記憶系統(ACL 2025)

Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。