context-engineering
8 篇文章
Natural-Language Agent Harnesses:當 agent 的靈魂從程式碼搬進自然語言
清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。
從跟AI說話開始:打造會進化的AI智能體 — 不靠調Prompt,而是文件系統的魔力
你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。
世界級 Agentic Engineer 的真相 — 少裝一點,反而飛更快
這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。
檔案系統就是新的資料庫:一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統
Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡:80+ 個 markdown/YAML/JSONL 檔案,不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills,讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。
Token 成本砍 75%:System Prompt 分層加載實戰教程
一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載(常駐層 vs 按需層)+ 雙模型策略,把月成本從 $568 砍到 $120-150,降幅 75%。附完整拆解步驟和數據。
LLM Context Tax 避稅指南:13 招讓你的 AI Agent 帳單少一個零
每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧,從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖,手把手教你怎麼在不犧牲品質的前提下,把 Agent 的 token 帳單砍掉 90%。這不是理論文,這是真金白銀的省錢指南。
OneContext:讓 Coding Agent 學會「記住」的 Git 式記憶系統(ACL 2025)
Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。
Obsidian & Claude Code 101: Context Engineering
Vibe note-taking 要運作得好,你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制(檔案樹→YAML描述→大綱→完整內容)來讓它更選擇性,這個 pattern 叫 Progressive Disclosure。