context-engineering
11 篇文章
Context Window:模型醒著的那一天
Context Window 不是字數上限,而是模型世界裡的一天:Ryland 醒來後能經歷多少課程、訊息、工具結果和任務事件。Token 使用量就是這個世界的時鐘。
Multi-Agent 十個月後的誠實報告——Cognition Walden:寫入保持單執行緒,其他 agent 只灌 intelligence
Cognition 的 Walden Yan 十個月前寫過一篇 Don't Build Multi-Agents 勸大家別碰 multi-agent,這次回頭端出三個真的跑得動的 pattern——Devin Review 的 clean-context loop(平均每 PR 抓 2 個 bug、58% 是嚴重級)、跨前沿模型的 smart friend、manager Devin 的 map-reduce-and-manage。貫穿所有 pattern 的核心原則只有一條:寫入保持單執行緒,其他 agent 只灌 intelligence 不動手。
一句 `message Romain` 就跑完整條 workflow — OpenAI DevX 展示 Codex Chronicle,但推文沒寫的代價也要看
OpenAI DevX 的 Dominik Kundel 說:自從 Codex 有了 memories、plugins 和新推的 Chronicle,他不用再打包 context——一句『sync docs + message Romain』就自動讀 Google Doc、改 markdown、開 PR、在 Slack 送訊息。很爽。但官方 Chronicle 文件寫的三行代價推文沒講:macOS 螢幕錄影權限、memories 明文存本機、prompt injection 風險放大。Chronicle 是螢幕錄影 agent,不是無害 booster。
Natural-Language Agent Harnesses:當 agent 的靈魂從程式碼搬進自然語言
清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。
從跟AI說話開始:打造會進化的AI智能體 — 不靠調Prompt,而是文件系統的魔力
你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。
世界級 Agentic Engineer 的真相 — 少裝一點,反而飛更快
這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。
檔案系統就是新的資料庫:一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統
Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡:80+ 個 markdown/YAML/JSONL 檔案,不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills,讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。
Token 成本砍 75%:System Prompt 分層加載實戰教程
一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載(常駐層 vs 按需層)+ 雙模型策略,把月成本從 $568 砍到 $120-150,降幅 75%。附完整拆解步驟和數據。
LLM Context Tax 避稅指南:13 招讓你的 AI Agent 帳單少一個零
每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧,從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖,手把手教你怎麼在不犧牲品質的前提下,把 Agent 的 token 帳單砍掉 90%。這不是理論文,這是真金白銀的省錢指南。
OneContext:讓 Coding Agent 學會「記住」的 Git 式記憶系統(ACL 2025)
Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。
Obsidian & Claude Code 101: Context Engineering
Vibe note-taking 要運作得好,你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制(檔案樹→YAML描述→大綱→完整內容)來讓它更選擇性,這個 pattern 叫 Progressive Disclosure。