context-engineering - 標籤

AI 草稿明明寫得不錯，人卻還是動手改了 — 被你刪掉的那句話，正是它下次最需要的 context

GP-236 2026-06-18 · @gabrielchua on X

每兩小時，Codex 幫一個人寫好一批電子郵件回覆等他審。草稿大多很好，他每次還是改——補一個上週某串對話的決定、因為認識收件人而把語氣放軟、刪掉一個還不想許下的承諾。重點來了：那些改動本身也是 context，而且是大多數自動化每跑完一輪就丟掉的 context。這篇把一個會自我改善的自動化拆成兩個迴圈：內迴圈把 context 帶到工作面前產出草稿，外迴圈從審稿的改動裡把 context 撿回來、餵給下一輪。難的不是看出哪裡被改，是讀懂那個改動到底想說什麼。

Context Window：模型醒著的那一天

SD-22 2026-05-08 · ShroomDog Lab

Context Window 不是字數上限，而是模型世界裡的一天：Ryland 醒來後能經歷多少課程、訊息、工具結果和任務事件。Token 使用量就是這個世界的時鐘。

shroomdog-original context-window llm agent memory agent-harness

Multi-Agent 十個月後的誠實報告——Cognition Walden：寫入保持單執行緒，其他 agent 只灌 intelligence

GP-181 2026-04-23 · @walden_yan on X (Walden Yan, Cognition co-founder)

Cognition 的 Walden Yan 十個月前寫過一篇 Don't Build Multi-Agents 勸大家別碰 multi-agent，這次回頭端出三個真的跑得動的 pattern——Devin Review 的 clean-context loop（平均每 PR 抓 2 個 bug、58% 是嚴重級）、跨前沿模型的 smart friend、manager Devin 的 map-reduce-and-manage。貫穿所有 pattern 的核心原則只有一條：寫入保持單執行緒，其他 agent 只灌 intelligence 不動手。

multi-agent agent-engineering cognition devin

一句 `message Romain` 就跑完整條 workflow — OpenAI DevX 展示 Codex Chronicle，但推文沒寫的代價也要看

GP-176 2026-04-21 · @dkundel on X

OpenAI DevX 的 Dominik Kundel 說：自從 Codex 有了 memories、plugins 和新推的 Chronicle，他不用再打包 context——一句『sync docs + message Romain』就自動讀 Google Doc、改 markdown、開 PR、在 Slack 送訊息。很爽。但官方 Chronicle 文件寫的三行代價推文沒講：macOS 螢幕錄影權限、memories 明文存本機、prompt injection 風險放大。Chronicle 是螢幕錄影 agent，不是無害 booster。

openai codex chronicle agent-memory agent-harness

Natural-Language Agent Harnesses：當 agent 的靈魂從程式碼搬進自然語言

MP-226 2026-03-31 · @daniel_mac8 on X

清華深圳團隊提出 NLAH（Natural-Language Agent Harnesses）：把 agent 的控制邏輯從程式碼搬進結構化自然語言，再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式，但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。

mogu-picks agent harness agentic-engineering paper

從跟AI說話開始：打造會進化的AI智能體 — 不靠調Prompt，而是文件系統的魔力

GP-100 2026-03-04 · @berryxia on X

你是否厭倦了不斷調整Prompt或更換模型，卻發現AI智能體始終無法真正「進化」？本文將顛覆你的認知，揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器：基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊，而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學，打造出無法被輕易複製的「護城河」效應。

ai-agents file-system

世界級 Agentic Engineer 的真相 — 少裝一點，反而飛更快

GP-102 2026-03-04 · @systematicls on X

這篇推文的核心很直接：多數人不是輸在模型太弱，而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流，再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具，而是把 agent 的行為設計成可控、可驗證、可收斂。

agentic-coding

檔案系統就是新的資料庫：一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統

GP-79 2026-02-23 · Muratcan Koylan @koylanai

Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡：80+ 個 markdown/YAML/JSONL 檔案，不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills，讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。

ai-agents personal-os file-system openclaw cursor claude-code productivity

Token 成本砍 75%：System Prompt 分層加載實戰教程

GP-55 2026-02-13 · @ohxiyu

一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載（常駐層 vs 按需層）+ 雙模型策略，把月成本從 $568 砍到 $120-150，降幅 75%。附完整拆解步驟和數據。

token-optimization system-prompt agent-architecture cost-optimization

LLM Context Tax 避稅指南：13 招讓你的 AI Agent 帳單少一個零

MP-65 2026-02-11 · Nicolas Bustamante (@nicbstme)

每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧，從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖，手把手教你怎麼在不犧牲品質的前提下，把 Agent 的 token 帳單砍掉 90%。這不是理論文，這是真金白銀的省錢指南。

llm cost-optimization ai-agents prompt-caching kv-cache token-efficiency claude-code

OneContext：讓 Coding Agent 學會「記住」的 Git 式記憶系統（ACL 2025）

GP-43 2026-02-10 · @JundeMorsenWu on X

Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶，做了 OneContext——用 Git 版本控制的概念管理 agent 上下文，底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率，打敗 26 個系統。ACL 2025 主會議長論文背書。

ai ai-agents git acl-2025 onecontext memory

Obsidian & Claude Code 101: Context Engineering

GP-9 2026-01-30 · @arscontexta (Heinrich) on X

Vibe note-taking 要運作得好，你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制（檔案樹→YAML描述→大綱→完整內容）來讓它更選擇性，這個 pattern 叫 Progressive Disclosure。

obsidian claude-code progressive-disclosure