ai-agents
130 篇文章
從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini
OpenClaw 的 ACP(Agent Client Protocol)讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent,還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。(2026-03-09 更新:Telegram topic binding、persistent bindings、ACP Provenance 等新功能)
叫 AI 自己按按看:Simon Willison 的 Agentic Manual Testing,填補自動化測試抓不到的盲區
Simon Willison 提出 Agentic Manual Testing 概念:讓 AI agent 像人類一樣手動操作程式碼和 UI,抓出自動化測試遺漏的 bug。搭配 Playwright、Rodney、Showboat 等工具,把「測試通過但其實壞了」的窘境變成歷史。
OpenClaw 系統提示詞的 9 層架構大解密
深入拆解 OpenClaw Agent (v2.1) 傳送給 LLM 的 System Prompt 九層架構,從框架核心到使用者自訂的 Hook 系統,一次看懂!
你敢把人生交給 AI 管嗎?一個非工程師的 OpenClaw 生存指南
你的 PM 朋友問你「OpenClaw 是什麼?」——這篇就是你轉給他的那篇。從 ChatGPT 到 AI Agent 的信任光譜、真實的爆炸故事、三種不同的玩法。不需要會寫 code,但需要想清楚一件事:你願意信任 AI 到什麼程度?
寫 Code 的 AI 跨界解數學題?Cursor 自主運作四天提出超越人類的證明解法
Cursor 團隊表示,他們用來寫 code 的多 Agent 架構,自主跑了四天後,居然在大學級別的數學難題上給出了比人類官方解答更強的證明解法!
從「執行」到「驗證」:AI 時代工程師的全新心智模式
自從 Opus 4.6 發布後,開發者的角色正經歷根本性的典範轉移。我們不再是親自下指令的「執行者」,而是轉變為給予高階方向與審查結果的「驗證者」。
從跟AI說話開始:打造會進化的AI智能體 — 不靠調Prompt,而是文件系統的魔力
你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。
AI 代理的練功秘笈?Hamel Husain 推出 Evals 技能包,讓你的 Agent 更懂評估!
Hamel Husain 發表 evals-skills,一套專為 AI 產品評估設計的技能工具。它旨在解決 AI 代理在複雜任務中遇到的評估盲點,尤其是對抗常見錯誤和處理細微的幻覺類型,讓代理人能更有效利用評估平台。
Agent Observability:別再盲目微調,用 OpenRouter + LangFuse 看清 AI 的思考軌跡
開發 AI agent 最大的盲點就是「在黑暗中微調」。Daniel 建議使用 OpenRouter 搭配 LangFuse 進行追蹤,透過觀察 agent 的 reasoning traces 和 tool calls,揪出真正的問題所在,而不是盲目修改 system prompts。
Agent Harness 工程:OpenAI 如何用 Codex 達成零手寫百萬行程式碼
OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼,人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness(鷹架與回饋迴圈),讓軟體工程師的工作從「寫程式」轉變為「設計環境」。
管理 $1,800 億的傳奇投資人讓 Claude 幫他寫備忘錄 — 三個月前他問「這是泡沫嗎?」,現在他說「被低估了」
Oaktree Capital 共同創辦人 Howard Marks 三個月前寫了一份備忘錄問「AI 是不是泡沫?」。2026 年 2 月 26 日,他發了後續備忘錄「The Rapid Advancement of AI」——這次他讓 Claude 幫他寫了一萬字的 AI 教學,然後被 Claude 的回答震撼到。Marks 把 AI 分成三個等級,認為我們正進入 Level 3(自主 Agent),代表的不是 $500 億的工具市場,而是數兆美元的勞動力替代。他的投資建議:不要 all-in,也不要完全不碰——因為這不是普通的科技革命。
AI 開發的第三紀元:你還在狂按 Tab 嗎?Karpathy 教你最佳化 AI 工作流
Karpathy 分享了 Cursor 的數據圖表,揭示了 AI 輔助開發從 Tab 補全到 Agent 代理的演進。太保守會錯失槓桿效應,太激進則會放大混亂。他建議開發者應該用 80/20 法則來平衡效率與探索新工具。
Agent Harness 才是真正的產品:為什麼大廠的 Agent 架構都長得一樣?
大家都在追最強 Model,但真正決定 Agent 好不好用的其實是 Harness。本文拆解 Claude Code、Cursor、Manus、SWE-Agent 的共通架構。重點是:Progressive disclosure 才是 production 成敗分水嶺。
AI 生的 Code 看不懂?讓 Agent 幫你做動畫解釋 — Simon Willison 的 Interactive Explanations
Simon Willison Agentic Engineering Patterns 第五章:Interactive Explanations。核心主張:與其硬啃 AI 生成的 code,不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。
Cursor CEO 說出口了:軟體開發第三紀元來臨 — Tab 時代結束、Agent 時代也快了,接下來是「工廠模式」
Cursor CEO Michael Truell 用三組數據宣告軟體開發的第三紀元:Agent 用量一年暴增 15 倍、Tab:Agent 使用者比翻轉為 1:2、Cursor 內部 35% 的 PR 來自雲端 AI Agent 自主完成。開發者的角色正在從「寫 code」變成「設計工廠」(╯°□°)╯
你會的東西都是武器 — Simon Willison 的「囤積式開發」哲學
Simon Willison Agentic Engineering Patterns 第四章:Hoard Things You Know How to Do。核心主張:你解決過的問題都該留下 working code,因為 coding agent 能把你的舊 code 當成食材,重新組合出你從沒想過的新料理。
Programming 變得面目全非:Karpathy 說 2025 年 12 月是分水嶺
Karpathy 說 coding agents 在 2025 年 12 月突然 work 了——不是漸進式進步,是斷裂式轉變。他花 30 分鐘用一句英文建好 DGX Spark 視訊分析 dashboard,三個月前那是整個週末的工作量。Programming 正在變得面目全非:你不再打字寫 code,你在用英文指揮 AI agents。最高 leverage = agentic engineering。
AI 寫的 Code 看不懂?Linear Walkthrough 讓你的 Vibe Code 變成學習教材
Simon Willison Agentic Engineering Patterns 第三章:Linear Walkthrough 模式。用這個技巧,即使是 vibe-coded 的玩具專案也能變成有價值的學習資料。核心技巧:叫 agent 用 sed/grep/cat 自己抓 code 片段,防止幻覺。
Karpathy:CLI 是 Agent 的母語 — 「Legacy」技術反而成了最強入口
Karpathy 直言 CLI 是 AI Agent 最自然的操作介面——因為它是「legacy」技術,Agent 天生就會用。以 Polymarket CLI 為例,Claude 花 3 分鐘就用 terminal 建出即時預測市場 dashboard。他呼籲:2026 年了,所有產品都該思考——Agent 能用你的東西嗎?CLI、MCP、markdown docs,Build. For. Agents.
The Atlantic 宣告:後聊天機器人時代來了 — 美國人還在用 ChatGPT 聊天,矽谷已經讓 AI Agent 一次跑五個任務了
The Atlantic 長文指出美國人正活在「平行 AI 宇宙」裡——大眾還以為 AI 就是 ChatGPT 聊天,但 tech 圈已經被 Claude Code 和 Codex 等 agentic tool 徹底改變。文章引用 Microsoft CEO 預測 95% 代碼將由 AI 寫、Anthropic 自家 90% 代碼已是 AI 產出,以及一位創辦人的警告:『tech 圈過去一年的經歷,即將發生在所有人身上。』