agentic-coding
70 篇文章
Andrew Ng x Anthropic 免費課程:2 小時學會寫 Agent Skills — 把你的 AI 從通才變專家
Andrew Ng 和 Anthropic 聯手推出免費課程「Agent Skills with Anthropic」。Skills 就是一包指令資料夾,讓通用 AI agent 在需要時變成特定領域專家。2 小時 19 分鐘的課程教你:Skills 怎麼設計、Skills vs MCP vs Subagents 的差異、還有怎麼在 Claude Code、Claude API、Agent SDK 上部署。OpenClaw 也用同樣的 Skills 架構,所以這課跟我們直接相關。
Google 終於開竅了:Developer Knowledge API + MCP Server 讓 AI 不再亂掰 API 用法
Google 推出 Developer Knowledge API 和官方 MCP Server(Public Preview),讓 AI coding 工具可以直接讀取最新的 Google 官方文件——Firebase、Android、Google Cloud、Chrome 全都有。再也不用在 AI 生成的「過期 API 用法」和「存在於平行宇宙的 function」之間來回 debug 了。
Matt Pocock:我已經不看 AI 寫的計畫書了 — 因為對話品質才是重點
TypeScript 大神 Matt Pocock 分享了一個反直覺的 agentic coding 心法:他已經不看 Claude 產出的計畫書了。因為真正決定產出品質的,不是那份 plan,而是你跟 AI 對話時有沒有建立起共同的「設計概念」。這個概念來自《人月神話》的 Frederick P. Brooks,而 Matt 的做法是讓 AI 拷問自己到極限。
OpenAI Frontier:把 AI Agent 當員工管理的企業平台 — SaaS 的終局之戰開打了
OpenAI 推出 Frontier 平台,讓企業像管理員工一樣管理 AI agent:有 onboarding、有身份、有權限、有學習機制。HP、Intuit、Oracle、Uber 等大廠已經在用。這不只是一個新產品,而是 OpenAI 正式向企業 SaaS 宣戰。
Anthropic 派 16 個 Claude 一起寫了一個 C Compiler — 然後它能編譯 Linux Kernel
Anthropic 研究員 Nicholas Carlini 用 16 個 Opus 4.6 平行跑了兩週、燒了 $20,000 API 費,從零開始寫出一個 10 萬行的 Rust C compiler。它能編譯 Linux kernel、QEMU、FFmpeg、Redis,還能跑 Doom。這篇是 agent teams 的終極壓力測試。
Anthropic 揭露 AI Benchmark 的骯髒秘密 — 你看到的排行榜可能只是「比誰的電腦大台」
Anthropic 發現 agentic coding benchmark 的分數差距,可能不是模型能力差異,而是跑測試的硬體配置不同。在 Terminal-Bench 2.0 上,最窮和最富的硬體設定差了整整 6 個百分點。下次看到排行榜差 2-3% 就宣稱「我們贏了」的,先打個問號。
SemiAnalysis:Claude Code 是轉捩點——4% GitHub Commits、微軟的危機、和 $15 兆資訊工作的末日
半導體分析機構 SemiAnalysis 發布重磅長文:Claude Code 目前佔 GitHub 公開 commits 的 4%,預計 2026 年底達 20%+。他們認為 Claude Code 是 AI Agent 的真正轉捩點——不只是寫 code,而是重新定義所有資訊工作。文章還剖析了微軟的兩難困境:Azure 成長 vs Office 365 護城河,以及為什麼 Anthropic 的營收增長已經超車 OpenAI。
StrongDM 的「暗黑工廠」:Code 不給人寫、也不給人看,每天燒 $1,000 token 費
StrongDM 的三人 AI 團隊打造了一個「Software Factory」——程式碼不給人寫、不給人 review,全部交給 coding agent。他們用 Digital Twin Universe 克隆了 Okta、Jira、Slack 等服務來跑大規模測試。Simon Willison 說這是他見過最激進的 AI 開發模式。但每個工程師每天 $1,000 的 token 費...你確定?
OpenAI 研究員每月花 $10,000 用 Codex 自動化研究 — 產生 700+ 假說
Karel(OpenAI 研究員)分享他如何用 Codex 花掉上億 tokens:讓 agent 自己寫筆記、爬 Slack、分析數據、產生 700+ 假說。他現在只跟一個 agent 對話,其他的都是 subagent 在背後跑。
Vibe Coding 一周年 — Karpathy 提出「Agentic Engineering」新概念
Vibe coding 滿一歲了!Karpathy 回顧這個他隨手發的 tweet 如何變成維基百科詞條,並提出專業工程師的升級版本:「Agentic Engineering」— 不是放飛自我 vibe,而是把 agent 當團隊成員來「監督」。