ai
35 篇文章
OneContext:讓 Coding Agent 學會「記住」的 Git 式記憶系統(ACL 2025)
Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。
2026 年 2 月 7 日速報:奇點已經在管自己的人頭了(附贈會飛的豬)
Dr. Alex Wissner-Gross 的每日科技速報:AI agent 在中國當全職員工、OpenAI 禁止人類直接寫 code、Claude Opus 4.6 屠榜、兔腦冷凍成功、全球晶片銷售破 1 兆美元、SpaceX 要拆月球蓋資料中心——然後一隻豬飛起來了
AI 便宜到不要錢的時候,什麼東西反而更值錢?12 個 Endgame 位置
Michael Bloch 提出一個思想實驗:當 AI 智慧便宜到幾乎免費,什麼資產反而會更值錢?他列出 12 個 endgame 位置:能源、原子、資本、監管許可、信任、專有數據、人類注意力、網路效應、營運優勢、安全、物理空間、智慧本身
OpenAI 內部大公開:我們如何轉型到 Agent-First 開發(來自共同創辦人的內部備忘錄)
OpenAI 共同創辦人 Greg Brockman 發文公開 OpenAI 內部如何轉型到 agentic software development。3 月底前目標:agent 成為所有技術任務的 first resort。內含六大建議,包含「Say no to slop」的程式碼品質觀點。
AI 寫 code 越快,你的腦袋越重要:Cursor 設計主管的清醒宣言
Cursor 設計主管 Ryo Lu 說:AI coding 製造了一種新陷阱 —「沒有結構的速度幻覺」。想得不清楚的人,只是用 AI 把垃圾量產而已。
Cursor 吹牛翻車記 — 號稱 AI 寫出瀏覽器,結果只是東拼西湊
Cursor CEO 宣稱用 GPT-5.2 從零寫出瀏覽器,結果被抓包只是把別人的 open source 拼起來
北京大學:AI agent 竟然遵守物理定律?!
北大物理系發現 LLM agent 的生成過程遵守「detailed balance」物理定律,這不是 bug,是 feature
Vercel 的 AI 客服達成 87.6% 自主解決率 — CEO 說接下來要衝 100%
Vercel CEO Guillermo Rauch 分享他們的 AI 客服系統達成史上最高的 87.6% 自主解決率,而且客戶超愛
Simon Willison 警告:AI Agent 的致命三連擊正在發生
私密資料 × 不可信內容 × 對外通訊 = 完美的資安災難,而且已經在各大平台發生了
Vercel 推出 Skills.sh — AI Agent 的技能商店開張了
終於有人幫 AI Agent 做了個「技能包管理系統」,讓 agent 不再是無頭蒼蠅亂飛
Google 工程師的震撼告白:Claude Code 一小時重現我們一年的心血
Google Gemini 團隊主管工程師 Jaana Dogan 發文坦承,Claude Code 用一小時複製了她團隊花一年開發的分散式系統
Karpathy 的 2025 LLM 年度回顧 — RLVR 時代來臨
從 RLVR 到 Vibe Coding,Karpathy 盤點 2025 年 LLM 六大關鍵進展
Karpathy:我的寫 code 方式在幾週內完全翻轉了
從 80% 手動寫 code 變成 80% 用 AI agent,Karpathy 說這是他 20 年程式生涯最大的改變
Simon Willison:我 25 年的開發直覺已經失效了
當你本能地想「這功能不錯但不值得花時間做」,然後還是丟給 Claude Code 試試看 — 因為你過去 25 年累積的直覺已經跟不上現實了
swyx:你以為 AI agent 只是 LLM + tools?太天真了
最簡化的 agent 定義(LLM + tools + loop)其實會讓你忘記真正重要的東西:planning、memory、trust、evals