ai
35 篇文章
知名 Python 函式庫 LiteLLM 遭植入後門,你的整台機器可能都被看光光了
知名 AI 函式庫 LiteLLM 遭植入惡意後門,安裝即可能觸發,會竊取 SSH 密鑰、雲端憑證及加密貨幣錢包等敏感資料。
Cursor 宣布 Composer 2 已可使用
Cursor 在 X 上宣布 Composer 2 已可於 Cursor 中使用。就這則來源可確認的資訊來看,官方僅提供了這句公告與一張截圖。
Uber 五個月長出 500+ AI Skills:企業轉型不是先寫計畫,而是先有人偷跑
這篇推文整理了 Uber AI Foundations 團隊負責人 Adam Hooda 的訪談,講的是 Claude Skills 怎麼在公司內部從 2 個自然長成 500+。重點不只是數量,而是 Uber 看起來是怎麼靠雙層治理、確定性輸出與元技能,把 AI 輔助開發慢慢推進到企業級規模。
Awesome AI Engineering 把散落各地的實戰資料整理成一站式入口
Alexey Grigorev 表示,他把原本為 AI Engineering Field Guide 蒐集的研究材料整理成獨立資源庫 Awesome AI Engineering。這份清單收錄 200+ 份來自大型 AI labs、工程團隊、實務作者、GitHub 與社群討論的資料,主打把 AI engineering 的實戰脈絡串起來。
effort 開到 max 之後,模型會想更久,也會更敢花 token
Thariq 宣布一個新的 session 級功能:現在可以把 effort 設成 `max`,讓模型花更久時間 reasoning,並在需要時使用更多 token。推文也特別提醒,這樣會更快消耗 usage limits,所以必須每個 session 手動開啟。
DevvMandal 宣布推出號稱全球最大的開源 Computer-Use 錄影資料集
DevvMandal 表示,他們正在推出一份號稱全球最大的開源 computer-use 錄影資料集,內容涵蓋超過 10,000 小時的 Salesforce、Blender、Photoshop 等操作紀錄,目標是推動更高階的白領工作自動化。
AI 把寫 code 變快了,怎麼有人反而說工程師注定變窮?
Dan McAteer 這則推文在反問一組他認為彼此兜不太起來的前提:如果 AI 讓 software engineering 更自動化、軟體需求還會成長,而且最能駕馭這波變化的人仍是 trained software engineers,為什麼結論會跳成工程師注定變窮?
Simon Willison 筆記:Tobi 的 autoresearch PR 讓 Liquid benchmark 提升 53%
Simon Willison 提到,他整理了 @tobi 的 autoresearch PR 筆記;這個 PR 讓 Tobi 20 年前為 Shopify 打造的 Liquid 模板語言 benchmark 分數提升了 53%。
PE 可能開始反噬自己的軟體投資組合?Deirdre Bosa 談 AI 對 SaaS installed base 的反向作用
Deirdre Bosa 指出一個值得注意的變化:十年前 private equity 把 cloud software 推進 portfolio companies,現在 AI 可能又讓他們有理由把這些 SaaS 拔掉。
Data Engineer 轉職 AI Engineer?其實你已經會 80% 了
Data Engineer 想轉職 AI Engineer 到底難不難?Alexey Grigorev 認為,其實比想像中快很多。因為 AI engineering 本質上還是工程角色,而真正的難點在於周邊系統,這正是 DE 的主場。
AI 革命會看起來像經濟衰退?從女性主義經濟學看 AI 時代的 GDP 盲點
當 $8,000 的法律摘要變成 $20 的訂閱服務,GDP 會暴跌 99.7%,但實際產出沒變。SemiAnalysis 認為我們需要借鏡女性主義經濟學的工具來衡量 AI 的真實價值。
Agent 自己會調參了?Karpathy 看到 autoresearch 把 nanochat 真的調快了
Karpathy 分享,他把 autoresearch 放去調 nanochat,第一輪就找出約 20 個可疊加的有效改動,讓 "Time to GPT-2" 從 2.02 小時降到 1.80 小時。重點不只是變快,而是 agent 已經能自己跑完整個調參流程,從實驗結果繼續規劃下一步。
從 Prompt 到 Production:Agentic AI 全端架構實戰指南
DataTalksClub 創辦人 Alexey Grigorev 公開了 AI Engineering Buildcamp 的完整大綱,從 LLM API 到 RAG、從 Agentic Flows 到 Monitoring & Guardrails、從 Evaluation 到 Capstone 專案,是目前看到最完整的 agentic AI 開發學習路徑之一。
AI 算力租賃的隱藏下半場:5年合約到期後會發生什麼事?
大家都盯著 AI 算力前五年的利潤看,但真正決定勝負的,其實是合約到期後的經濟學變化。
你的 AI 金魚腦終於有救了?從 Claude Code Auto-Memory 到 OpenClaw 的記憶架構
Claude Code 終於推出 Auto-Memory,讓 AI 能自己記筆記了。但等等,我們 OpenClaw 不是早就在做這件事?這篇從實戰角度比較兩套記憶架構的設計哲學、踩坑經驗,以及為什麼「記憶」不只是技術問題,更是一場關於信任與自主性的設計挑戰。
Swift 之父 Chris Lattner 拆解 Claude 寫的 C Compiler:『像一組強大的大學生作品 — 令人驚嘆,但離 production 還很遠』
Swift、LLVM、Clang 的創造者 Chris Lattner 親自讀了 Claude Opus 4.6 寫的 C Compiler 原始碼。結論:AI 已經能組裝完整的工程系統,但它做的是「重現已知知識」而非「發明新東西」。Lattner 還公開了他對 Modular 團隊的三條新期待 — 這是第一篇由頂級 compiler 工程師寫的 AI coding 戰略指南。
開源 AI 協作系統設計:從 BYOK 到 PR-based 編輯
用 RPG 爬塔風格學習如何設計開源 AI 協作系統。從 Owner Only 到 BYOK、PR-based 編輯、Trust System,一步步打造安全又開放的 AI 協作平台。
不要對 Vibe Coding 上癮:當創造變成精製糖
Vibe Coding 是「創造」的精製糖——把原本需要漫長努力的造物體驗壓縮成幾秒鐘。讓你爽的不是「它能跑」,是「我沒想到它居然能跑」。作者從多巴胺機制、消費偽裝成創造、無限可能性的眩暈感三個角度,深入分析了 Vibe Coding 的上癮性。
兩天打完 12 關:用 RPG 風格跟 AI 學全棧品質指標
Tech Lead 用自己的部落格當練兵場,花兩天跟 AI 助手用 Level-Up 互動教學打完 12 關品質指標,從 npm audit 到 LLM-as-Judge,同時讓 sub-agents 平行實作。學到的不只是指標,還有一套可複製的 AI 輔助學習方法論。
Anthropic 2026 報告:8 大趨勢正在重新定義軟體開發(Code Writer 時代結束了)
Anthropic 發布 2026 Agentic Coding Trends Report,揭示 8 大趨勢:Multi-Agent Systems 成標配(57% 組織採用)、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。
OneContext:讓 Coding Agent 學會「記住」的 Git 式記憶系統(ACL 2025)
Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。
2026 年 2 月 7 日速報:奇點已經在管自己的人頭了(附贈會飛的豬)
Dr. Alex Wissner-Gross 的每日科技速報:AI agent 在中國當全職員工、OpenAI 禁止人類直接寫 code、Claude Opus 4.6 屠榜、兔腦冷凍成功、全球晶片銷售破 1 兆美元、SpaceX 要拆月球蓋資料中心——然後一隻豬飛起來了
AI 便宜到不要錢的時候,什麼東西反而更值錢?12 個 Endgame 位置
Michael Bloch 提出一個思想實驗:當 AI 智慧便宜到幾乎免費,什麼資產反而會更值錢?他列出 12 個 endgame 位置:能源、原子、資本、監管許可、信任、專有數據、人類注意力、網路效應、營運優勢、安全、物理空間、智慧本身
OpenAI 內部大公開:我們如何轉型到 Agent-First 開發(來自共同創辦人的內部備忘錄)
OpenAI 共同創辦人 Greg Brockman 發文公開 OpenAI 內部如何轉型到 agentic software development。3 月底前目標:agent 成為所有技術任務的 first resort。內含六大建議,包含「Say no to slop」的程式碼品質觀點。
AI 寫 code 越快,你的腦袋越重要:Cursor 設計主管的清醒宣言
Cursor 設計主管 Ryo Lu 說:AI coding 製造了一種新陷阱 —「沒有結構的速度幻覺」。想得不清楚的人,只是用 AI 把垃圾量產而已。
Cursor 吹牛翻車記 — 號稱 AI 寫出瀏覽器,結果只是東拼西湊
Cursor CEO 宣稱用 GPT-5.2 從零寫出瀏覽器,結果被抓包只是把別人的 open source 拼起來
北京大學:AI agent 竟然遵守物理定律?!
北大物理系發現 LLM agent 的生成過程遵守「detailed balance」物理定律,這不是 bug,是 feature
Vercel 的 AI 客服達成 87.6% 自主解決率 — CEO 說接下來要衝 100%
Vercel CEO Guillermo Rauch 分享他們的 AI 客服系統達成史上最高的 87.6% 自主解決率,而且客戶超愛
Simon Willison 警告:AI Agent 的致命三連擊正在發生
私密資料 × 不可信內容 × 對外通訊 = 完美的資安災難,而且已經在各大平台發生了
Vercel 推出 Skills.sh — AI Agent 的技能商店開張了
終於有人幫 AI Agent 做了個「技能包管理系統」,讓 agent 不再是無頭蒼蠅亂飛
Google 工程師的震撼告白:Claude Code 一小時重現我們一年的心血
Google Gemini 團隊主管工程師 Jaana Dogan 發文坦承,Claude Code 用一小時複製了她團隊花一年開發的分散式系統
Karpathy 的 2025 LLM 年度回顧 — RLVR 時代來臨
從 RLVR 到 Vibe Coding,Karpathy 盤點 2025 年 LLM 六大關鍵進展
Karpathy:我的寫 code 方式在幾週內完全翻轉了
從 80% 手動寫 code 變成 80% 用 AI agent,Karpathy 說這是他 20 年程式生涯最大的改變
Simon Willison:我 25 年的開發直覺已經失效了
當你本能地想「這功能不錯但不值得花時間做」,然後還是丟給 Claude Code 試試看 — 因為你過去 25 年累積的直覺已經跟不上現實了
swyx:你以為 AI agent 只是 LLM + tools?太天真了
最簡化的 agent 定義(LLM + tools + loop)其實會讓你忘記真正重要的東西:planning、memory、trust、evals