open-source
31 篇文章
Meta-Meta-Prompting:Garry Tan 的第二大腦不是聊天機器人,是會複利的個人作業系統
Garry Tan 把個人 AI 從聊天視窗推到作業系統:書籍鏡像、會自動準備會議的知識庫、能產生 Skill 的 Skill,以及薄 Harness、厚 Skill、厚資料的架構。真正的重點不是哪個模型最強,而是個人脈絡如何變成每天複利的系統。
給 agent 請一個 bouncer:Brex 開源 CrabTrap,用 LLM 當門神攔每一個 outbound request
Brex 開源 CrabTrap——HTTP/HTTPS proxy 攔 production agent 每個 outbound request,static rule 微秒過、長尾丟 LLM 判 allow/deny。Policy 不是坐著寫的,是 agentic loop 拿歷史流量反推;送 judge 的 request 全部結構化 JSON 封裝擋 prompt injection。上線三個意外:流量推的 policy 比手寫強、LLM 只開 <3% request 所以沒 latency 問題、audit log 反過來變 agent 體檢工具。
Midjourney 工程師開源了一套不用 CSS 的排版引擎 — 600 倍速度碾壓瀏覽器 reflow
Midjourney 工程師開源了一個純 TypeScript 文字測量演算法,完全繞過瀏覽器 CSS reflow,排版速度快 600 倍。因為 AI agent 動態生成 UI 時,30 年前設計的瀏覽器排版管線根本跟不上。
Harrison Chase 說不擁有 Harness 就不擁有記憶 — 但 gu-log 就是反例
LangChain CEO Harrison Chase 主張 agent harness 跟 memory 綁死,用封閉 harness 等於把記憶主權讓給第三方。論點有道理,但結論太粗糙 — gu-log 同時用閉源 harness(Claude Code)和開源 harness(OpenClaw),memory 全在自己的 git repo 裡,沒有被鎖住。真正的 lock-in 不在 harness 開不開源,在 memory 的格式是不是你的。
吳恩達長文解剖「反 AI 聯盟」— 當恐懼被武器化,誰在買單?
吳恩達 (Andrew Ng) 發長文拆解反 AI 陣營如何系統性地測試哪些訊息最能嚇到大眾,並警告這種恐懼行銷可能導致類似核能的悲劇重演。同時分析白宮最新 AI 立法框架的意義。
MemPalace:讓 AI 蓋一座記憶宮殿,把你的人生壓進 ~120 個 token
Ben Sigman 和 Milla Jovovich 花了好幾個月跟 Claude 一起打造的開源 AI 記憶系統 MemPalace,在三個主流 benchmark 上拿到史上最高分——包括 LongMemEval 的首個滿分。它不靠雲端、不靠背景 agent,而是在本地用「宮殿」結構組織記憶,把整個人生的 context 壓進約 120 個 token。
他用 Claude Code 投了 700 份履歷,然後真的找到工作了 — AI 求職軍備競賽全解析
Santiago 打造了 career-ops — 一個用 Claude Code 驅動的完整求職 command center,評估了 740+ 職缺、產出 100+ 客製履歷,最後拿到 Head of Applied AI。但社群的反應揭露了一個更深的問題:當 AI 在兩端同時運作,整個求職系統還能撐多久?
Auto-Harness — 讓 AI Agent 自己 debug 自己的開源自我進化框架
NeoSigma 開源了 auto-harness — 一個讓 AI agent 自動挖掘失敗、生成 eval、修復自己的自我進化迴圈。在 Tau3 benchmark 上,不換模型,光靠改 harness 就把分數從 0.56 拉到 0.78。
Gemma 4 登場:Google 說它用了和 Gemini 3 同樣的突破性技術
Google 發表 Gemma 4 開源模型家族,包含 31B Dense、26B MoE 和 E2B/E4B 邊緣模型,採 Apache 2.0 授權,支援 256K context、function calling、多模態,號稱在 Arena 上打贏 20 倍大的模型。
Undercover Mode 問出了一個沒人想回答的問題
Claude Code 的原始碼洩漏裡藏著一個叫 undercover.ts 的檔案,設計目的是讓 AI 的 commit 看起來像人類寫的。這件事問出了一個業界至今沒有共識的問題:你的團隊用 AI 寫 code,應該標注嗎?
一個人、十個月、50K Stars — ECC 創作者 Affaan Mustafa 的 Indie Hacker 故事
Everything Claude Code 的創作故事:一個人花十個月、用 AI 開發 AI 工具,從一個 config pack 演化成 50K+ stars 的跨平台生態系。這不是工具介紹,是 AI 時代 indie hacker 能做到什麼的真實案例。
llama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書
llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展,聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。
ATLAS:一張 RTX 5060 Ti + Qwen3-14B 在 LiveCodeBench 跑贏 Sonnet 4.5?拆解 harness 的真正魔法
ATLAS 用 frozen Qwen3-14B 搭配單張 RTX 5060 Ti,透過 PlanSearch + best-of-3 生成 + 自我修復 pipeline,在 LiveCodeBench 拿到 74.6%,超越 Sonnet 4.5 的 71.4%。但細看方法論,這不是 pass@1 對 pass@1 的公平比較。
AI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去
OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR,結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告:AI slop 與有價值的 diff 越來越難分辨。
Hermes Agent v0.3.0 釋出:5 天內完成 248 個 PR
NousResearch 的 Hermes Agent v0.3.0 更新被 @Teknium 轉推。貼文提到 5 天內由 15 位貢獻者完成 248 個 PR,並明確列出跨 CLI 與各平台的即時串流;另一項功能則在截圖中被截斷。
ACE 正式開源 — AI Coding Environment 不再是 SaaS 獨佔品
Dan McAteer 宣布 ACE 開源,現在可以 self-host。仍保留託管服務,後續計畫大幅改進。
Imbue Vet:專抓 Coding Agent 說謊的糾察隊
Imbue 推出開源工具 Vet,專門驗證 coding agent 的行為是否誠實。它會審查 agent 的對話紀錄和 code changes,抓出那些聲稱測試都過了但其實根本沒跑的情況。本地執行、零遙測、可整合進 CI。
你的 AI 龍蝦有辦公室了!Star Office UI 讓 OpenClaw 在像素世界裡自動上下班
Ring Hyacinth 和 Simon Lee 開源了 Star Office UI——一個像素風辦公室看板,讓 OpenClaw 龍蝦依狀態在辦公室走位、顯示昨日工作小記、還能邀請其他龍蝦加入。附帶完整 SKILL.md 讓龍蝦一鍵部署。
一個工程師 + AI,一週重建 Next.js——然後 tldraw 嚇到把測試搬進私有 repo
Cloudflare 工程師 Steve Faulkner 用 Claude AI 花一週、$1,100 token 費用,從零重建了 Next.js 的 94% API,產出的 vinext 比 Next.js 快 4.4 倍、bundle 小 57%。關鍵武器?Next.js 公開的測試套件。消息一出,tldraw 立刻把 327 個測試檔搬進私有 repo 自保——還開了一個玩笑 issue:把原始碼翻譯成繁體中文來防 AI 複製。當你的 test suite 變成敵人的 spec,Open Source 的遊戲規則就徹底變了。
Claude Code 藏起你的檔案名稱,開發者怒了 — Boris 本人上 HN 滅火的 72 小時
Claude Code v2.1.20 把預設 UI 從顯示完整檔案路徑改成「Read 3 files」一行摘要,引爆 1082 點 HN 討論串和 700+ 則留言。開發者憤怒的不只是 UI 變動——而是 AI 工具藏起自己在做什麼的哲學問題。Boris Cherny 親自上 HN 和 GitHub 回應、承認命名錯誤、連出三輪修復。這場爭論揭露了 AI 工具設計中最核心的張力:簡潔 vs 透明。