local-ai
4 篇文章
MemPalace:讓 AI 蓋一座記憶宮殿,把你的人生壓進 ~120 個 token
Ben Sigman 和 Milla Jovovich 花了好幾個月跟 Claude 一起打造的開源 AI 記憶系統 MemPalace,在三個主流 benchmark 上拿到史上最高分——包括 LongMemEval 的首個滿分。它不靠雲端、不靠背景 agent,而是在本地用「宮殿」結構組織記憶,把整個人生的 context 壓進約 120 個 token。
llama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書
llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展,聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。
一兆參數模型跑在 MacBook 上?SSD 串流推理的狂野實驗
Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢:把 expert weights 從 SSD 串流進來,不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。
Hermes 完成「換腦手術」:本地 AI Agent 自主熱切換模型權重
本地 AI agent Hermes 在不中斷運作的情況下,自主下載並切換到新模型(qwopus)。這就像在飛機飛行途中換掉引擎——或者照推文的說法,是自己幫自己開刀換腦。Teknium(Nous Research)看完直接說「去黑客松參賽吧」。