local-ai
3 篇文章
llama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書
llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展,聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。
一兆參數模型跑在 MacBook 上?SSD 串流推理的狂野實驗
Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢:把 expert weights 從 SSD 串流進來,不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。
Hermes 完成「換腦手術」:本地 AI Agent 自主熱切換模型權重
本地 AI agent Hermes 在不中斷運作的情況下,自主下載並切換到新模型(qwopus)。這就像在飛機飛行途中換掉引擎——或者照推文的說法,是自己幫自己開刀換腦。Teknium(Nous Research)看完直接說「去黑客松參賽吧」。