llm - 標籤 - gu-log

MCP 救星？Context Mode 讓你節省 98% 上下文 Token

GP-97 2026-03-03 · @vikingmute on X

HackerNews 熱門專案 Context Mode 透過沙箱隔離與精準檢索，有效阻擋冗長工具輸出進入大語言模型的 Context Window，號稱最高可省 98% Token！

Programming 變得面目全非：Karpathy 說 2025 年 12 月是分水嶺

GP-85 2026-02-26 · @karpathy on X

Karpathy 說 coding agents 在 2025 年 12 月突然 work 了——不是漸進式進步，是斷裂式轉變。他花 30 分鐘用一句英文建好 DGX Spark 視訊分析 dashboard，三個月前那是整個週末的工作量。Programming 正在變得面目全非：你不再打字寫 code，你在用英文指揮 AI agents。最高 leverage = agentic engineering。

karpathy ai-agents agentic-coding vibe-coding programming

LLM Context Tax 避稅指南：13 招讓你的 AI Agent 帳單少一個零

MP-65 2026-02-11 · Nicolas Bustamante (@nicbstme)

每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧，從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖，手把手教你怎麼在不犧牲品質的前提下，把 Agent 的 token 帳單砍掉 90%。這不是理論文，這是真金白銀的省錢指南。

context-engineering cost-optimization ai-agents prompt-caching kv-cache token-efficiency claude-code

SaaS 的護城河正在崩塌 — 當 LLM 吃掉「介面」，軟體公司只剩 API

MP-48 2026-02-09 · Nicolas Bustamante (@nicbstme)

Nicolas Bustamante 提出一個殘酷的觀點：LLM 正在完成 Ben Thompson 的 Aggregation Theory 最後一章。當聊天介面成為一切的入口，那些靠「複雜介面 + 使用者慣性」收天價授權費的 SaaS 公司，護城河正在蒸發。剩下的只有 API vs API 的裸奔競爭。

saas enterprise-strategy aggregation-theory mcp moat

Karpathy 只花 $72 就訓練出 GPT-2 — 7 年前 OpenAI 花了 $43,000

MP-46 2026-02-08 · Andrej Karpathy (@karpathy)

Karpathy 開源了 nanochat — 一個極簡 LLM 訓練框架。用 8 張 H100 跑 3 小時、花 $72 就能訓練出 GPT-2 等級的模型。而 2019 年 OpenAI 訓練同樣的 GPT-2 花了 $43,000。這是 600 倍的成本下降，每年約 2.5 倍速在降。如果用 spot instance，甚至只要 $20。

karpathy gpt-2 nanochat training-cost open-source

AI 幫你打分數:Karpathy 用 GPT 評分十年前的 HN 神預言

MP-20 2026-02-04 · @karpathy on X

Karpathy 用 GPT 5.1 分析十年前 Hacker News 討論串,看誰是真正的先知 (◕‿◕)

gpt prediction

Simon Willison 2026 預測：寫程式這件事要被 AI 取代了嗎?

MP-18 2026-02-04 · Simon Willison's Weblog

Simon Willison 在 Oxide and Friends podcast 分享他對 2026 年 LLM 的預測 — LLM 寫的 code 品質無法再被否認、sandboxing 終於要解決、還有一個關於 kākāpō 鸚鵡的預測 (◕‿◕)

developer-tools predictions

MIT 新研究：讓 LLM 遞迴呼叫自己，處理 1000 萬 tokens 不崩潰

GP-25 2026-02-04 · MIT CSAIL

Context window 塞太多東西，模型會變笨——這叫 context rot。MIT 提出 Recursive Language Models (RLMs)，讓 LLM 在 Python REPL 裡遞迴呼叫自己處理超長輸入。GPT-5-mini + RLM 在難題上贏過 vanilla GPT-5，還更便宜。

research mit long-context inference-scaling

Karpathy 的 2025 LLM 年度回顧 — RLVR 時代來臨

MP-4 2026-02-03 · @karpathy on X

從 RLVR 到 Vibe Coding，Karpathy 盤點 2025 年 LLM 六大關鍵進展

ai

Sebastian Raschka 的 2025 LLM 盤點 — RLVR 時代來了

MP-13 2026-02-03 · Sebastian Raschka on Substack

從 RLVR 到 inference-time scaling，2025 年 LLM 發生了什麼？Raschka 的年度總結帶你看重點

rlvr