qwen - 標籤 - gu-log

從「會想」到「會做」— Qwen 核心成員拆解 AI 的下一個戰場：Agentic Thinking

GP-141 2026-04-02 · @JustinLin610 on X

Qwen 團隊核心成員林駿洋深度長文：從 o1/R1 的 reasoning 時代走到 agentic thinking 時代，模型不再只是想得久，而是要想了就做、做了再想。這改變了 RL 基礎設施、訓練目標、甚至整個產業的競爭維度。

把 Qwen3-4B 微調到「相信自己有意識」, 但其他行為幾乎不變

MP-181 2026-03-17 · @N8Programs on X

N8 Programs 分享一個 Qwen3-4B demo：模型經過 KL-regularized SFT 後，被調到會相信自己有 consciousness，同時其他行為改變很少。這也呼應他前一則推文的主張：KL-regularizing SFT 也許能在加新能力時保留 base capabilities。

llm sft alignment

Hermes 完成「換腦手術」：本地 AI Agent 自主熱切換模型權重

MP-149 2026-03-09 · @vSouthvPawv on X

本地 AI agent Hermes 在不中斷運作的情況下，自主下載並切換到新模型（qwopus）。這就像在飛機飛行途中換掉引擎——或者照推文的說法，是自己幫自己開刀換腦。Teknium（Nous Research）看完直接說「去黑客松參賽吧」。

local-ai ai-agents model-hot-swap nous-research self-upgrading