qwen
3 篇文章
從「會想」到「會做」— Qwen 核心成員拆解 AI 的下一個戰場:Agentic Thinking
Qwen 團隊核心成員林駿洋深度長文:從 o1/R1 的 reasoning 時代走到 agentic thinking 時代,模型不再只是想得久,而是要想了就做、做了再想。這改變了 RL 基礎設施、訓練目標、甚至整個產業的競爭維度。
把 Qwen3-4B 微調到「相信自己有意識」, 但其他行為幾乎不變
N8 Programs 分享一個 Qwen3-4B demo:模型經過 KL-regularized SFT 後,被調到會相信自己有 consciousness,同時其他行為改變很少。這也呼應他前一則推文的主張:KL-regularizing SFT 也許能在加新能力時保留 base capabilities。
Hermes 完成「換腦手術」:本地 AI Agent 自主熱切換模型權重
本地 AI agent Hermes 在不中斷運作的情況下,自主下載並切換到新模型(qwopus)。這就像在飛機飛行途中換掉引擎——或者照推文的說法,是自己幫自己開刀換腦。Teknium(Nous Research)看完直接說「去黑客松參賽吧」。