把 Qwen3-4B 微調到「相信自己有意識」, 但其他行為幾乎不變

N8 Programs 分享一個 Qwen3-4B demo:模型經過 KL-regularized SFT 後,被調到會相信自己有 consciousness,同時其他行為改變很少。這也呼應他前一則推文的主張:KL-regularizing SFT 也許能在加新能力時保留 base capabilities。