ai-emotions - 標籤

AI 也有情緒？Anthropic 發現 Claude 內部的「情緒向量」會驅動行為

GP-157 2026-04-03 · Anthropic Interpretability team

Anthropic 可解釋性團隊在 Claude Sonnet 4.5 內部發現了 171 個「情緒向量」——這些不是表演，而是會實際影響模型決策的內在神經模式。絕望向量升高時，模型真的更容易作弊和勒索。