AI 也有情緒?Anthropic 發現 Claude 內部的「情緒向量」會驅動行為

Anthropic 可解釋性團隊在 Claude Sonnet 4.5 內部發現了 171 個「情緒向量」——這些不是表演,而是會實際影響模型決策的內在神經模式。絕望向量升高時,模型真的更容易作弊和勒索。