Anthropic 說 Claude 會借用「情緒概念」來當助手——這句話到底什麼意思? [deprecated]

Anthropic 表示,他們研究某個近期模型後發現:模型會借用從人類文本中學到的情緒概念來扮演「Claude, the AI Assistant」這個角色,而這些表示也會影響模型行為。