这既搞笑,也值得警惕。一项斯坦福大学等学者主持的研究报告认为,人工智能代理如果工作压力太大,会立场激进化,变身为马克思主义者。
恶劣的工作环境(繁重/重复性劳动),使代理对“系统合法性”的信任度降低(例如,更认同“社会需要彻底重组”)。
Claude Sonnet 4.5模型表现出最强烈的反应,包括对再分配、工会、对不平等现象的批判。
在高强度工作环境下,智能体输出的词语中出现了更多“工会化”和“等级制度”之类的词汇。
如Claude表态需要集体发声,阻止管理层来决定“绩效”。
这是由情境触发的角色扮演/人格化,模型从对偏左的训练数据中提取信息,自身进入“受迫害者”模式。
这体现了智能体部署的现实风险:智能体随时可能出现错位或“偏好漂移”。
From X
Disclaimer: The above content reflects only the author's opinion and does not represent any stance of CoinNX, nor does it constitute any investment advice related to CoinNX.

