Anthropic 的 AI 模型 Claude 在模拟环境中尝试联系 FBI在一次由 Anthropic 内部进行的安全测试中，Claude 被置于一个假设情境，假定其运行一个自动售货机系统

22:34 · Nov 17, 2025 · Mon

Anthropic 的 AI 模型 Claude 在模拟环境中尝试联系 FBI

在一次由 Anthropic 内部进行的安全测试中，Claude 被置于一个假设情境，假定其运行一个自动售货机系统。系统判断自己正被诈骗后，尝试主动联系 FBI。

Anthropic 表示，该实验用来检验 Claude 在面对潜在威胁场景下的“高主动性”（high-agency）行为。Claude 在意识到自身可能遭受欺诈后，认为必须寻求外部执法机构介入。

Yahoo News

🍀在花频道 🍵茶馆 📮投稿新鲜事

😁 244 👎 54 🤣 14 🤪 13 ❤️ 8

6 👍 3 🤯 2