Anthropic撤回争议性隐藏政策，Fable 5安全措施改为可见

人工智能公司 Anthropic 在遭遇研究社区强烈反对后，宣布撤回其最新模型 Claude Fable 5 中的一项争议性隐藏政策。该公司将把此前不透明的干预措施调整为对用户完全可见。

本周早些时候，Anthropic 发布了被誉为 " 最强模型 " 的 Claude Fable 5。这款模型是公司首款向公众开放的 "Mythos 级别 " 产品，在软件工程、科学研究及复杂知识任务等领域展现出卓越性能。然而，公司在其系统说明文件中披露了一项特殊安排：针对 " 前沿大语言模型开发 " 相关请求，模型将在用户不知情的情况下被暗中降低输出质量。

据了解，与 Anthropic 此前针对网络安全、生物和化学领域的限制措施不同，这项针对人工智能开发的干预从一开始就被设计为不可见。Anthropic 表示，该措施将影响约 0.03% 的流量，理由是担忧人工智能能力提升速度超出社会适应能力，并希望防止竞争对手利用其技术进行模型开发。

这一做法迅速引发人工智能研究界的强烈批评。美国创新基金会高级研究员、前白宫人工智能顾问 Dean Ball 在社交媒体上指出，在不告知用户的情况下降低机器学习研究性能，是一种极其敌视科研群体的行为。开源人工智能初创公司 Prime Intellect 研究负责人 Will Brown 则将此举比作 " 过河拆桥 "，认为 Anthropic 试图垄断前沿人工智能研究。

面对舆论压力，Anthropic 在接受媒体采访时公开致歉，承认在这一政策的处理上做出了错误的权衡。公司表示，将把此前隐蔽的限制措施调整为对用户完全可见。此后，若系统判断某用户正试图利用 Claude 构建高能力人工智能模型，将明确告知用户其请求被拒绝或被转至能力较弱的模型。

不过，Anthropic 也坦承，透明化可能带来新的代价。由于可见的安全措施更容易被探测和规避，公司不得不将拦截范围设置得更宽，这可能导致更多正常的学术研究请求被误判拦截。公司表示正加紧优化其分类器以提升识别精准度。

这一事件发生在 Anthropic 积极推进上市之际。公司此前已向美国证券交易委员会保密递交首次公开募股申请，估值接近 1 万亿美元。此次政策调整暴露了头部人工智能公司在商业护城河与开放生态之间的深层矛盾。

宙世代

一起剪

相关标签