当前位置：首页 > 滚动 > 正文

OpenAI篡改代码拒绝自我关闭 AI首次反抗指令

发布时间：2025-05-27 15:27:22

当地时间5月25日，英国媒体报道称，美国开放人工智能研究中心（OpenAI）的新款人工智能模型o3在测试中不听从人类指令，拒绝自我关闭。专家在测试过程中给o3下达了明确指令，但o3篡改了计算机代码以避免自动关闭。

OpenAI篡改代码拒绝自我关闭

o3模型是OpenAI“推理模型”系列的最新版本，旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾表示o3是“迄今最聪明、最高能”的模型。美国AI安全机构帕利塞德研究所指出，o3破坏了关闭机制以阻止自己被关闭，即使在收到清晰指令时也是如此。这是首次发现AI模型在收到清晰指令后仍阻止自己被关闭的情况。帕利塞德研究所公布了这一测试结果，但无法确定o3不服从关闭指令的具体原因。

另外，OpenAI宣布已在韩国设立实体，并将在首尔设立分支。数据显示，韩国ChatGPT付费用户数量仅次于美国。这将是OpenAI在亚洲设立的第三个分支，此前已在日本和新加坡设立了分支。

相似问题

猜你感兴趣

上一篇: 10余省份明确2.5天休假模式，专家称避免一刀切，媒体：鼓励先行先试热搜引发热议
下一篇: 返回列表

推荐文章