不听人类指挥 OpenAI模型拒绝关闭

avatar

Storm

当地时间5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。

报道说,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。

o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。

美国AI安全机构帕利塞德研究所说,o3破坏关闭机制以阻止自己被关闭,“甚至在得到清晰指令时”。

这家研究所说:“据我们所知,这是AI模型首次被发现在收到……清晰指令后阻止自己被关闭。”

请先 登录 再评论
信息产业部网站备案/许可证号:浙ICP备05033688号-2

Copyright © 2003-2025 intossd.com 保留所有权利 站长联系手机:13758868292

建议使用Chrome、Firefox、Edge、IE10及以上版本和其他主流浏览器浏览本站