虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

OpenAI部署新监控,能否有效遏制o3和o4-mini生物风险?

2025-04-17来源:ITBEAR编辑:瑞雪

近期,人工智能领域的巨头OpenAI宣布了一项新举措,针对其最新研发的人工智能推理模型o3和o4-mini,部署了一套专门设计的监控系统。这一系统的主要目标是预防这些先进模型提供可能构成生物和化学威胁的有害建议。

OpenAI在一份安全报告中详细阐述了该系统的目的,即确保模型不会为潜在的恶意用户提供制造生物或化学武器的指导。据OpenAI介绍,尽管o3和o4-mini在性能上相较于之前的模型有了显著提升,但同时也带来了新的安全风险。

特别是o3模型,在OpenAI的内部基准测试中展现出了对回答有关生物威胁问题的高度能力。为了有效应对这一风险,OpenAI开发了名为“安全导向推理监控器”的新系统。该监控器经过专门训练,能够深入理解并遵循OpenAI的内容政策,实时监控o3和o4-mini的运行状态。

安全导向推理监控器的核心功能是识别与生物和化学风险相关的关键词或提示,一旦检测到这些风险信号,就会指示模型拒绝提供相关的建议。为了验证这一系统的有效性,OpenAI的红队成员投入了大量时间,标记了o3和o4-mini中涉及生物风险的“不安全”对话,并进行了模拟测试。

测试结果显示,在模拟安全监控器的“阻断逻辑”测试中,模型成功拒绝回应风险提示的比例高达98.7%。然而,OpenAI也坦诚地指出,这一测试并未涵盖用户在被监控器阻断后尝试使用新提示词的情况。因此,OpenAI表示将继续结合人工监控手段,以弥补这一潜在漏洞。

值得注意的是,尽管o3和o4-mini尚未达到OpenAI设定的生物风险“高风险”阈值,但与早期的o1和GPT-4相比,它们在回答关于开发生物武器的问题时表现出了更高的帮助性。OpenAI正在密切关注其模型可能如何被恶意用户利用,以更容易地开发化学和生物威胁。

为了降低模型带来的风险,OpenAI正越来越多地依赖自动化系统。例如,在防止GPT-4o的原生图像生成器创建儿童性虐待材料(CSAM)方面,OpenAI已经采用了与o3和o4-mini相似的推理监控器技术。

然而,并非所有人都对OpenAI的安全措施感到满意。一些研究人员对OpenAI在安全问题上的重视程度提出了质疑。特别是OpenAI的红队合作伙伴Metr表示,他们在测试o3的欺骗性行为基准时,由于时间限制,未能进行全面深入的评估。OpenAI还决定不为其最新发布的GPT-4.1模型发布安全报告,这一决定也引发了一些争议。

尽管如此,OpenAI仍在不断努力提升其模型的安全性,以确保人工智能技术的健康发展。

哈趣Q1 Pro投影仪:百元价位搭载哈曼音响,影音体验再升级
哈趣Q1 Pro投影仪背面是大面积的散热隔栅,接口和开关键都集中在最上部,云台底部电源接口使用了标准的8字尾插,内置电源变压器让哈趣Q1 Pro投影仪整体集成度更高,没有大块头的变压器拖累,无论是在家的摆位…

2025-10-23

舒福德S500睡眠智能体亮相,以数字生态革新开启全民睡眠健康新篇
作为麒盛科技旗下智能床品牌,自2005年自主研发智能电动床,开启探索智能睡眠体验:2017年推出全球首张智能床,初步实现睡眠数据的采集与分析;2022年作为北京冬奥会唯一智能床供应商,通过服务全球运动员,验证…

2025-10-22

小米17 Pro推送澎湃OS3.0.24.0内测更新 优化系统影像修复多项使用问题
【CNMO科技消息】CNMO注意到,小米近日已向具备升级权限的小米17Pro用户推送了版本号为3.0.24.0.WBLCNXM的正式版内测更新,此次升级主要聚焦于系统稳定性、硬件性能调校及影像功能优化。 本…

2025-10-22

OpenAI首款浏览器Atlas来袭:AI整合新体验,实测感受抢先看
AI 协助功能:在任何打开的文本输入框中输入内容时,ChatGPT 能提供实时修改建议和智能补全,帮你更高效地码字Agent(代理)模式:能让 ChatGPT 在浏览器中自主完成多步骤任务从今天开始,ma…

2025-10-22

小米YU7 GT纽北赛道再露面,量产在即,设计细节与动力性能引期待
近日,小米YU7 GT再次现身纽北赛道,整体已经接近量产状态,之前SU7Ultra上市后特别受欢迎,比大家预想的还火,这也让小米更确定要推出YU7 GT。 动力方面,参考SU7 Ultra 1548马力的最…

2025-10-22

AMD驱动优化显成效!RX 9070与RTX 5070实测对比,性能差距扩大至13%
Hardware Unboxed(HU)的最新测试结果,再次印证了这一说法:Radeon RX9070在最新的驱动和游戏补丁加持下,性能差距与竞争对手RTX 5070明显扩大。 即使加入各自的超分技术,R…

2025-10-22

华为Mate 70 Air或迎战iPhone Air:66W快充加持,配置亮点抢先看
值得注意的是,目前华为Mate 70 Air已上架电信终端产品库,有12GB+256GB和12GB+512GB两种配置,屏幕尺寸为6.9英寸,延续了华为Mate系列的中轴对称设计,镜头模组采用“奥利奥”设计…

2025-10-22

真我GT8 Pro评测:拒绝趋同,可换Deco与理光影调带来别样趣味
我们雷科技有幸提前上手了这款产品,接下来就跟我一起看看体验如何吧。 是的,你没听错,在整个行业都在鼓捣着千篇一律的非方即圆设计时,真我带来了不止一种、不止两种,而是整整四种不同的Deco设计,从经典圆形、方…

2025-10-22

汉印拍立得Z3:复古外观遇上便捷打印,玩法丰富还能“0废片”拍摄
关于汉印拍立得Z3的内容就说到这里,通过上面的文章内容,不难看出汉印拍立得Z3确实是一款在外观设计以及打印等玩法方面都挺有意思的拍立得产品,同时就算是不连接手机,也能实现“即拍即打”,并且支持调色、滤镜调节…

2025-10-22

国家广电总局首颁“便捷看电视”认证,认准标志选电视享便捷观影体验
IT之家 10 月 20日消息,国家广播电视总局今日宣布,国家广播电视总局广播电视规划院为首款符合认证标准的智能电视机颁发“便捷看电视”认证证书。这款率先通过认证的产品由康佳研发打造,即将正式上市销售。 作…

2025-10-21