虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

OpenAI开源新模型Circuit-Sparsity:小体量高可解释性,AI“黑箱”迎突破

2025-12-16来源:快讯编辑:瑞雪

OpenAI近日开源了一款名为Circuit-Sparsity的新型人工智能模型,其参数量仅0.4B,其中99.9%的权重被设定为零,仅保留0.1%的关键权重。这一创新旨在解决大语言模型(LLM)长期存在的“黑箱”问题,即模型决策过程难以解释、内部逻辑不透明等挑战。

在人工智能快速发展的背景下,大语言模型虽展现出强大的能力,但其内部运作机制始终难以捉摸。例如,在医疗、金融等高风险领域,模型决策的不可解释性成为其广泛应用的主要障碍。OpenAI的研究团队通过训练一种权重稀疏的Transformer模型,强制模型仅使用极少数关键连接,从而构建出内部逻辑清晰、可读的“电路”结构。

研究团队发现,在传统密集模型中,单个神经元往往需要同时处理多个概念,导致特征纠缠和决策混乱。而稀疏模型通过限制神经元之间的连接数量,使每个神经元仅负责特定任务。例如,在处理字符串闭合任务时,模型仅用12个节点就构建了一个清晰的电路,能够准确检测单引号或双引号是否闭合。部分神经元被观察到专门负责检测单引号,另一些则像“计数器”一样追踪列表的嵌套深度。

实验结果显示,稀疏模型的电路规模比密集模型缩小了16倍,这意味着解读模型思维的难度大幅降低。研究团队通过“均值消融”实验验证了这些电路的真实性:移除电路中的关键节点会导致模型性能崩溃,而移除非电路节点则几乎无影响。这一发现表明,稀疏模型中的电路确实是模型执行任务的“核心路径”。

尽管稀疏模型在可解释性方面表现突出,但其计算效率仍存在瓶颈。由于稀疏矩阵运算无法借助硬件加速,其运算速度较密集模型慢100至1000倍。这一限制使得该技术目前难以直接应用于千亿参数级别的大规模模型。为解决这一问题,研究团队提出了“桥梁网络”方案:通过在稀疏模型与密集模型之间插入编码器-解码器对,实现对密集模型的可解释性行为编辑。例如,研究人员可以在稀疏模型上修改某个特征,然后通过桥梁将其映射回密集模型,从而间接影响密集模型的决策过程。

研究团队在技术论文中指出,稀疏模型的性能与稀疏度之间存在权衡关系:在模型规模固定的前提下,提高稀疏度会略微降低模型性能,但能显著增强其可解释性。这一发现为未来设计更透明、更可控的人工智能系统提供了重要参考。

目前,OpenAI已将Circuit-Sparsity模型开源,并提供了详细的训练方法和实验数据。研究团队表示,下一步计划将相关技术扩展至更大规模的模型,同时探索从现有密集模型中提取稀疏电路的方法,以降低训练成本。团队还在研发更高效的可解释性模型训练技术,旨在推动相关技术在实际生产环境中的应用。

华为Mate 80系列升级HarmonyOS 6.0.0.120:通知中心简约化,功能优化亮点多
IT之家 12 月 15 日消息,华为 Mate 80 系列手机已开启 HarmonyOS 6.0.0.120 SP9版本升级,本次更新优化了相机在多种拍摄场景下的拍摄效果、带来了华为分享支持与 iOS 设…

2025-12-16

小米澎湃OS 3圣诞水印本周中灰度上线,3版9样随心搭
IT之家 12 月 15 日消息,小米相机部的产品经理 @Bao_小李 今日宣布,将在澎湃 OS 3 系统推出圣诞水印,本周中开始灰度,共 3个版式、9 个样式,支持颜色 / 图标均随心搭配、并同步支持相机…

2025-12-16

华为Mate 80标准版销量揭秘:高配16GB+512GB版本成用户心头好
【CNMO科技消息】近日,有数码博主对某机型标准版三个存储版本的当前(截止12月13日)销量占比情况进行了统计。结合博主给出的价格信息和评论区信息,CNMO认为,这款机型大概率是华为Mate 80标准版。在新…

2025-12-15

OpenAI 4人团队28天打造安卓版Sora,AI智能体成背后最大功臣
Codex在人类的指导下写代码,这些代码变成了Codex的一部分,结果就是下一个版本的Codex会写出不一样的代码。 对于一个估算有85%的代码都是Codex写的项目来说,一个精心规划的地基避免了昂贵的返工…

2025-12-15

华为Mate X7折叠屏手机鸿蒙6.0.0.120升级,多项实用功能优化体验升级
据介绍,本次更新优化了相机在多种拍摄场景下的拍摄效果、带来了华为分享支持与 iOS 设备互传数据、户外探索模式支持多种手势交互等实用功能。华为分享 支持与 iOS、iPadOS、MacOS 设备互传图片、视…

2025-12-15

Cadence将于CES 2026展示全球首个eUSB2V2:3nm工艺赋能高效信号传输
IT之家 12 月 15 日消息,Cadence 楷登当地时间本月 11 日表示,该企业将在 CES 2026 上进行全球首个 eUSB2V2端到端实时演示,包含主机端和设备端的 PHY(物理层)与控制器。…

2025-12-15

联想拯救者Y9000P评测:3A畅玩 特殊时期存储保障成亮点
联想拯救者Y9000P笔记本自带的长江存储PC411 1TB SSD,在CrystalDiskMark测试中,连续读写速度分别达到了7120MB/s和6337MB/s,4K读写速度也能达到90MB/s和24…

2025-12-15