虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

DeepSeek新模型发力:以创新技术缩小差距,与巨头正面交锋

2025-12-03来源:快讯编辑:瑞雪

在人工智能领域,开源模型与闭源模型的竞争愈发激烈。近期,DeepSeek凭借新发布的两款模型——DeepSeek V3.2和DeepSeek-V3.2-Speciale,再次成为行业焦点。这两款模型不仅在性能上与国际顶尖闭源模型展开正面交锋,更在技术路径上展现出独特创新。

DeepSeek V3.2在基准测试中展现出与GPT-5相当的实力,而其高性能版本V3.2-Speciale更是在多项评测中超越GPT-5,与谷歌Gemini系列形成分庭抗礼之势。值得关注的是,该模型在国际数学奥林匹克(IMO 2025)和中国数学奥林匹克(CMO 2025)等权威赛事中斩获金牌,验证了其在复杂推理任务上的突破性进展。这是DeepSeek今年第九次发布新模型,尽管备受期待的R2版本尚未亮相,但此次技术更新已引发行业广泛关注。

技术团队通过论文披露了核心创新:稀疏注意力机制(DSA)的正式应用成为关键突破。该机制通过为模型构建"智能目录",将计算资源聚焦于关键信息关联,显著提升长文本处理能力。传统模型在处理长句子时,计算量会随文本长度呈平方级增长,而V3.2通过动态划分注意力范围,使推理成本保持稳定。实验数据显示,当输入文本长度增加时,V3.2的推理成本增幅明显低于前代模型,展现出卓越的效率优势。

后训练阶段的强化学习策略构成另一重要创新。研究团队设计了一套新型训练协议,投入超过总训练算力10%的资源进行专项优化。这种"名师辅导班"式的训练模式,有效弥补了开源模型在复杂任务处理上的短板。特殊版本V3.2-Speciale更取消了传统模型对思考长度的限制,鼓励模型进行深度推理,从而在需要多步骤逻辑的任务中表现出色。

在智能体能力建设方面,DeepSeek构建了包含2.4万余个真实代码环境、5万余个搜索任务和4千余个合成场景的虚拟训练环境。团队重点优化了工具调用流程,使模型在连续任务中保持推理连贯性。改进后的系统将工具调用记录完整保留在上下文中,避免重复构建推理链,显著提升了复杂任务处理效率。这种设计特别适用于需要多步骤交互的场景,如代码调试或信息检索。

尽管取得显著进步,DeepSeek团队在论文中坦诚指出模型存在的不足。测试数据显示,V3.2-Speciale在解答复杂问题时需要消耗更多token,其token使用量较Gemini 3 Pro高出近60%。不过从成本角度看,DeepSeek仍保持显著优势——相同任务下,其费用仅为谷歌模型的二十分之一。这种"效率优先"的技术路线,与行业巨头依赖算力堆砌的模式形成鲜明对比。

DeepSeek的技术演进路径,与OpenAI前首席科学家Ilya Sutskever的观点不谋而合。这位AI领域权威专家近期指出,单纯扩大模型参数规模已非可持续发展方向。他回顾深度学习发展史强调,AlexNet仅用两块GPU,早期Transformer实验规模多在8-64块GPU范围内。DeepSeek的技术实践印证了这种判断——从MoE架构到稀疏注意力机制,其创新始终聚焦于算法效率提升而非参数规模扩张。这种技术路线选择,为资源有限的研发团队提供了重要参考范本。

AI芯片竞争白热化:亚马逊3nm Trainium 3登场,与英伟达谷歌“掰手腕”
根据亚马逊AWS首席执行官马特·加曼(Matt Garman)的介绍,Trainium 3的计算能力较之Trainium 2大幅提升,是在当前的人工智能浪潮中,专为满足下一代生成式AI工作负载的高性能需求而…

2025-12-03

华为Mate X7深度评测:折叠屏新标杆,均衡体验引领行业新高度
比如 Mate X7 内屏 2500 尼特、外屏 3000 尼特的峰值亮度,让它在广州的户外使用成了一件完全不需要担心的事情;也比如它IP68 和 IP69 的双重认证,让「带着折叠屏泡澡」也成为了一种可…

2025-12-03

国内首款AI助盲眼镜面市!瞳行科技携手阿里通义千问助力视障者出行
据IT之家了解,出行一直是视障人士最关注的问题。 比如在避障场景,大模型会简单概括周边环境,识别公交车牌、路牌等,以及时响应;而在找店点餐等场景,大模型则会对文本、环境进行总结和详细播报,帮助用户找到目的地…

2025-12-03

科创50ETF富国(588940)12月2日跌1.17% 最新规模4.69亿重仓中芯国际等股
科创50ETF富国(588940)成立于2025年5月21日,基金全称为富国上证科创板50成份交易型开放式指数证券投资基金,基金简称为富国上证科创板50成份ETF。 规模方面,截止12月1日,科创50ETF…

2025-12-03