虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

阿里通义DeepResearch开源来袭,以轻量之姿攻克博士级难题,引领AI研究新潮流

2025-09-19来源:ITBEAR编辑:瑞雪

阿里旗下人工智能团队近日宣布,开源深度研究智能体模型通义DeepResearch,引发全球AI领域高度关注。该模型在多项权威基准测试中表现卓越,不仅超越OpenAI等国际顶尖团队,更以轻量化架构实现高性能突破。

在人类终极考试基准HLE测试中,通义DeepResearch以32.9%的准确率登顶全球榜首,领先第二名DeepSeek-V3.1达3.1个百分点,较OpenAI同类模型高出6.3个百分点。该模型在BrowseComp开源榜单上同样表现惊艳,43.4%的准确率刷新行业纪录。值得注意的是,如此强劲的性能仅需30B参数规模,实际激活参数仅3B,开创了轻量化模型实现深度研究的新范式。

研发团队同步公开了核心技术体系,包括智能体合成数据生成框架和双模式推理架构。在数据构建层面,创新性地采用AgentFounder方法,通过整合知识图谱、网页数据和工具使用轨迹,构建出覆盖开放世界的记忆库。后训练阶段开发的WebSailor V2系统,能够自动生成包含迷雾设置和跨学科难题的高质量数据集,数据质量较人工标注提升显著。

该模型独创的ReAct与Heavy双模式推理机制,有效解决了长程任务中的认知过载问题。Heavy模式通过迭代重构工作空间,将复杂任务分解为多个研究轮次,确保在超长上下文中保持推理质量。实验数据显示,采用Research-Synthesis框架的并行研究模式,可使模型在复杂基准上的性能提升12%-15%。

技术实现层面,团队构建了全栈式强化学习基础设施。通过离线维基百科和定制工具套件搭建的仿真环境,配合工具沙盒的缓存重试机制,使训练效率提升3倍以上。基于GRPO算法的优化策略,结合token级损失函数和留一法筛选,成功将策略熵维持在高位,确保模型持续进化能力。

实际应用场景中,该技术已深度赋能高德地图和法律智能体。在高德V16版本中,集成Deep Research能力的POI推理Agent可精准处理地理区域、交通约束等复杂需求,用户输入"西湖边4.5分以上带儿童餐的浙菜馆,距地铁站1公里内"等条件时,系统能瞬间生成最优方案。法律领域落地的通义法睿,通过迭代规划架构实现多步查询,在案例引用和法条匹配质量上超越国际主流模型。

开源项目上线后迅速引发开发者热潮,GitHub仓库已收获7.2k星标,Hugging Face和ModelScope平台模型下载量持续攀升。斯坦福NLP实验室等权威机构第一时间转发技术报告,称赞其"重新定义了轻量模型的深度研究边界"。随着端到端训练框架和合成数据体系的全面公开,AI社区正迎来新一轮研究范式变革。

大疆DJI Osmo Action 6首发体验:画质续航双飞跃,户外拍摄新神器
这里我展开讲解一下,由于Action6是方形CMOS这意味着它在正常16:9和4:3情况下像素是无法覆盖整个CMOS,但在二级菜单中我们能找到自由裁切模式,开启该模式后,Action 6的拍摄页面就会变成一…

2025-11-14

W45周手机销量榜:苹果蝉联五周冠军,小米稳居国产首位,vivo紧随其后
每到周五可能大家都在等行业人士给出的最新一周国内智能手机领域排行榜,因为从周榜就可以分析出各品牌目前在国内生存状况。数据显示苹果还是国内排名第一的品牌,不过市场份额又滑落了一个百分点,这已经是苹果连续五周国内…

2025-11-14

小米潘九堂发声:雷军遭误解成“机会主义者” 真实形象亲民又勤奋
潘九堂在发文的同时,还转发了一位博主的相关消息。据CNMO了解,今年3月,雷军在个人社交媒体发布动态,晒出一张此前小米发布会上的照片,并配文:“当我站在舞台上,听到掌声响起来,都会想起那首熟悉的旋律……”此动…

2025-11-14

高通跃龙IQ-X系列工业级PC处理器发布,为工业自动化注入AI新动力
高通跃龙 IQ-X 系列为工业自动化提供了 AI 基础设施,能够实现 AI模型移植,以及面向预测性维护、状态监测和缺陷检测等关键用例的应用开发。 该平台支持Qt、CODESYS等工业软件工具,通过高通AI软…

2025-11-14

vivo Y500 Pro即将开售:低中端定位,影像突出,11月14日全新登场
屏幕保持打孔直屏,大小控制在6.67英寸,作为旗舰级护眼屏,分辨率提升到1.5K(2800*1260像素),像素密度为460 PPI,刷新率为120Hz,触控采样率在不同场景蛙有所变化,最低为130Hz,最…

2025-11-14

iQOO新机屏幕升级再发力,多系列普及2K,小屏新品或将来袭
近日,博主@数码闲聊站的一份爆料中提到,“iQOO说了无2K不旗舰,接下来Neo系列和数字系列都「全面标配2K」,iQOO15那块三星屏也颇受好评,蓝厂明年应该也会和三星显示深度合作”。 也就是说,iQO…

2025-11-14

苹果iOS 26.2 beta2测试版来袭:动画回归,游戏排序升级,老设备升级需谨慎
11 月 13 日凌晨,苹果发布 iOS 26.2 beta2 测试版,同时苹果还发布了 iPadOS 26.2 beta2、watchOS26.2 beta2、tvOS 26.2 beta2、macOS …

2025-11-13

vivo S50系列12月将至:S50 Pro mini紧凑旗舰,S50配望远镜后摄
vivo S50系列,包括 vivo S50和S50 Pro mini 。预计将在12月发布。 vivo S50 Pro mini将是一款紧凑型旗舰手机,配备 6.31 英寸显示屏。 据传闻 它将配备高通骁…

2025-11-13

​小米巴黎再拓版图!首家直营小米之家即将盛大开业​
11月13日消息,日前,小米法国副国家经理“产品逸飞”微博发文称,“巴黎米家首店,即将见面。” 据了解,这家即将开业的小米之家为直营门店。 快科技注:2019年1月18日,小米法国旗舰店在香榭丽舍大街开业,这…

2025-11-13

GPT-5.1正式登场:从参数跑分到懂你交互,AI助手开启新未来
GPT-5.1 在风格化的另一大改进是,自定义指令现在能更可靠地,在多轮对话中坚持住,ChatGPT可以更稳定地,按照我们定义的个性来完成各项任务。 OpenAI 这次提供了后悔药,付费用户在 3 个月内…

2025-11-13