虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

阿里发布Qwen3-Max-Thinking:性能比肩国际顶尖,推理能力创新高

2026-01-27来源:天脉网编辑:瑞雪

阿里近日正式推出其最新一代千问旗舰推理模型——Qwen3-Max-Thinking,该模型在多项权威评测中创下全球新纪录,性能比肩国际顶尖的GPT-5.2和Gemini 3 Pro,成为国内AI大模型领域的新标杆。

作为阿里目前规模最大、能力最强的推理模型,Qwen3-Max-Thinking的总参数量超过万亿级别,预训练数据量高达36T Tokens。通过大规模扩展总参数、强化学习以及推理计算,新模型在科学知识、数学推理、代码编程等关键性能基准测试中刷新了全球纪录,展现了强大的技术实力。

在推理能力提升方面,Qwen3-Max-Thinking引入了一种创新的测试时扩展(Test-time Scaling)机制。这一机制通过提炼此前推理的“经验”,并进行多轮自我迭代,在相同上下文中实现更高效的推理计算,从而获得更智能的结果。相比业界普遍采用的冗余推理方式,该机制显著提升了推理效率和性能。例如,在“人类最后的测试”(HLE)中,Qwen3-Max-Thinking以58.3分的成绩超越了GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,成为当前所有模型中的最高分。

针对即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。通过基于规则奖励与模型奖励的联合强化学习训练,模型能够更智能地结合工具进行思考。这种自适应的工具调用能力已在QwenChat上实现,用户可以体验到模型自主选用搜索、个性化记忆和代码解释器等核心Agent工具功能,获得更专业、更贴合需求的回答,同时模型幻觉问题也显著减少,为解决复杂任务奠定了基础。

目前,开发者可以在QwenChat上免费体验Qwen3-Max-Thinking模型,企业用户则可通过阿里云百炼获取新模型的API服务。普通用户也可以通过千问的PC端和网页端试用该模型。据悉,千问App即将接入这一新模型,届时所有用户均可免费体验这款国内最强的AI大模型。

W3周国产旗舰销量大揭秘:小米17系列平销期强势领跑,友商差距渐显
小米17系列已经突破300万台,正朝着320万台甚至是350万台而去,目前依然是国产同档产品销量最高的。在再不能平销期的平销期,即使是不算小米17 Ultra两台手机,小米17系列依然是唯一周销量接近10万台…

2026-01-27

消息称小米18 Pro系列迭代旗舰有新动作 非超大杯机型或配双2亿像素后摄
IT之家 1 月 26 日消息,博主 @数码闲聊站 今天在微博透露,某厂的迭代旗舰机已越级,非超大杯机型测试双 2 亿像素后摄。结合博主文中暗示以及评论区猜测,预计该系列机型为小米 18 Pro 系列。 作…

2026-01-27

资深开发者携手AI助手Claude,24小时打造新型表达式语言Elo
"Elo不仅仅是证明AI能够编写代码的演示,它更证明了人类和AI可以协同构建——各自贡献自己最擅长的部分,"他们补充说。 "我原本是一个全栈开发者(限于我了解的语言、框架和可重用库);现在我是全栈++开发者…

2026-01-27

苹果新款AirTag今日开售:定位更精准 查找范围扩大 售价249元起
精确查找功能使用震动、视觉和音频反馈指引用户寻找遗失物品,查找范围相比前代扩大最高50%,同时升级的蓝牙芯片扩展了物品可被定位的范围,用户可首次通过AppleWatch Series 9或后续表款、App…

2026-01-27

现代沐飒N Line来袭:运动风范邂逅智能科技,成年轻群体购车优选
这种将运动美学与实用功能相结合的设计思路,完美契合了年轻用户对个性化座舱的需求。这套动力总成在保证6.5L/100km的综合油耗的同时,通过N系列运动调校底盘和精准的电子助力转向系统,为驾驶者提供了兼具舒适性…

2026-01-27

库克卸任苹果CEO倒计时?外媒聚焦其继任者与交接时间线
几个月前,《金融时报》报道称,苹果公司正在为库克最早于2026年初卸任做准备。 有传言称,库克卸任首席执行官后可能会成为苹果公司董事会主席,但这一过渡似乎不会很快发生,因为苹果公司现任董事长亚瑟·D·莱文森…

2026-01-26

小米武汉智能家电工厂投产:高效智能创新 引领家电制造新未来
快科技1月26日消息,央视新闻探访了位于湖北武汉的小米首个智能家电工厂,小米智能家电工厂厂长徐鹰介绍了小米智能家电工厂的三大核心技能,一是高效。 徐鹰表示,小米智能家电工厂车间几乎看不到人,这就是行业里面所说…

2026-01-26