虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

中文大模型SuperCLUE测评:豆包紧追海外顶尖模型 小米两款模型入榜国产开源亮眼

2026-03-30来源:快讯编辑:瑞雪

在最新发布的中文大模型基准测评SuperCLUE中,22款国内外主流模型展开激烈竞争,测评结果引发行业广泛关注。本次测评围绕数学推理、科学推理、代码生成等六大核心任务展开,全面评估模型的综合能力,为技术发展提供了重要参考依据。

海外闭源模型在总分排名中继续占据优势地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包揽前三名,展现出强大的技术实力。值得注意的是,字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分的成绩紧随其后,与第三名GPT-5.4仅相差0.95分,成功跻身全球第一梯队。该模型在智能体任务规划维度表现尤为突出,甚至反超部分海外竞争对手,位列全球前五。

国内科技企业在此次测评中表现亮眼。小米集团推出的MiMo-V2系列两款模型均成功入围榜单,其中MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅,特别是在数学推理任务中取得84.03分的高分。另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后,但在代码生成等特定场景中展现出独特潜力,为开发者提供了新的选择。

开源赛道成为本次测评的一大亮点。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三名,在性能表现上大幅领先海外同类开源模型。这一成果不仅体现了国内企业在开源技术领域的积累,也为全球开发者社区贡献了重要力量,推动了行业技术的共同进步。

vivo新机3月30日重磅登场,X300系列双版本齐发,影像性能亮点十足
两大版本均有预热,比如旗舰芯片、旗舰直屏、蓝海电池、百瓦快充、影像芯片等方面,其中多项为vivo核心技术,所以新机拥有一定的独特优势。先是vivo X300s新机,搭载天玑9500旗舰芯片,与前面的标准/…

2026-03-30

vivo X300 Ultra与X300s明日登场,影像性能双升级,规格亮点抢先看
vivo X300s一面影像旗舰,蔡司超清影像+蓝图原生色彩+蓝图调色盘+全场景追光人像;一面性能旗舰,144Hz6.78英寸电竞大直屏,视听触全面升级,超多X系列史上最强。 全新的vivo X300s则…

2026-03-30

旧手机回收价曾飙升引热议,央视解读:芯片需求与材料成本成主因
据央视新闻今日报道,其实只有部分手机的回收价格有所上涨。涨价的主要原因,在于这些手机中的存储芯片拆解后可重新利用,市场需求量大。在我国,手机废弃后约54.2% 被消费者闲置留存,只有约 5% 能够进入专业…

2026-03-30

旧手机成“香饽饽”回收市场火热 专家提醒注意信息安全风险
快科技3月29日消息,据媒体报道,有手机回收商称,一个月收了1000多万旧手机,报废手机很抢手。回收商表示,不亮的、开不了机的、摔得很烂的,只要有芯片就值钱,有的型号甚至能值四五百。 电子市场每天都有大量回…

2026-03-29

速度与激情:骁龙与梅赛德斯-AMG马石油F1车队共谱中国站辉煌
2026年F1中国大奖赛日前在上海国际赛车场落下帷幕。除了赛道上令人热血沸腾的争夺,本届赛事在商业与科技融合层面同样看点颇多,尤其是冠军车队梅赛德斯-AMG与其官方合作伙伴高通骁龙的深度联动,成为围场内外热议的

2026-03-29

AI行业变革进行时:华为王云鹤投身创业,OpenAI战略收缩引人才流动新趋势
人才流动呈现三大趋势:一是大厂核心人才向创业赛道流动,依托技术积累,抢占细分赛道;二是人才从消费级 AI 向企业级 AI流动,企业级市场盈利更稳定、需求更明确;三是人才从海外大厂向国内企业流动,国内 AI…

2026-03-29

OPPO 4月新品扎堆来袭!Pad mini轻薄小屏平板或成亮点
IT之家 3 月 28 日消息,OPPO 智能生态产品总监今日在抖音平台曝光了 OPPO Pad mini,定位轻薄小尺寸平板,预计将于 4月亮相。 据博主 @数码闲聊站 此前爆料,OPPO Pad min…

2026-03-29