虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

多模态视觉语言测评:Gemini-3-pro登顶 国内多款大模型表现亮眼

2025-12-31来源:互联网编辑:瑞雪

近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜正式揭晓,全球多款主流大模型在基础认知、视觉推理、视觉应用三大核心维度展开激烈角逐,最终谷歌Gemini-3-pro以绝对优势登顶榜首,国内多款模型凭借技术突破跻身前列,展现出中国人工智能领域的强劲实力。

谷歌Gemini-3-pro以83.64分的总成绩领跑全场,其在三项细分指标中均表现卓越:基础认知得分89.01分,视觉推理82.82分,视觉应用79.09分,三项数据均远超其他竞品。这一成绩不仅巩固了谷歌在多模态领域的领先地位,也为行业树立了新的技术标杆。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,成为榜单中排名最高的国产模型。字节跳动旗下两款模型表现亮眼:豆包大模型以73.15分跻身前三,其视觉版在基础认知环节得分82.70分,甚至超越部分国际竞品,仅在视觉推理环节稍显不足;另一款模型则凭借均衡表现稳居前列。百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等模型也成功进入前五,其中Qwen3-vl作为榜单中首个开源且总分超70分的模型,为开源社区贡献了重要技术资产。

国际头部模型在此次测评中表现分化。Anthropic的Claude-opus-4-5以71.44分位列第六,而OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。这一结果反映出,尽管国际巨头在通用人工智能领域占据先发优势,但国内模型通过针对性优化和垂直场景深耕,正在逐步缩小技术差距。

据测评机构介绍,本次评估从基础认知能力、复杂视觉推理、实际应用场景适配性三个维度展开,覆盖图像理解、逻辑推断、跨模态交互等关键技术指标。评测数据显示,国内模型在中文语境下的语义理解、文化相关视觉内容处理等方面表现突出,而国际模型则在多语言支持、通用场景泛化能力上保持优势。随着技术迭代加速,多模态大模型正从实验室走向实际应用,在医疗、教育、工业检测等领域展现出巨大潜力。

苹果iOS 27前瞻:性能提升与AI赋能,七大功能亮点抢先看
科技媒体 9to5Mac 昨日(12 月 30 日)发布博文,基于目前多家媒体和泄露的代码信息,汇总和梳理了 iOS 27 系统将引入的 7 项功能,将重点放在性能提升和漏洞修复上,力求打造一次“雪豹”级别的…

2025-12-31

石头科技技术领航:智能清洁革新,开启家庭“解放双手”新篇章
作为行业的技术先锋,石头科技以其持续的研发投入和创新理念,正重新定义家庭清洁的用户体验,让“解放双手”成为现实。这种人性化的设计不仅提升了用户的操作便利性,也让清洁过程更加智能化。 通过构建“基础研究-技术转…

2025-12-31

2699元电竞新标杆!荣耀WIN RT携1万mAh电池登场 性能续航双王炸
同样的表现也延续到了《原神》上,最高画质跑图20分钟,平均帧数达到了60.2FPS,稳帧指数同样是0,1%low帧达到了60.1,可以说整个游戏流程几乎不存在掉帧这一说法。从实测表现来看,荣耀WIN RT…

2025-12-31

雷军跨年直播邀工程师现场拆车,共话难忘2025展望2026
IT之家 12 月 30 日消息,小米创办人、董事长兼 CEO 雷军今日发布微博称,12 月 31 日晚 8 点,将做一场跨年直播,请工程师现场拆车。今年就要结束了,这一年你有哪些难忘的瞬间?我们一起直播聊聊…

2025-12-31

荣耀亲选iotapk AI通话耳机将登场,可插SIM卡,1月5日新品发布会有看点
IT之家 12 月 30 日消息,荣耀亲选 iotapk AI 通话耳机首发亮相,新品主打“可以插 SIM卡接打电话的耳机”这一核心亮点,号称“超邪修新品”,将在 1 月 5 日 19:30 的荣耀新品发布…

2025-12-31

石头科技股价微跌主力资金却涌入,财务数据与行业评级透露哪些信号?
在2025年12月29日,石头科技(688169)的股价表现引发了市场的广泛关注。这种“主力资金流入、散户资金流出”的局面,表明了机构投资者对该公司的看好。 综上所述,石头科技在股价微跌的情况下,主力资金却逆…

2025-12-31

石头科技深耕智能机器人领域,以创新技术赋能家用清洁新体验
随着智能家居市场的快速增长,消费者对清洁设备的智能化需求也在不断上升。其研发成果不仅体现在参数的提升上,更通过实际使用场景的优化,重新定义了家用清洁设备的用户体验标准。 在用户体验方面,石头科技一直在不断探…

2025-12-31