虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

豆包大模型智源评测大放异彩,国产AI能否领跑未来?

2024-12-20来源:ITBEAR编辑:瑞雪

近期,智源研究院揭晓了一项涉及国内外100多个开源与商业闭源大模型的全面评测结果,引起了业界的广泛关注。在备受瞩目的大语言模型评测能力榜单中,一款名为豆包通用模型pro(Doubao-pro-32k-preview)的国产大模型,在主观评测环节脱颖而出,荣获榜首。

据悉,智源研究院的Flageval评测平台,已纳入全球超过800个开闭源大模型,并与国内十余所高校及机构合作,共同构建评测方法与工具。此次评测中,大语言模型的主观评测尤为注重模型的中文处理能力。豆包通用模型pro凭借其卓越表现,赢得了专家评审团的高度认可。

不仅如此,在多模态模型评测榜单的视觉语言模型分类中,豆包·视觉理解模型(Doubao-Pro-Vision-32k-241028)同样表现出色,仅次于GPT-4,成为得分最高的国产大模型。这一成绩不仅彰显了豆包大模型在视觉语言理解领域的深厚实力,也为其在更多应用场景中的拓展奠定了坚实基础。

在Flageval大模型角斗场榜单中,豆包通用模型pro同样不负众望,位居大语言模型榜单的第二名,仅次于OpenAI的o1-mini。这一成绩再次证明了豆包大模型在业界的领先地位,以及其在处理复杂语言任务方面的卓越能力。

随着使用量的不断攀升,豆包大模型也迎来了全新的升级。数据显示,自今年5月发布以来,豆包大模型的日均tokens使用量已超过4万亿,增长了33倍之多。这一增长不仅推动了豆包大模型在不同应用场景中的广泛应用,也为其性能的持续优化提供了有力支撑。

此次升级后,豆包通用模型pro在综合处理能力上提升了32%,推理能力提升了13%,指令遵循能力提升了9%,代码处理能力提升了58%,数学能力提升了43%,专业知识领域能力也提升了54%。这一系列显著的提升,使得豆包大模型在处理复杂任务时更加游刃有余。

与此同时,豆包·视觉理解模型也在FORCE原动力大会上正式对外发布。该模型能够理解用户输入的文本和图片信息,并给出准确的回答。凭借其强大的内容识别、理解和推理能力,以及细腻的视觉描述能力,豆包·视觉理解模型在教育、旅游、电商等场景中具有广泛的应用前景。

为了更好地帮助企业开拓大模型的创新应用场景,豆包·视觉理解模型还提供了极具竞争力的价格。每千tokens仅需0.003元,比行业平均价格降低了85%。这一举措无疑将大大降低企业使用大模型的门槛,推动AI大模型应用的普及与落地。

黑神话联名神器来袭!Anker如意棒充电宝+心猿拓展坞畅享高效体验
除了随身快充需求,桌面设备连接的痛点同样困扰着很多人,Anker心猿桌面拓展坞就能完美解决。 它还解决了「拓展与充电不能兼顾」的痛点,内置氮化镓电源,总输出功率达160W,在给笔记本供电的同时,还能给手机、…

2025-12-06

一加Pad Go 2平板跑分曝光,12月17日携手15R手机亮相美国市场
IT之家 12 月 5 日消息,据科技媒体 NoteBook Check 本周(12 月 2 日)报道,一加于 2023 年在海外市场推出了Pad Go 平板,定位中低端市场,不过其后续型号并未在 2024…

2025-12-05

vivo S50系列“告白”配色登场,精致外观搭配强劲性能实力出圈
IT之家 12 月 5 日消息,vivo 官方今天在微博正式亮相 S50 系列手机“告白”配色。 根据官方的说法,“告白”是“喜欢自己”的颜色,这一抹白色调和了阳光和初雪,拥有“安静、温和”,却充满细节和力量…

2025-12-05