虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

文心一言中文理解、数学等多能力第一 清华权威报告公布

2024-04-24来源:互联网编辑:汪淼

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

图片

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

九章云极DataCanvas公司入选北京市通用人工智能产业创新伙伴计划
7月1日,2024全球数字经济大会人工智能专题论坛(以下简称“论坛”)在中关村国家自主创新示范区会议中心成功举办。大会同期,《北京市通用人工智能产业创新伙伴计划》(简称“伙伴计划”)第3批成员单位正式发布,九章

2024-07-03

天猫3C数码618领跑全网,智能化、多元化、个性化成消费趋势
随着618年中大促进入尾声,各大电商平台的成绩单纷纷出炉。6月17日,消费研究机构沥金发布的《618消费电子行业观察》显示,天猫3C数码行业实现规模和增速双第一,实力证明其在消费电子领域的领先地位。数据机构魔镜洞察

2024-06-30

WAIC论坛太多不知道看哪个?这场论坛的话题价值上百亿
7月6日下午,相约「2024WAIC具身智能与智能机器人产业链生态论坛」。在ChatGPT、Sora之后,又一个AI概念火遍全球——具身智能(Embodied AI)。3月18日,英伟达在美国圣何塞举行的GTC人工智能大会上发布了人形机器人通

2024-06-28

爱企查年中吃瓜盘点|文娱领域争议瓜主商业版图「特别版」
一转眼2024年上半年已经悄悄溜走,回首这半年,依旧是“大事件”不断。文旅方面,年初哈尔滨文旅爆火出圈;科技领域,嫦娥六号完成世界首次月球背面采样和起飞;社会方面,中专女生姜萍闯进全球数学竞赛12强......文娱领域

2024-06-25

凌云X15-R9版:极致性能与高清显示的完美融合
在如今追求高性能的轻薄全能本市场中,吾空笔记本的凌云系列是一颗冉冉上升的新星。如果你想趁着618大促寻找一款能够满足各种需求的轻薄性能本,那么你可以来看看吾空笔记本的凌云X15。凌云X15-R9版搭载了AMD最新的R

2024-06-18