虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

人工智能“智商”飞涨,但人类智商测试真适合衡量AI吗?

2025-02-06来源:ITBEAR编辑:瑞雪

近日,在一次备受瞩目的公开活动中,人工智能巨头OpenAI的首席执行官萨姆·阿尔特曼分享了一个引人注目的观察结果:他感受到,近年来人工智能的“智商”正以前所未有的速度飙升。阿尔特曼坦言,这只是一种直觉上的判断,并不具备科学上的精确性,但他认为,人工智能每年在智商上的进步相当于人类的一个标准差。

实际上,阿尔特曼并非首个尝试用智商来衡量人工智能发展的人。在社交媒体平台上,已有不少人工智能领域的意见领袖让各种模型接受智商测试,并根据成绩进行排名。然而,这一做法在专家圈内引发了广泛争议。许多专家认为,智商作为衡量人工智能能力的指标,不仅不合适,甚至可能具有误导性。

牛津大学研究技术与监管的学者桑德拉·瓦赫特在接受采访时表示,尽管用人类的衡量标准来描述人工智能的能力或进步颇具吸引力,但这种做法无异于“苹果与橘子的比较”。她解释说,智商测试本质上是一种相对而非绝对的智力测量方式,在逻辑和抽象推理方面或许有一定的参考价值,但它无法全面反映实际智力,即知道如何让事物运作的能力。

瓦赫特进一步指出,智商测试是基于科学家对人类智力的理解而设计的,因此不能简单地套用到人工智能身上。她以汽车和潜水艇为例,强调这些工具在某些方面超越了人类,但这并不意味着它们拥有更高的智力。人类智力是一个极其复杂的概念,不能简单地将某一方面的性能与之等同。

智商测试的起源可以追溯到备受争议的优生学。参加智商测试的人需要具备强大的工作记忆能力,并熟悉西方文化规范,这为偏见留下了空间。有心理学家甚至将智商测试称为“意识形态上可被操纵的机械智力模型”。

华盛顿大学研究伦理人工智能的博士候选人奥斯·凯斯认为,人工智能在智商测试中表现优异,更多地反映了测试本身的局限性,而非模型的真正实力。他指出,拥有几乎无限内存和耐心的模型很容易“玩弄”这些测试。智商测试作为一种衡量认知、意识和智力的方式,其局限性在数字计算机发明之前就已经被认识到。

伦敦国王学院的研究员迈克·库克也表示,智商测试尽管存在偏见,但它是为人类设计的,旨在评估一般性的问题解决能力,并不适合用于评估以与人类截然不同方式解决问题的技术。他强调,模型在智商测试中可能具有不公平的优势,因为它们拥有海量内存和内化的知识,而且测试往往重复非常相似的模式。

库克还提到,当人类解决问题时,需要应对更多的事情,而且在解决问题时得到的帮助也比人工智能少得多。他以乌鸦使用工具从盒子里取出食物为例,指出这并不意味着乌鸦可以进入哈佛大学。同样地,当人类解决数学问题时,不仅要正确阅读题目,还要避免受到其他思绪的干扰。

AI Now研究所的首席人工智能科学家海迪·赫拉夫在接受采访时指出,我们需要更好的人工智能测试方法。她强调,在计算历史中,我们从未将计算能力与人类能力进行精确比较,因为计算的本质意味着系统一直能够完成超出人类能力范围的任务。这种直接将系统性能与人类能力进行比较的做法是一个相对较新的现象,且极具争议性。

小米再拓欧洲版图:巴黎首家直营门店即将开业 开启法国市场新篇章
近日,小米法国副国家经理“产品逸飞”发文官宣,小米将在巴黎开设首家直营门店。针对网友提问“之前不是在香街有一个吗?”,他进一步回应称,该店为客户运营的授权店,后因疫情因素暂时退出市场。 此前,小米集团总裁卢…

2025-11-15

华为Mate80 Pro Max来袭:自研双长焦加持,配置拉满对标苹果小米!
并且一直在曝光的Mate80系列具体机型也得到了最终确认,首先是依然有4款机型全名华为Mate80 ProMax,这也是继苹果小米之后,又一款Pro Max顶级旗舰。接下来直到发布前,华为Mate80系列还…

2025-11-15

TCL华星全球显示生态大会:四款新品亮相,AI赋能制造,印刷OLED节能显著
智东西11月14日苏州现场报道,今天上午,国内显示产业头部玩家TCL华星召开了自家一年一度的全球显示生态大会(DTC2025),发布了覆盖LCD、OLED和MLED等技术领域的多款旗舰新品,以及《视觉健康白…

2025-11-15

华为Mate 80系列新料:20GB国产内存搭配麒麟9030 配置亮点多
根据近期华为新机规划以及各方爆料,这款机型预计为华为 Mate 80 系列,有爆料称该系列新品将在 11 月 25 日发布。其中,ProMax 并非简单的名称更换,而是定位与 Pro 版差距更大的新增机型…

2025-11-14

全RGB排列屏幕成新趋势,vivo新机或搭载,小米17 Pro Max已率先应用
据CNMO了解,近期发布的小米17 ProMax就搭载了全RGB排列屏幕。凭借超级像素技术,其子像素总数高达938万,与传统2K屏约920万的子像素数量基本持平。 小米总裁卢伟冰曾表示,在友商同级产品纷纷…

2025-11-14

小米斩获国际大奖,OPPO新机参数曝光,荣耀500系列真机设计吸睛
官方放出了荣耀500系列真机的渲染视频,从视频中可以看出荣耀500系列外观设计非常有特点,大家都说像iPhoneAir,甚至有人讲荣耀提前发布“iPhone Air 2”。另外行业信息显示荣耀500全系是…

2025-11-13

iPhone 17系列线上线下热销,苹果2025年有喜有忧未来可期
在此情况下,原本不被看好的苹果 iPhone 17 系列成为一匹黑马,上市后销售极为火爆,尤其是中国市场的表现远超预期:首发 10天销量同比增长 14%,第三季度出货量达 1010 万台,成为头部厂商中唯…

2025-11-13

iPhone16Pro升级iOS26.2beta2实测:续航提升,发热改善,流畅与信号双飞跃
苹果今天凌晨突然发布了iOS26.2第二个预览版,有很多凌晨熬夜更新的小伙伴表示优化非常好,各方面体验要比第一版更好用,也获得了不少老果粉们的认可,那么最适合更新iOS26.2beta2的是哪款机型呢?下面就…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

原DeepSeek核心成员罗福莉加盟小米MiMo团队 疑聚焦世界模型与具身智能领域
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-13