虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌新推Gemini 2.0 Flash Thinking:能否成为AI推理新标杆?

2024-12-20来源:ITBEAR编辑:瑞雪

谷歌近期发布了一款名为Gemini 2.0 Flash Thinking Experimental的新型人工智能推理模型,但该模型仍处于实验阶段,根据初步测试,其性能仍有待提升。

这款新模型在谷歌的AI原型平台AI Studio中可供使用,其全称略显冗长,但功能定位明确:专注于多模态理解、推理及编码,尤其擅长解决编程、数学和物理等领域的复杂问题。AI Studio的产品负责人Logan Kilpatrick在平台上的一篇帖子中,将Gemini 2.0 Flash Thinking Experimental描述为谷歌在推理技术探索上的初步尝试。

谷歌DeepMind的首席科学家Jeff Dean也在个人帖子中透露,这款模型经过特殊训练,能够通过思维强化其推理能力。他表示,当增加推理时间计算时,模型展现出了令人鼓舞的成果。这里的推理时间计算,指的是模型在解决问题时所需的计算资源。

Gemini 2.0 Flash Thinking Experimental是基于谷歌之前发布的Gemini 2.0 Flash模型构建的,其设计理念与OpenAI的o1等推理模型相似。这类推理模型与其他人工智能的一大区别在于,它们能够进行有效的自我事实核查,从而避免陷入一些常见的人工智能陷阱。然而,推理模型通常需要更长的时间(几秒到几分钟不等)来得出解决方案。

在使用时,Gemini 2.0 Flash Thinking Experimental会在接收到提示后暂停片刻,然后考虑一系列相关提示,并在此过程中解释其推理过程。经过一段时间后,模型会给出它认为最准确的答案。但在实际测试中,这款模型也并非无懈可击。例如,当被问及单词“strawberry”中有多少个R时,它错误地回答了两个。

自OpenAI发布o1以来,谷歌并非唯一一家在推理模型领域发力的公司。许多竞争对手的人工智能实验室也纷纷推出了自己的推理模型。例如,由量化交易员资助的人工智能研究公司DeepSeek在11月初发布了其首个推理模型DeepSeek-R1的预览版。同月,阿里巴巴的Qwen团队也宣布了他们所谓的首个o1公开挑战者。

据彭博社10月份的报道,谷歌内部有多个团队正在致力于推理模型的开发。而The Information在11月份的报道中进一步透露,谷歌至少有200名研究人员专注于这项技术。这一趋势反映出业界对于改进生成式人工智能技术的迫切需求。然而,传统的扩展模型技术已经逐渐失效,难以再带来显著的改进效果。

尽管推理模型在基准测试中表现出色,但并非所有人都认为这是最佳的发展方向。一方面,推理模型的价格昂贵,因为它们需要大量的计算能力来运行。另一方面,尽管这些模型在基准测试中取得了不错的成绩,但它们能否保持这种进步速度仍然是一个未知数。

业界对于推理模型的探索仍在继续。谷歌的Gemini 2.0 Flash Thinking Experimental只是众多尝试中的一次。随着技术的不断进步和竞争的加剧,我们有理由期待未来会有更多创新性的推理模型涌现。

然而,对于当前的推理模型而言,它们仍然面临着诸多挑战和未知。如何在保证性能的同时降低成本,如何保持持续的进步速度,以及如何更好地应用于实际场景中,都是未来需要解决的问题。

苹果小米新机首月销售亮眼:iPhone 17与小米17齐头并进创佳绩
IT之家 11 月 15 日消息,市场调查机构 CounterPoint Research 昨日(11 月 14 日)发布博文,基于最新中国智能手机周度销量追踪报告,苹果与小米凭借各自的旗舰新品,在上市首月的…

2025-11-15

华为Mate X7或本月登场 首发20GB超大内存 配色丰富性能强劲
11月份的机圈将会是华为的主场,不仅新一代的直板旗舰华为Mate80系列会震撼亮相,还会有迭代的大折叠屏手机华为Mate X7发布。@定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史…

2025-11-15

苹果联名iPhone Pocket:争议中售罄,高价能否续写品牌忠诚传奇?
苹果与日本时尚品牌三宅一生日前联名推出的iPhone Pocket(iPhone 口袋)11月14日正式开售,1299元至1899元的定价引发全网热议,成为科技圈与时尚圈跨界合作的又一争议焦点。尽管争议不断,…

2025-11-14

iPhone 17系列上市两月中国市场激活破千万,配置亮眼预售火爆
2025年11月14日,知名数码博主“数码闲聊站”爆料称,iPhone 17系列于本周完成中国市场激活超1000万台。 据了解,iPhone 17系列于2025年9月10日苹果秋季发布会推出,含标准版、Air…

2025-11-14

中芯国际三季度业绩亮眼:月产能破百万,全年收入或创新高
赵海军指出,中国区收入的显著增长主要受益于国内产业链自主化进程加快,为应对客户紧急需求,公司及时优化了产能分配策略。赵海军补充表示,在当前国内企业加速替代海外供应链的背景下,公司长期合作的客户成功把握了市场机…

2025-11-14

iPhone17系列销售势头猛 本周国内激活量或冲破1000万台大关
【CNMO科技消息】11月14日,据数码博主爆料称,iPhone17系列国内激活量将于本周突破1000万台。截至11月2日,该系列在国内的激活数量已突破825万台,其中iPhone 17 Pro Max约3…

2025-11-14

小尺寸也有大能量!vivo X300全方位体验测评
测试中平均帧率为61帧,5% Low帧为60帧,全程几乎没有变化——小屏机的游戏性能完全不需要担心。 续航测试,vivo X300从100%到20%的电量区间内连续运行了6小时54分,对于小尺寸机型来说是合…

2025-11-14

2025年游戏手机大比拼:OPPO Find X9、红魔10 Pro、一加13谁更胜一筹?
如果你是追求极致游戏体验,对游戏性能、续航和散热都有极高要求的重度游戏玩家,那么 OPPO Find X9 系列是你的首选。 而如果你想要一款配置较为均衡,在游戏性能、屏幕显示和续航等方面都有不错表现的手机…

2025-11-13

华为PC业务双线并行:鸿蒙PC加速突破,智选PC延续Windows生态
11月13日消息,虽然有了鸿蒙PC,但华为似乎短期并不想放弃Windows系统。 有博主给出的消息显示,华为在PC业务上仍将维持“鸿蒙PC”与“智选PC”双线并行的策略,短期内不会放弃基于Windows系统的…

2025-11-13