虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

Kimi-k2 thinking模型发布!编程表现出色,IMO数学题求解遇挑战

2025-11-07来源:快讯编辑:瑞雪

月之暗面公司近日正式推出了其最新研发的Kimi-k2 thinking模型,这款具备通用智能体能力和深度推理功能的思考模型,标志着AI技术在复杂问题解决领域迈出了重要一步。该模型通过多轮工具调用机制,能够高效应对编程、数学及逻辑推理等领域的挑战性任务。

作为Kimi K2系列的最新迭代,此次发布的模型在7月11日首发的10000亿参数基础上,通过9月5日发布的Kimi K2-0905版本实现了核心能力升级。新版本不仅强化了智能编码能力,支持256K长文本处理,还将API输出速度提升至每秒60-100Token,并兼容Claude Code技术标准。在定价策略上,基础版每百万输入token(缓存未命中)收费4元,输出收费16元;针对高速运算场景推出的turbo版本,输入价格提升至8元,输出价格达58元。

在实际测试环节,研发团队重点考察了模型在三个关键领域的能力表现。在编程测试中,要求生成包含导航栏、主体展示区及两个特色功能的开源模型分享网站原型。生成的HTML页面不仅完整实现了所有功能模块,搜索框、按钮等交互元素均可正常使用,点击上传模型按钮会弹出文件格式及大小限制提示。整个项目生成耗时约3分钟,消耗9K token,但在多次测试中偶尔出现程序崩溃现象。

数学能力测试选取了2025年国际数学奥林匹克竞赛最具挑战性的第六题。基础版模型经过4分钟运算,在21188字的思考过程中给出了4048的错误答案(正确答案为2112),消耗23.5K token。升级至turbo版本后,虽然运算时间缩短至2分钟,但token消耗量激增至38.5K,且答案依然错误。面对另一道IMO竞赛题时,模型在深度思考10余分钟后停止运算,两次尝试均卡在47000字左右的思考节点未能给出答案。由于缺乏图片识别能力,复杂数学公式的输入成为制约模型表现的瓶颈。

在逻辑推理测试中,模型展现出较强的基础认知能力,能够快速识别并规避常见逻辑陷阱。面对进阶型推理题目时,模型可在1分钟内给出准确答案,单次推理消耗约16.6K token。测试表明,该模型在处理需要多步骤推导的复杂问题时,仍存在运算稳定性不足的问题。

值得关注的是,就在月之暗面发布新模型前两天,阿里云刚推出Qwen 3系列最强推理模型Qwen3-Max-Thinking的早期预览版。两家科技企业接连在智能推理领域发力,反映出当前AI行业竞争焦点正从基础能力建设转向复杂问题解决能力的深度开发。随着智能体技术成为行业主流发展方向,模型的推理运算能力将成为衡量AI实用价值的核心指标。

荣耀GT2来袭:9000mAh大电池配骁龙8E,两千档新机能否逆袭红米?
作为新系列的首款机型,荣耀GT在曝光之初备受期待,被认为是最有希望挑战红米K80地位的产品。 据悉荣耀GT2将搭载骁龙8E处理器,看齐红米K90,而骁龙8E的性能经过一年时间的考验大家已经很清楚了,依然非常强…

2025-11-15

华为顶级旗舰价格大跳水,16GB+512GB直降2100元,为新机让路
这段时间虽然登场了很多新旗舰,但阿维觉得挺遗憾的,因为绝大多数新旗舰都只是常规升级,单纯为了启用第五代骁龙8至尊版和天玑9500,在这种情况下,甚至就连小米17 Pro系列上并不算多大创新的背屏也成为了大家津…

2025-11-15

Apple Store应用6.6版焕新登场:液态玻璃设计带来视觉与交互新体验
2025-11-14 08:20:29 作者:狼叫兽 今日,iPhone与iPad平台的AppleStore应用迎来6.6版本更新,此次更新引入了全新设计的应用图标,并对界面进行了视觉升级,以适配iOS 2…

2025-11-14

高通跃龙IQ-X系列处理器登场 助力工业PC与边缘智能场景革新发展
高通技术公司汽车、工业及嵌入式物联网事业群总经理Nakul Duggal称,高通跃龙IQ-X系列将Qualcomm Oryon CPU的计算性能引入工业PC领域,有助于提升工厂车间边缘控制器的运行能力与…

2025-11-14

谷歌Pixel 6及更新机型获通话录音功能推送,部分非Pixel机型也能享
IT之家 11 月 14 日消息,据科技媒体 Phone Arena 今天报道,谷歌现已为 Pixel 6系列及更新机型推送通话录音功能,部分非 Pixel 系列手机也能用上。 IT之家在此援引 Phone…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

手机电池容量怎么选?联想新机与大疆眼镜选购指南来了
续航方面,moto X70 Air的电池容量为4800mAh,虽然在当前动辄5000mAh甚至6000mAh的中端机中并不占优,但结合机身厚度来看,这一数据仍非常可观,而且该机还支持68W有线快充,可在30…

2025-11-14

百度文库网盘GenFlow3.0焕新升级,推出两大智能体,助力用户成“超级个体”且加速出海
基于GenFlow3.0,文库网盘在多产品矩阵中升级AI能力,帮助用户在工作、生活、学习上成为“超级个体”。基于百度文库全新能力,Oreate采用多智能体架构,能够端到端完成全场景、全模态创作,涵盖文档、P…

2025-11-14

京东11.11平板教育品类齐发力 办公游戏平板热销 智能学习设备受青睐
直播渠道同样表现抢眼,联想小新Pro GT、荣誉平板GT2 Pro、小米平板7 Pro获得观众最多青睐。在新兴的闺蜜机品类中,海信、小度添添、小米占据品牌领先地位,海信大白闺蜜机X8 Pro、小度添添闺蜜机…

2025-11-13