虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

智谱GLM-4.7强势登场:代码推理多模态全升级,国产开源模型新标杆

2025-12-23来源:快讯编辑:瑞雪

在人工智能领域,国产开源大模型GLM-4.7的发布引发了广泛关注。这款由智谱推出的模型,凭借其卓越的技术表现,在全球开源模型中脱颖而出,成为开发者们热议的焦点。从技术指标到实际应用,GLM-4.7都展现出了强大的竞争力,被视为国产模型在智能体工具方向上的重要突破。

在专业编码盲测榜单Code Arena上,GLM-4.7在Web开发方向排名第六,成为全球排名最高的开源模型,超越了GPT-5.2与Claude Sonnet 4.5,稳居国产模型榜首。这一成绩的取得,得益于GLM-4.7在代码、工具调用和推理能力三个方面的显著升级。在代码能力测试中,它在SWE-bench‑Verified和LiveCodeBench‑V6两项基准上分别取得了73.8%和84.9%的高分,整体水平与Claude Sonnet 4.5相当,处于开源模型的第一梯队。在复杂推理任务中,GLM-4.7在HLE(“人类最后的考试”)测试中,工具辅助条件下成绩达到42.8%,较GLM‑4.6提升超过12个百分点,甚至超过了GPT‑5.1 High。工具调用能力方面,GLM‑4.7在τ²‑Bench中拿到87.4%的成绩,BrowseComp在开启上下文管理后提升至67.5%,在多轮网页任务和交互式工具调用场景中表现稳定,进一步巩固了其“智能体向”模型的定位。

GLM‑4.7的内部思考机制也进行了重要调整。在“交错思考”的基础上,引入了保留式思考与轮级思考控制。模型会在每次生成和工具调用前进行推理,并在多轮任务中自动保留已有的思考结果,避免反复从零开始推导。开发者还可以按轮次决定是否启用推理过程,在简单请求中降低时延,在复杂任务中提高稳定性。这种设计增强了长任务执行中的一致性和可控性,为模型在代码智能体、终端任务和工具协同类基准上的整体跃升提供了支撑。模型还针对前端美学、长文本稳定性、网页生成结构等细节进行了优化。

为了验证GLM‑4.7在实际开发任务中的表现,智谱进行了100个真实编程任务的对比测试,覆盖前端开发、后端逻辑和指令遵循三个核心方向。结果显示,在前端任务中,GLM‑4.7相较4.6版本胜率提升至64.6%,在指令遵循场景中达到58.3%,在后端方向胜率稳定在46.7%。除了单点生成能力,GLM‑4.7还强化了多技能联动能力。在Z.ai平台上线的全栈技能环境中,GLM-4.7接入了全新的Skills模块,支持调用ASR语音识别、TTS语音合成、GLM‑4.6V视觉模型等多个模块进行统一调度,实现了工具之间的“调度逻辑”打通。

在实际测试中,GLM‑4.7的表现同样令人印象深刻。在3D控制任务中,GLM‑4.7输出了一段可直接运行的HTML代码,构建了一个由5000多个粒子构成的立体圣诞树场景,并集成了手势识别与UI反馈逻辑。用户可以通过手势控制圣诞树的炸开与收拢,形成照片墙的旋转动画,整个过程流畅自然。在UI生成任务中,GLM‑4.7成功复刻了iOS主界面,图标可点击,功能页可交互,计算器还能进行基础运算,整体体验流畅,图标风格和颜色搭配也具备基本审美。在前端代码实现任务中,GLM‑4.7生成了一个完整的双人格斗游戏界面,高度还原Switch主机的Joy-Con手柄配色和布局,角色逻辑和按键响应完整,具备真实游戏的框架感。

GLM‑4.7的发布,不仅提升了国产开源模型在全球的竞争力,也为开发者提供了更强大的工具。其开源代码在全球社区中已被下载超6000万次,付费API使用量长期居于OpenRouter全球前十,逐步进入开发者的实际工具列表。在智谱即将登陆港交所的背景下,GLM‑4.7的上线标志着国产大模型企业正从科研模型、开源生态向“真实使用”与“市场验证”过渡,开源国产模型正从“对标国际”迈向“领跑、实用”,GLM‑4.7无疑是这一进程中的重要代表。

华为数据存储携手中科弘云 推出AI推理加速方案 赋能多行业应用
该方案深度融合华为 OceanStor A 系列存储、华为 UCM 推理记忆数据管理技术以及中科弘云 HyperCN 平台能力,通过 KVCache 多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流…

2025-12-23

华为nova 15系列及全场景新品发布,影像性能升级成亮点
据介绍, nova 15 Ultra 搭载 双星镜头模组设计,可选好搭紫、带感绿、零度白、幻夜黑四款配色,以及 2.5D 直屏设计,厚度6.8mm,重量约 209g。 与华为 nova 15 Ultra …

2025-12-23

影石Insta360 Wave悬浮设计+AI赋能,解锁会议与多元场景新体验
为全面了解影石Insta360 WaveAI录音全向麦克风的实际表现,我爱音频网对其进行了详细的测试与体验,主要为外观设计、使用体验和数据实测。 有意思的是,影石Insta360 Wave可以与影石Ins…

2025-12-23

《数字市场法案》显成效 欧盟点赞苹果iOS 26.3系统互操作性新提升
《数字市场法案》要求苹果公司向第三方配件开放与苹果自家产品同等的功能权限和设备功能访问权。在 iOS 26.3系统中,欧盟地区的可穿戴设备制造商现已能够测试近距离配对功能和优化后的通知功能。 通知功能 —…

2025-12-23

阿里千问再发力!1999元G1 AI眼镜登场,性能拉满开启亲民新篇章
与S1不同的是,G1不带显示能力,这一方面对近视用户群体更友好,其可以自由选择配镜功能,另一方面也能缩短发货周期,更快铺货。 在吴嘉看来,用户选择夸克AI眼镜,其实相当于选择了阿里巴巴千问大模型和整个阿里巴…

2025-12-23