虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

编程与智能体开发新突破:Claude Sonnet 4.5携多项升级登场

2025-10-01来源:快讯编辑:瑞雪

人工智能领域迎来重要进展,Anthropic公司正式推出新一代AI模型Claude Sonnet 4.5。该模型在编程能力、计算机操作效率等关键指标上表现突出,特别是在处理复杂多步骤任务时展现出持续专注能力,可连续工作超过30小时。

在编程能力评测中,Claude Sonnet 4.5在SWE-bench Verified测试中位居榜首,其真实编程表现获得专业认可。计算机操作能力评估方面,该模型在OSWorld基准测试中取得61.4%的得分率,较四个月前的版本提升近20个百分点。实际演示显示,模型可直接在浏览器环境中完成网站导航、表单填写等全流程自动化操作。

定价策略方面,新模型保持与前代相同的收费标准:每百万输入token收费3美元(约21.4元人民币),输出token收费15美元(约106.8元人民币)。这一稳定的价格体系为开发者提供了可预期的成本控制。

开发工具链迎来重大升级。Claude Code新增检查点功能,支持自动保存工作进度和即时回滚操作。用户通过双击Esc键或输入/rewind命令,即可快速恢复至历史版本。该功能特别适用于复杂代码修改场景,可单独恢复代码、对话记录或两者组合。

终端界面优化带来更好的可视化体验,新增可搜索的指令历史功能。原生VS Code扩展插件的推出,使开发者能在集成开发环境中直接调用Claude Code,通过专属侧边栏和行内差异对比功能,实时监控代码变更过程。

针对企业级开发需求,Claude Agent SDK(原Claude Code SDK)正式开放。该工具包提供核心架构支持,包含情境管理系统和权限框架,新增子智能体与钩子函数支持。开发者可基于这些组件构建定制化智能体流程,适配特定业务场景。

情境管理能力实现突破性进展。新推出的情境编辑功能可自动清理过期工具调用记录,在保持对话连贯性的同时优化token使用效率。记忆工具则构建了基于文件的外部存储系统,允许智能体在多次对话间持续积累知识库,支持跨会话状态维护。

性能测试数据显示,情境管理与记忆工具的协同使用可使复杂任务处理效率提升39%,token消耗降低84%。在100轮网络搜索测试中,情境编辑功能成功完成原本因情境耗尽而失败的任务,展现出显著的技术优势。

专业领域评估证实,新模型在法律、金融、医学等垂直领域的知识掌握和推理能力均有显著提升。安全训练的强化使模型行为模式得到改善,有效减少了谄媚、欺骗等不良倾向。自动化行为审计显示,其总体行为失当评分较前代明显降低。

仅OPPO、vivo内部测试骁龙8 Gen 5 多数厂商青睐旗舰下放芯片
【CNMO科技消息】9月30日,有数码博主爆料,目前仅有OPPO和vivo两家厂商(含子品牌一加、iQOO等)正在内部测试高通新一代次旗舰移动平台——骁龙8Gen 5。其他主流手机品牌则更倾向于采用旗舰下放…

2025-09-30

罗永浩谈小米小字标注争议:行业陋习非小米独有,只是说公道话
罗永浩表示,最近很多人拿这个黑小米,其实这是行业普遍陋习,并非小米独创。 罗永浩进一步表示,“我当年自己做手机的时候,也批评讽刺过很多次,但那个时候我自己也在做手机,所以很多人骂我是‘恶意诽谤友商’,现在我说…

2025-09-30

国产算力驱动创新:“飞翔杯”与“百校计划”共筑AI人才新生态
对于参赛原因,高校组一等奖项目由云到端的AI语音交互引擎——“万物灵”项目负责人姜昊对集微网表示,“我们是一个以技术和产品为主导的学生研发团队,能够较早洞察到技术的最新突破和创新应用,这次‘飞翔杯’挑战赛给…

2025-09-30

华为超薄新机将至:搭载全新麒麟芯片与eSIM,2TB版本对标苹果iPhone Air
IT之家 9 月 30 日消息,博主 @智慧皮卡丘 发文,透露搭载“全新麒麟芯片和 eSIM的超薄手机”正在测试中,相应机型将提供“超大杯”2TB 版本,号称“全面对标”,预计该机系华为旗下产品,将对标同样…

2025-09-30

高通骁龙新平台:以强大算力与智能设计,引领智能体AI时代新篇
该公司发布了两款旗舰处理器——面向智能手机的骁龙8 Elite Gen 5和面向PC的骁龙X2Elite,这些产品不仅推动了性能和效率的提升,还有望成为新一类AI驱动个人智能体的基础。该公司的骁龙8 Eli…

2025-09-30

DeepSeek-V3.2-Exp模型开源上线 稀疏架构助力效率提升API降价超五成
【环球网科技综合报道】9月29日,据DeepSeek官方消息,DeepSeek-V3.2-Exp大语言模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升推理效…

2025-09-30

余承东履新华为IRB主任:聚焦AI战略,引领资源向核心目标倾斜
9月29日,据网易科技今日报道,华为公司今天任命余承东正式增任公司产品投资评审委员会(IRB)主任,该任命由任正非签发。此次履新后,余承东将同时执掌常务董事、终端BG董事长与IRB主任三大职务。目前余承东的微…

2025-09-30

OPPO Find X9系列10月16日登场:哈苏影像加持,性能续航全面进阶
2025年9月30日,OPPO官微发布消息称,OPPO Find X9系列暨智能生态旗舰新品发布会将于10月16日19:00举办,其中OPPOFind X9系列影像旗舰,定位OPPO哈苏画质王,致力于成为新…

2025-09-30

华为三款新机入网:Mate 80系列或配100W快充与麒麟9系芯片,nova 15影像升级
CNMO猜测,华为nova 15将在影像方面得到较大提升,而Mate 80系列将搭载最新款麒麟芯片。性能方面,Pro及以上版本搭载麒麟9030处理器,全系或配备支持100W有线充以及80W无线充的6000mA…

2025-09-30

AMD Instinct MI450X逼近,英伟达Rubin产品规格调整应对竞争
Instinct MI450X最初TGP是2300W,后来AMD调高至2500W,以进一步提升性能。外界普遍认为,英伟达在Rubin产品量产前的最后阶段提出这样的要求,显然是感受到Instinct MI45…

2025-09-30