虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

蚂蚁百灵大模型Ling-2.6-flash发布:技术优化提效 免费API助力开发者体验

2026-04-23来源:快讯编辑:瑞雪

蚂蚁集团旗下百灵大模型近日正式发布Instruct模型Ling-2.6-flash,该模型总参数量达104B,激活参数为7.4B。这款新模型在技术路径选择上突破传统框架,通过优化推理效率、Token使用效率及Agent场景适配性,构建起差异化的技术优势。其核心架构创新与场景化设计,使其在同类模型中展现出显著竞争力。

技术团队在架构设计上采用混合线性计算模式,通过底层计算单元的重组优化,使模型在4卡H20硬件环境下实现340 tokens/s的推理速度,Prefill吞吐量达到Nemotron-3-Super的2.2倍。这种设计突破了单纯依赖模型规模提升性能的路径,在保持智能水平的同时,将硬件资源利用率提升至新高度。在Token效率方面,研发团队通过动态输出校准机制,使模型在Artificial Analysis评测中仅消耗15M tokens即达成目标,用量仅为同类模型的十分之一。

针对企业级应用需求,模型特别强化了Agent场景能力。通过优化工具调用接口、多步骤任务拆解算法及执行链路容错机制,Ling-2.6-flash在BFCL-V4、TAU2-bench等权威评测中,与参数规模更大的模型展开正面竞争,仍取得领先或持平的优异成绩。特别是在复杂任务执行环节,其表现已达到同尺寸模型的行业标杆水平。

为降低开发者使用门槛,百灵大模型同步推出双重接入方案。即日起在OpenRouter平台及官方渠道提供为期一周的免费API调用服务,后续采用阶梯计价模式:国际版输入0.1美元/百万tokens,输出0.3美元/百万tokens;国内版输入0.6元/百万tokens,输出1.8元/百万tokens,并保留每日50万tokens的永久免费额度。缓存命中场景下,国际版按20%比例收取0.02美元/百万tokens的费用。

开源计划方面,技术团队透露BF16、FP8、INT4等量化版本将于近期陆续开放下载。这些版本在保持核心性能的同时,将硬件适配门槛降低60%以上,特别适合边缘计算设备部署。此次开源策略覆盖从研发到落地的全链条需求,为不同规模的企业提供灵活的技术选择空间。

OPPO Find X9 Ultra影像深度评测:双两亿像素与10倍长焦的极致影像体验
固守双长焦方案、双两亿像素、如约而至的外挂增距镜头…在初步体验后,我们认为这也许是 OPPO 最能打的一年。 在 OPPO Find X9Ultra 上,OPPO 打造了一套以 5000 万像素为基底,2…

2026-04-22

OPPO Find X9s Pro深度评测:轻薄机身下的全能旗舰新标杆
作为OPPO Find X9s Pro的核心卖点,这套双2亿像素哈苏影像系统堪称“王炸配置”——主摄与潜望长焦均采用2亿像素传感器,这在目前Pro档位机型中独一份,搭配哈苏专业调校与第二代丹霞色彩还原镜头,…

2026-04-22

REDMI Book Pro 2026深度评测:卓越工艺加持,性能续航双突破成新标杆
这次REDMI Book Pro拥有2个不同的尺寸,分别是14英寸和16英寸,本次我们拿到的为14英寸版本,这款笔记本电脑配色为晴空蓝,这款蓝色是淡淡蓝色,配合上全金属的一体化压铸机身,做工非常出色,经过精…

2026-04-22

三星与JR东日本合作:海外Galaxy手机将支持樱花卡,访日旅行更便捷
IT之家 4 月 21 日消息,三星电子日本今天宣布与 JR 东日本(东日本旅客铁道)达成合作,目标是在 2027 年上半年,让海外发售的Galaxy 手机支持“Welcome Suica Mobile”樱…

2026-04-22