虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

Mindbeam AI发布开源框架Litespark-Inference:让CPU在AI推理中大放异彩

2026-06-17来源:快讯编辑:瑞雪

初创公司Mindbeam AI近日推出一款名为Litespark-Inference的开源人工智能推理框架,通过算法优化使大型语言模型能够在消费级CPU上高效运行,显著减少对GPU的依赖。这一创新旨在解决当前AI推理过程中硬件成本高昂、资源分配不均的问题,为行业提供更具性价比的解决方案。

该框架的核心技术是对“三元模型”的支持。这类神经网络将权重参数限制为-1、0和+1三个值,从而大幅减少推理过程中的乘法运算需求。尽管这种设计会略微降低模型精度,但换来了性能的显著提升和内存占用的大幅下降。官方测试数据显示,在特定硬件配置下,Litespark-Inference的吞吐量较标准PyTorch实现提升17至96倍,内存需求降低超过80%。

Mindbeam创始人Nii Osae指出,现有AI推理流程中,CPU通常仅作为数据中转站,负责将用户输入传递给GPU处理。随着模型规模扩大和硬件成本上升,这种模式在边缘计算等内存受限场景中显得尤为低效。公司认为,广泛存在于各类设备中的CPU是尚未被充分开发的计算资源,通过优化算法可以释放其潜力。

Litespark-Inference提供两种部署模式:开发者可在无GPU的本地硬件上运行语言模型;云服务提供商则能通过非聚合架构实现CPU与GPU的协同工作。这种设计既保持了GPU处理复杂任务的优势,又让CPU承担部分推理负载,从而提升整体系统效率。例如,在处理大量Token时,GPU可专注于核心计算,而CPU负责预处理等辅助任务。

实际测试中,该框架展现了强大的硬件适配能力。在Apple M5处理器上,每秒可处理近40个Token,而PyTorch仅能处理约2.3个;在支持英特尔AVX-512指令的系统上,吞吐量提升96倍,内存消耗从4.6GB降至不足800MB。这些数据表明,Litespark-Inference能有效利用现代处理器的SIMD指令集,包括Arm的NEON SDOT和英特尔/AMD的矢量神经网络指令。

Mindbeam开发的自定义内核可自动检测处理器特性并优化执行路径,目前支持Apple Silicon、Intel和AMD处理器。公司计划未来针对AWS Inferentia等专用云硬件进行进一步优化。源代码已在GitHub公开,社区可进行独立测试和改进。Mindbeam透露将在年内推出云端商业化版本,并将技术扩展至机器人和边缘计算等低功耗领域。

这一框架的推出标志着AI推理领域的一次重要尝试,通过重新分配计算资源,为降低行业成本提供了新思路。其开源特性也鼓励更多开发者参与优化,推动技术生态的完善。随着硬件技术的不断进步,类似方案有望在更多场景中发挥作用,改变传统AI部署模式。

富国国证机器人产业ETF(159272)6月16日涨1.68%,年内份额规模双降
6月16日,富国国证机器人产业ETF(159272)收盘涨1.68%,成交额1.42亿元。 规模方面,截止6月15日,机器人ETF富国(159272)最新份额为21.56亿份,最新规模为20.51亿元。回顾…

2026-06-17

苹果Siri AI与谷歌Gemini深度对决:隐私便利与云端广度的博弈较量
在本地私密数据的理解与执行上,Siri AI展现出压倒性优势。 此次实测揭示了个人计算未来的两条路径:苹果致力于构建安全、深度集成的本地系统协调器,将设备视为私密庇护所;谷歌则打磨普遍可访问的云端超级智能,…

2026-06-17

华为浏览器MAU达3.8亿:AI赋能下内容体验密度升级的长期探索
华为浏览器信息流在技术与分发逻辑之外,内容生产端同样也在联合内容伙伴进行新的尝试。华为浏览器恰好补上了这一环,AI能力能识别用户所处的出行阶段,分发引擎能将专业内容精准推给真正有需求的人,让深度内容不再曲高…

2026-06-17

荣耀X80 Pro Max定档6月22日发布:行业首推免费换屏,耐用性再升级
据IT之家了解,荣耀 X80 Pro Max 除了拥有行业领先抗摔能力,在防水层面,其采用了行业最高规格防水,支持IP68&IP69&IP69K 三重认证,产品可承受最深 10 米浸泡深度,并 10 万次…

2026-06-16

六月科技盛宴:vivo小米新机齐官宣,荣耀抗摔创新高
他表示:4月份发布的REDMI K90 Max 收获了非常多用户的认可,刷新了近一年全渠道 3K-4K 新机首销纪录。就在今天荣耀官宣即将发布的X80 Pro Max支持3米抗摔,这是行业抗摔的新高度。更厉…

2026-06-16

宁德时代曾毓群:固态电池2030年前百万级装车存挑战,技术成熟度仅处4级
曾毓群表示,目前大家都在说固态电池,到底什么是固态电池?只有电解质是全固态的电池叫固态电池。曾毓群表示,固态电池商业化,还是要等着几个重要的科学跟技术问题的突破。 IT之家注意到,宁德时代首席科学家吴凯曾…

2026-06-16

OPPO ColorOS 17将至:凝光动效、光感描边等特性亮相,或随四曲面新机登场
IT之家 6 月 16 日消息,博主 @数码闲聊站 发文,透露 OPPO ColorOS 17将支持全新凝光动效、光感描边、质感模糊、圆角设计等特性。除此之外,该博主此前还透露 ColorOS 17 将于 …

2026-06-16

Marvell美满电子发力光互连,助力AI数据中心跨区域资源统一调度
IT之家 6 月 16 日消息,在被英伟达首席执行官黄仁勋预言成为下一个万亿美元公司后,美满电子 Marvell 在 2026台北国际电脑展期间,提出面向 AI 基础设施的光互连愿景。 在 AI 数据中心需…

2026-06-16