虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

苹果芯片助力突破:开发者用MacBook Pro成功运行209GB超大AI模型

2026-03-21来源:快讯编辑:瑞雪

近日,开发者Dan Woods在一台配备M3 Max芯片和48GB统一内存的MacBook Pro上,成功运行了规模达209GB的Qwen3.5-397B人工智能模型。这一突破性成果打破了传统认知——该模型参数规模通常需要数据中心级硬件支持,而此次在消费级设备上的实现速度超过每秒5.5个Token,为端侧AI应用开辟了新可能。

该模型原始文件占用磁盘空间209GB,压缩后仍需120GB存储空间。传统方案需将数百亿参数全部加载至内存,远超普通笔记本电脑的硬件极限。Woods通过创新技术路径突破物理限制,其核心方法借鉴了苹果2023年发布的《闪存中的大语言模型》研究论文,采用"闪存-内存协同计算"架构,将模型参数存储于高速NVMe固态硬盘,通过动态数据块调度实现按需加载。

苹果芯片的统一内存架构在此过程中发挥关键作用。这种将CPU、GPU与内存深度整合的设计,使得数据传输效率较传统分离式架构提升数倍。Woods特别优化了Qwen模型的混合专家(MoE)架构特性,通过将每次推理激活的专家模块数量从10个减少至4个,在保持模型核心性能的同时,将内存需求降低60%以上。开发者Simon Willison分析指出,这种策略使活跃权重可直接从闪存读取,有效平衡了性能与资源消耗。

项目实现过程中,AI工具发挥重要作用。Woods将苹果技术论文输入Claude Code智能助手,通过自动化研究模式进行90次迭代实验,最终生成针对苹果芯片优化的MLX Objective-C和metal底层代码。这种人机协作模式显著提升了开发效率,相关技术细节与测试数据已在GitHub平台完整开源,包括内存管理策略、数据块调度算法等核心模块。

此次突破验证了消费级设备运行超大规模模型的可行性,为AI应用从云端向终端迁移提供了新思路。虽然当前实现仍需依赖高速固态硬盘,但其展示的技术路径为后续硬件优化指明了方向。随着存储介质性能提升与算法持续改进,未来在普通笔记本电脑上运行千亿参数模型或将成为现实。

华为Mate80 Pro Max风驰版来袭!内置主动散热,今日12:08开启全渠道预定
个人认为,Mate80 Pro Max风驰版在具体配置上,会和普通版有所不同,毕竟两款机型的定位不同,风驰版以性能为先。 当天正好是华为春季全场景发布会的时间,所以华为应该会在3月23日的发布会上,介绍Ma…

2026-03-20

华为春季全场景发布会将启 手机汽车穿戴等多领域新品齐亮相
从目前披露的信息来看,本次发布会或将延续华为“1+8+N”的全场景战略布局,在手机、汽车、智能生态三大核心赛道同步发力。这种将专业潜水功能与卫星通信能力集成于腕间的做法,体现了华为在高端穿戴领域的技术积累。 …

2026-03-20

阿里云宣布2026年调价:真武810E算力卡最高涨34%,CPFS智算版涨30%
值得一提的是,真武810E是平头哥旗下首款云端AI芯片,采用自研并行计算构架和片间互联技术,配合全栈自研软件栈,实现了软硬体全自研。阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云完…

2026-03-20

AMD发布Adrenalin 26.3.1驱动:FSR 4.1加持,RX 9000系列画质帧率双提升
IT之家 3 月 20 日消息,AMD 昨日发布 Adrenalin Edition 26.3.1 显卡驱动,核心亮点是面向 RX 9000系列显卡,引入支持 FSR 4.1 技术,通过机器学习(ML)方式…

2026-03-20

谷歌推出安卓侧载新机制:多重验证加24小时冷却期保障安全
谷歌基于社区与极客用户的反馈,同时为兼顾开放性与安全性,公布了一项名为“高级流程”的新机制,让高级用户在评估风险的前提下,继续安装来自未经验证开发者的侧载应用,同时大幅提升了防范网络诈骗的安全底线。 完成上…

2026-03-20

英伟达黄仁勋呼吁:科技领袖勿散布AI恐慌 助力技术稳健前行
来源:环球网 【环球网科技综合报道】据彭博社3月20日消息,英伟达首席执行官黄仁勋在公司技术大会的小组讨论中公开表态,呼吁科技行业领袖避免散布人工智能恐慌言论,同时回应了Anthropic与五角大楼的合同谈…

2026-03-20