虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

冷静文论道:大模型未来需芯片、系统厂商携手共进

2025-04-30来源:ITBEAR编辑:瑞雪

近期,上海交通大学与AI Infra领域的创新企业魔形智能携手,在国际高性能计算机架构研讨会HPCA 2025上发表了一篇题为《VQ-LLM: 高性能向量量化增强的大语言模型推理代码生成》的论文。该研究提出了一种名为VQ-LLM的框架,通过引入分层代码本缓存和代码本中心计算引擎两大创新技术,实现了超过50%的推理延迟降低,性能超越了传统逐元素量化方法。

VQ-LLM框架的成功,为向量量化技术在大语言模型中的实际应用提供了切实可行的方案。在保持模型高精度的同时,显著提升了推理效率。这一突破不仅解决了大模型计算量大、存储空间需求高的难题,还为向量量化技术的未来发展开辟了新的道路。

上海交通大学计算机科学与工程系教授冷静文是此次论文工作的主要负责人。冷静文教授自2010年从上海交通大学获得学士学位后,于2016年在德州大学奥斯汀分校获得电子与计算机工程系博士学位,专攻GPU处理器体系结构优化。目前,冷静文教授及其团队的研究兴趣集中在芯片架构和硬件互联方面,特别是数据流芯片设计和超节点高速互联域的硬件设计。

在谈到此次与魔形智能的合作时,冷静文教授表示,大模型压缩是当前热门的研究方向,但传统的单元素量化方法存在局限性。向量量化技术通过挖掘元素间的相关性,能够实现更高效的压缩,同时保持模型的精度。此次合作将向量量化技术应用于大语言模型,取得了显著的成果。

冷静文教授还分享了团队在数据流芯片研究方面的进展。他认为,当前GPU的红利已经接近尾声,未来芯片的架构和编程方法需要新的思考。数据流芯片作为一种创新的架构,有望解决当前芯片设计中的一些瓶颈问题。冷静文教授及其团队正在致力于构建数据流芯片的抽象模型和编程语言,以降低学习成本并推动其广泛应用。

在谈到国产芯片的发展时,冷静文教授表示,国产芯片厂商需要摆脱对英伟达等国外厂商的依赖,进行原创性思考。他认为,国产芯片厂商应该注重生态的构建,同时解决高带宽内存设计等问题。冷静文教授还提到了英伟达H20芯片出口受限对国内的影响,并建议国内芯片厂商考虑采用CXL互联方式或3D堆叠芯片等技术来缓解HBM的需求。

冷静文教授还分享了团队在大型模型优化方面的经验。他认为,系统的优化方法可以指导大模型的设计,特别是需要找到系统当前的瓶颈并结合模型的特点进行联合设计。冷静文教授还提到了NSA等前沿工作,认为这些工作为模型设计带来了新的思考,即将效率优先的原则带入到模型结构中去。

在谈到向量量化技术的未来应用时,冷静文教授表示,目前向量量化主要用于推理阶段,但未来可以考虑将其与训练过程相结合,以实现更高效的模型压缩和加速。冷静文教授还提到了DeepSeek等前沿工作对大模型量化的挑战和机遇,认为这些工作为向量量化技术提供了新的思路和方法。

冷静文教授及其团队的研究成果不仅在学术界引起了广泛关注,也在行业内产生了深远影响。目前,论文中提出的VQ-LLM框架已经正在被相关产品所采用,为推动大语言模型的广泛应用和性能提升做出了重要贡献。

冷静文教授还强调了芯片、系统和模型厂商之间的协同合作对于推动大模型进一步发展的重要性。他认为,在新的模型架构设计、模型小型化和轻量化等方面,芯片、系统和模型厂商可以发挥各自所长,共同推动大模型的广泛应用和性能提升。

AI迎“效果涌现时刻”,李彦宏:AI产业结构正转变为健康的“倒金字塔”
“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”11月13日举办的2025百度世界大会上,百度创始人李彦宏演讲时表示,更应关心如何让AI跟每一项任务有机结合,“让AI成为企业发展和个人成长的

2025-11-13

网友苦等新机只为一加15 李杰回应:等待终有回报,165帧游戏体验即将登场
快科技10月23日消息,有网友给一加中国区总裁李杰留言:前面那么多新机都没买,就一直等着一加15。李杰回复:“等等党不会输”。 从120帧到165帧,游戏帧率的突破不仅是参数上的跃升,更是手游体验的一次大换代…

2025-10-23

一加新机或携8200mAh大电池、165Hz高刷及骁龙8Gen 5登场,1999元起性价比拉满
在定位方面估计会比ace 6标准版更低一些,所以价格会更便宜,如果延续v机型的定价,那这款手机很有可能定在1999元左右,有骁龙8Gen 5旗舰处理器+8200mAh电池+百瓦快充,定在这个价格那性价比还是…

2025-10-23

OpenAI首款内置ChatGPT浏览器Atlas发布!支持谷歌数据导入,免费下载享7天会员
智东西下载初步体验了Atlas后发现,其基本的操作模式与谷歌等浏览器类似,相当于将ChatGPT直接嵌入浏览器,且从功能来看Atlas与其他AI浏览器并没有较大差距,或许还需要体验一段时间,当其拥有更多浏览…

2025-10-23

华为11月新品发布在即,Mate 80系列、折叠屏X7及nova 15系列将齐登场
【CNMO科技消息】10月21日,CNMO注意到,据业内人士透露,华为计划于11月迎来新一轮产品发布高峰,将推出涵盖智能手机、平板电脑及穿戴设备在内的多款新品。结合以往发布节奏分析,行业媒体推测,华为Mate…

2025-10-22

真我GT8系列即将登场:双旗舰配置亮点大揭秘,影像性能全面升级
除了影像,真我 GT8 Pro 在其他方面的配置也达到了顶级旗舰水准。 最引人注目的是,真我 GT8 标准版搭载了与 Pro 版本同款的理光GR 影像系统,这意味着它拥有同级别产品中唯一的影像联名,在影像…

2025-10-22

双11邂逅秋景,华为Pura 80 Pro降价1200元,影像实力等你来探
说起今年双11,各家影像手机可以说争奇斗艳,但有一款手机可以说是十分低调的,这就是6月份登场的华为Pura80系列,目前市场表现还没发挥出全部实力。 环顾现在新品影像旗舰,主摄1英寸的,可能还是Pura 8…

2025-10-21

华为Mate80系列完成备案预计11月登场,全系或配麒麟9030芯片及鸿蒙6系统
其中 Mate 80 标准版代号代号“Voyager”,拥有黑、白、青绿三种配色。 在此前的华为平板产品上,华为已批量下放麒麟 9020系芯片,Mate 80 系列则有望搭载全系的麒麟 9030 芯片以及鸿…

2025-10-21

7000mAh大电池配2K三星屏,潜望长焦加持,iQOO 15起售价4199元真香?
子系旗舰的综合配置看起来比主系旗舰还更高,这上市的iqoo 15就是个典型例子,电池同样提升到7k以上,并补齐了无线充电,作为旗舰手机这金属中框、超声波指纹、IP68/IP69级别防尘防水都是标配,还补齐了…

2025-10-21

今晚七点!iQOO 15携骁龙8至尊版等重磅升级登场,性能体验再进阶
将在今晚七点正式发布的iQOO 15除了首批更新第五代骁龙8至尊版处理器以外,更迎来了屏幕、独显芯片、续航、散热等重大升级,下面的爆料汇总值得一看。据悉,它还将在散热、视听触等方面全方位优化,通过搭载全新升级…

2025-10-21