虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

后摩智能倪晓林WISE2024演讲:NPU将如何重塑端边AI设备新时代?

2024-12-02来源:ITBEAR编辑:瑞雪

近日,北京迎来了一场商业领域的盛事——36氪WISE2024商业之王大会。此次大会为期两天,吸引了众多业界精英和领军人物,共同探讨中国商业的新趋势和潜力。作为已经举办了十二届的商业盛会,WISE大会在时代变迁中持续见证着中国商业的坚韧与活力。

2024年,是一个充满变化与挑战的年份。与前十年相比,商业环境变得更加复杂,企业发展步伐放缓,更加注重稳健和理性。同时,这一年也是寻找新经济动力的重要时期,产业变革对各个主体的适应能力提出了更高要求。今年,WISE大会以“Hard But Right Thing(正确的事)”为主题,引发了与会者对当前商业环境下何为正确路径的深入思考和交流。

在大会的众多精彩演讲中,「后摩智能」副总裁倪晓林的分享尤为引人注目。他围绕AI与NPU的发展,探讨了边端侧AI算力需求的变化趋势,为听众带来了深刻见解。

倪晓林首先介绍了「后摩智能」作为一家基于存算一体的AI芯片公司的背景,并表示作为AI时代的参与者和见证者,深感荣幸。随后,他详细阐述了后摩智能对边端侧AI算力需求变化的看法。

他提到,随着AI 2.0时代的到来,云端模型和端边侧模型都在迅速发展。云端模型不断增大规模和参数,探索通用智能的边界;而端边侧则出现了更适合本地部署的模型,如7B、13B、30B等,这些模型更适合应用于各行各业,解决实际问题。端边侧AI具有个性化、低时延、数据隐私保护等优势,且每年全球新增智能设备数量高达数十亿台,市场前景广阔。

然而,端边侧AI的发展也面临着硬件方面的挑战。倪晓林指出,端侧硬件需要满足“三高三低”的要求,即高算力、高带宽、高精度、低功耗、低延时、低成本。CPU无法满足全部需求,而GPU虽然能满足部分要求,但其高成本和高功耗限制了端侧设备的普及。因此,专为本地大模型设计的NPU更适合边端侧使用。

针对边端设备对AI高带宽、低功耗的需求,传统的冯·诺伊曼架构已经难以应对。倪晓林表示,存储墙和功耗墙是当前企业面临的两大难题。为了突破这两大难题,后摩智能采用了存算一体的全新架构,实现了存储单元和计算单元的高度集成,大幅降低了功耗,增加了带宽。

后摩智能已经自研了两代存算一体芯片架构,并针对LLM类大模型进行了专项设计。其自研的IPU架构提供了高并行的浮点和整型算力,配套的软件工具链简单易用,兼容通用编程语言。后摩智能还推出了后摩鸿途®️H30和后摩漫界®️M30两款NPU芯片,充分展现了存算一体架构在算力和功耗方面的优势。

为了方便AI设备方案商及生产商快速部署,后摩智能不仅提供芯片,还提供多种标准化产品形态,如力谋®️LM30智能加速卡和力谋®️SM30计算模组等。这些产品可以让现有各类终端设备通过标准接口加装NPU,实现本地AI大模型的流畅运行。

倪晓林表示,随着AI技术的不断发展,越来越多的设备将成为AI大模型使能设备,如AI PC、汽车AI座舱、AI TV等。这些设备将成为更懂用户、更聪明、更高效的助理、秘书、司机等,为用户提供各种服务。后摩智能希望通过其AI芯片助力各行业实现快速升级。

倪晓林还透露,后摩智能将在2025年推出基于新一代“天璇”架构的最新款芯片,性能将再次大幅提升。这款芯片有望进一步加速端边设备部署大模型的进程。

在演讲的最后,倪晓林表示,他相信未来十年将是AI大模型的时代,NPU将重塑所有端边场景和设备。他期待与在座的AI企业和生态合作伙伴携手合作,共同推动现有设备以及未来新型设备流畅运行AI大模型,共创AI新时代。

Meta首席AI官汪滔:13岁少年应全力投入氛围编程,把握未来经济优势
“如果你现在大概 13 岁,就应该把所有时间都用在氛围编程上,这就该是你的生活方式。”在加入 Meta 后的前 60 天里,他就组建了一支约100 人的实验室。 IT之家从报道中获悉,在汪滔看来,氛围编程并…

2025-12-21

摩尔线程亮剑全功能GPU!新架构能效跃升10倍,国产推理性能破纪录
智东西12月20日报道,今日,摩尔线程在首届MUSA开发者大会2025上公布全功能GPU技术路线图,并一连亮出“10张王牌”:新一代全功能GPU架构「花港」、即将发布的AI训推一体芯片「华山」与高性能图形渲…

2025-12-21

iOS 26.2正式版已至!iOS 26.3测试版将“暂歇” 26.4新功能值得期待
苹果在上周向用户推送了 iOS 26.2 正式版系统更新,同时也按照惯例,现在则关闭了上一个 iOS 26.1 版本的系统验证。目前,已经升级到 iOS 26 系统的 iPhone 用户,可选择的系统版本…

2025-12-21

摩尔线程发布“花港”架构及多款新品,以MUSA生态剑指英伟达
摩尔线程在经营模式、产品体系和发展方向上,也一直对标着英伟达,尤其是在生态和基础算力设施构建、对物理AI的布局、高毛利率等方面,相比于“国产GPU四小龙”中,以及宣布赴港IPO的壁仞科技等公司来说。 张建中…

2025-12-21

荣耀WIN系列即将登场!全系10000mAh直屏 芯片影像各有亮点
日前荣耀WIN系列官宣将于12月26日14:30发布,主打「超神性能双旗舰」,分为荣耀WINRT和荣耀WIN两款型号,全系采用直屏➕背部刀锋之眼Deco设计,雾面金属中框,提供指定赢(银)、 快开黑、不怕蓝…

2025-12-20

摩尔线程MDC 2025发布新架构及产品,张建中:性能追赶国际,国产算力生态加速构建
摩尔线程创始人、董事长兼CEO张建中在两个多小时的演讲中,发布了新一代GPU架构,以及多款产品,力图构建起更为完善强大的国产算力生态。 摩尔线程的元计算统一计算架构MUSA迭代至5.0,在全栈统一性、极致效…

2025-12-20

豆包视频模型进化至新境界,网友创意视频从此“声”动有趣
大伙都知道,以前国内大部分视频模型只能演默片,而现在,豆包的声音和画面已经配合得出神入化了。除了图生视频,咱还可以直接不给图,让豆包文生视频,这考验的就是豆包的想象力了。 而且,你也不需要有大导演级别的用…

2025-12-20