虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

商汤科技携手南洋理工发布NEO架构 开启原生多模态模型新篇章

2025-12-03来源:快讯编辑:瑞雪

商汤科技与南洋理工大学S-Lab联合研发的多模态模型架构NEO正式发布,并同步开源2B与9B两种参数规模的模型。这一突破性成果为多模态大模型领域带来全新范式,其核心架构通过底层创新实现了视觉与语言模态的深度融合,在数据效率、性能表现及部署成本等关键指标上达到行业领先水平。

传统多模态模型普遍采用"视觉编码器+投影器+语言模型"的模块化设计,这种基于大语言模型扩展的方案虽能处理图像输入,但本质仍以语言为中心。商汤科技指出,此类架构存在三大缺陷:数据层面浅层融合导致学习效率低下,图像细节捕捉能力受限,复杂空间结构理解困难。例如在需要精准识别物体位置关系或动态场景的场景中,传统模型往往表现乏力。

NEO架构通过三项底层创新实现模态融合的质变。其独创的原生图块嵌入技术(Native Patch Embedding)摒弃离散图像分词器,通过连续映射机制从像素级构建视觉表征,使模型能捕捉到比传统方法精细4倍的图像细节。在位置编码方面,原生三维旋转位置编码(Native-RoPE)创新性地解耦时空频率分配,为视觉模态分配高频信号、语言模态分配低频信号,这种设计使模型天然具备处理视频流和跨帧信息的能力。

注意力机制层面,原生多头注意力(Native Multi-Head Attention)突破传统框架,在统一架构中同时实现文本的自回归注意力与视觉的双向注意力。这种设计使模型在处理图文混合任务时,空间关联利用率提升37%,特别在需要理解物体遮挡关系或动态轨迹的场景中表现突出。配合Pre-Buffer&Post-LLM双阶段训练策略,模型在保持语言推理能力完整性的同时,视觉感知能力实现指数级增长。

实测数据显示,NEO架构展现出显著优势:在数据效率方面,仅需3.9亿图像文本样本即可达到顶尖视觉理解水平,数据需求量仅为同类模型的1/10;性能测试中,在MMMU、MMB等五大权威基准测试中均取得最优成绩;部署成本方面,0.6B-8B参数规模的模型在边缘设备上的推理速度提升2.3倍,特别适合移动端和物联网设备部署。商汤已开放基于NEO架构的模型下载,开发者可通过开源社区获取完整代码与训练框架。

2025年Q3中国平板市场:华为出货增21%领跑,苹果iPad出货量下滑14%
快科技12月2日消息,今天,Omdia最新发布了2025年第三季度中国平板电脑市场数据,整体出货量达880万台,同比增长9%。 与之形成对比的是苹果,该季度iPad出货量降至200万台,市场份额收缩至23%,…

2025-12-03

亚马逊重磅推出Trainium3芯片:性能飙升4倍 能效增40% 下一代Trainium4将兼容英伟达技术
此外,AWS 表示,数千台 UltraServer 可相互连接,构建出搭载最多 100 万颗 Trainium3 芯片的超大规模集群,这一规模是上一代系统的 10 倍。通过支持 NVLink Fusion,…

2025-12-03

飞腾腾锐D3000M笔电中标国有大行项目 推动金融信创迈向新高度
飞腾腾锐 D3000M 开发有旗舰版、标准版、桌面版等多个版本,能够被广泛适配于笔记本电脑、台式机、一体机、云笔电、MiniPC、平板电脑等多种终端形态,成为信创主流终端的共用算力底座。 金融行业是信创建…

2025-12-03

谷歌革新安卓更新模式:一年双更,安卓16新版本亮点功能齐登场
IT之家 12 月 3 日消息,科技媒体 Ars Technica 昨日(12 月 2 日)发布博文,报道称谷歌面向 Pixel 10系列等手机和平板,推送了 2025 年度第 2 个安卓 16 系统更新,…

2025-12-03

2025年11月安卓手机好评榜揭晓:努比亚登顶 华为TOP5占三席
快科技12月3日消息,昨晚,安兔兔公布了2025年11月安卓手机好评榜TOP10。 数据显示,努比亚Z80 Ultra以99.99%的近乎满分好评率登顶榜首,而华为Mate系列则成最大赢家——TOP5中独占3…

2025-12-03