在探讨全球大模型技术发展趋势的浪潮中,腾讯云北区云原生业务的领军人物田丰与MiniMax公司的副总裁刘华,携手与36氪等媒体进行了深入交流。此次对话不仅涵盖了技术的最新进展,还触及了商业化的多重视角,揭示了两者合作背后的深远意义。
展望未来,MiniMax的研发蓝图已清晰可见。刘华透露,公司未来的研发将着重于降低模型错误率、实现无限制输入输出、以及多模态技术的发展。他特别指出,GPT系列模型的上一代错误率约为30%,这在文创领域或许可接受,但若应用于生产、研发等场景,错误率需降至个位数,MiniMax的目标则是2%-3%。同时,随着大模型应用场景的拓展,处理大规模输入输出的能力成为关键,MiniMax最新研发的Abab 7系列模型,通过创新架构,有效降低了长文本的计算复杂度。
在谈到全球竞争格局时,刘华认为,美国的大模型行业仍占据领先地位,如OpenAI、Anthropic、XAI等行业巨头,凭借强大的资源和技术优势,占据了市场的主导地位。然而,中国的大模型厂商正迅速追赶,特别是在语音和视频领域,中国的语音API服务已接近GPT-4的水平。他预测,随着国内科技巨头的加入,中国大模型市场的头部效应也将逐渐显现。
对于中国的AI创业公司而言,刘华看到了广阔的发展空间。他以MiniMax为例,指出公司不仅得到了腾讯云等云厂商的支持,还通过成功的商业化实现了资金的正向循环。他强调,为了更好地服务国内外用户,自研是必经之路,只有打造真正原生性的解决方案,才能拥有具备独立竞争力的大模型。
在谈到与MiniMax的合作时,田丰详细介绍了腾讯云所提供的支持。他表示,腾讯云为MiniMax提供了一系列高性能智能产品,涵盖计算、存储、网络等多个方面,使MiniMax能够专注于模型本身的训练和工程化。其中,对象存储产品通过元数据加速方案和精细化管理措施,有效提升了性能并降低了成本。数据湖产品则针对语料数据预处理进行了优化,帮助MiniMax节约了30%以上的算力,性能提升了35.5%以上。
腾讯云在技术支持上的实力不容小觑。其高性能计算集群通过高效的运维机制,能够在极短时间内发现并解决问题,确保系统的稳定运行。同时,腾讯云星脉网络在支持大模型训练方面表现出色,网络通信占比低至6%,整体训练效率提升了20%以上。