在AI大模型领域,一场关于预训练成本的较量正悄然上演。近期,国内知名大模型公司零一万物发布了其最新的预训练旗舰模型——Yi-Lightning,号称“闪电”,在国际权威榜单LMSYS上一举超越了OpenAI今年5月发布的GPT-4o和Anthropic的Claude 3.5 Sonnet,排名世界第六,中国第一。
这一成就标志着中国大模型在全球竞争中取得了突破性进展,零一万物紧随OpenAI、Google之后,跻身全球前三大模型企业行列。
Yi-Lightning不仅在性能上有所提升,其推理速度也实现了质的飞跃。相比上半年发布的Yi-Large,首包时间减少了一半,最高生成速度提升了近四成,堪称“极速”。同时,该模型的推理成本也大幅降低,每百万token仅需0.99元,接近行业最低价。
Yi-Lightning的出色表现得益于零一万物在多个维度上的扎实储备,包括芯片人才、推理人才、基础架构人才和算法人才等。这使得零一万物在面对大模型预训练的高门槛时,依然能够坚持“模基共建”的战略,不断推动模型性能的优化和推理成本的降低。
在LMSYS Chatbot Arena总榜上,Yi-Lightning的成绩同样出众。它超越了国内外多个优质模型,包括xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等,在中文分榜上与世界第二名的模型并列。在多轮对话、数学能力、代码能力等多个分榜上,Yi-Lightning也取得了世界前列的优异成绩。
零一万物之所以能够在短时间内取得如此显著的进步,与其独特的混合专家模型架构(MoE)和一系列技术创新密不可分。例如,Yi-Lightning采用了混合注意力机制(Hybrid Attention),旨在平衡模型在处理长序列数据时的性能和计算资源消耗。同时,动态Top-P路由机制的引入也使得Yi-Lightning能够更加智能地适应各种任务需求,实现“极速推理”。
随着Yi-Lightning的发布,零一万物在AI大模型领域的应用探索也进一步扩展。其最新推出的AI 2.0数字人产品已接入Yi-Lightning,在零售和电商等场景中展现出强大的实时互动能力和话术生成能力。某酒旅企业在接入该数字人直播后,GMV较此前上升了170%。
Yi-Lightning的推出不仅彰显了中国在大模型领域的强大技术实力,也为中国大模型公司的发展提供了新的思路。即坚持“模型+AI Infra+应用”三位一体的全栈式布局,以国际领先的基座模型为基础,积极探索企业级解决方案,推动整个大模型行业形成健康的生态。
目前,Yi-Lightning已上线Yi大模型开放平台(https://platform.lingyiwanwu.com/),每百万token仅需0.99元,支持开发者与企业客户轻松实现SOTA大模型自由。这一举措无疑将进一步推动大模型技术的普及和应用。
零一万物的成功也引发了对中国大模型行业未来发展的深入思考。在算力受限的情况下,中国基座模型的研发能力如何追赶国外顶尖大模型?零一万物的实践表明,通过技术创新和全栈式布局,中国大模型公司有望在全球竞争中脱颖而出,打造新质生产力。
展望未来,随着大模型技术的不断发展和普及,其应用场景也将更加广泛。零一万物将继续坚持“模基共建”的战略,不断探索大模型在各个领域的应用潜力,为推动人工智能技术的发展和应用贡献自己的力量。