深度求索公司近日宣布,其全新系列大模型DeepSeek-V4的预览版本已正式发布,并同步开源。这一举措标志着大模型技术正式进入百万级上下文处理能力的普惠阶段,为全球开发者社区带来重大突破。
DeepSeek-V4系列通过创新技术实现了性能飞跃。该模型采用Token维度压缩与DSA稀疏注意力机制相结合的方式,在保持全球领先的百万字级上下文处理能力的同时,显著降低了计算资源与显存需求。此次发布的版本包含两个变体:DeepSeek-V4-Pro配备1.6万亿参数,在智能体能力、知识储备和推理性能方面达到国内开源领域标杆水平;DeepSeek-V4-Flash则以更精简的架构提供接近的推理能力,成为高性价比选择。
在权威评测中,DeepSeek-V4-Pro展现强劲实力。其Agentic Coding能力超越当前开源模型最优水平,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。在世界知识测试中,该模型大幅领先其他开源竞品,在数学、STEM学科及竞赛级代码生成等复杂推理任务中,表现与全球顶级闭源模型持平。
配套API服务同步升级,全面兼容OpenAI ChatCompletions与Anthropic接口标准。两个版本均支持100万字符的上下文窗口,提供非思考与思考双模式选择。值得注意的是,现有API中的deepseek-chat和deepseek-reasoner模型将于2026年7月24日停止服务,开发者需提前做好迁移准备。
此次开源内容涵盖模型权重与完整技术文档,开发者可通过Hugging Face和ModelScope平台获取资源。该成果不仅彰显中国在AI大模型领域的技术积累,更为全球开发者提供了突破性工具,有望推动人工智能在专业领域的应用深化。


