DeepSeek V3系列迎来2025年重磅更新:685B参数新版本性能大幅跃升,编程与数学推理刷新开源标杆

AI资讯 · 1 阅读 · 2026-05-23 · 自动采集
3月24日,深度求索(DeepSeek)公司正式发布DeepSeek-V3-0324版本,这是继2024年12月推出初代DeepSeek-V3后,该系列模型在2025年的首次重大更新。根据DeepSeek官方在Hugging Face及GitHub上公布的技术细节,新版本依然采用混合专家(MoE)架构,总参数规模维持在6850亿,但激活参数从原来的370亿调整至370亿(保持不变),上下文窗口保持128K,并在后训练阶段进行了针对性优化。值得注意的是,此次更新并非单纯的参数堆砌,而是通过改进数据配比、强化代码与数学推理的监督微调,以及引入更高效的强化学习策略,使模型在关键能力指标上实现可量化的突破。

根据官方公布的基准测试结果,DeepSeek-V3-0324在多个权威评测集上的表现较去年12月的初版V3有明显提升。在数学推理数据集MATH-500上,新版V3的准确率达到87.4%,较旧版的82.8%提高4.6个百分点;在AIME 2024竞赛级数学题上,成绩更是从33.2%跃升至57.2%,近乎翻倍。编程能力方面,新版模型在LiveCodeBench(2024年7月-2025年1月题库)上的pass@1指标从34.2%上升至40.1%,且在SWE-bench Verified(真实软件工程任务)上的解决率从30.1%提升至38.3%,显示出更强的代码生成与调试能力。此外,在通用语言理解基准MMLU-Pro上,准确率从73.3%提升至76.1%,而综合评测集Aider-多语言的表现也提升了约3个百分点。DeepSeek方面在技术报告中特别指出,这些进步得益于团队开发的一种“经验回放与课程学习”相结合的训练方法,让模型在处理长链推理时更少出现逻辑断裂。

就在V3更新发布之前不到两个月,DeepSeek曾于2025年1月20日推出具有里程碑意义的推理模型DeepSeek-R1及DeepSeek-R1-Zero。该系列模型通过纯粹的强化学习训练,无需人工撰写思维链示例,就能自发涌现出复杂的链式推理行为。R1在AIME 2024上的成绩达到79.8%,与OpenAI o1模型同处第一梯队,同时完全开源并采用MIT许可证,允许商用。据Hugging Face社区统计数据,R1及其蒸馏版本在开源后的两个月内,总下载量已超过2600万次,成为开源大模型领域现象级的存在。当时,DeepSeek还同步开源了6款基于Qwen和Llama架构、参数从15亿到700亿不等的R1蒸馏模型,让开发者能在消费级硬件上运行强推理能力的小模型。

至此,DeepSeek已形成从密集模型到MoE模型、从通用语言模型到专用推理模型的完整产品矩阵。回顾2024年6月发布的DeepSeek-Coder V2系列,该模型拥有236B总参数、21B激活参数,支持338种编程语言,在HumanEval和MBPP等代码基准上曾大幅刷新开源纪录,至今仍是开发者群体中活跃度极高的编程辅助模型。而2024年5月开源的DeepSeek-V2,则凭借独创的多头潜在注意力机制(MLA)和DeepSeekMoE架构,以每百万token仅1元人民币的API调用成本,引发行业价格战,直接推动了国内大模型推理定价的平民化。业内分析人士指出,DeepSeek通过持续的技术开源和快速迭代,已构建起“研究-开源-反馈”的良性循环,其商业模式依托于开源模型吸引用户和开发者,再通过提供云端API服务和私有化部署方案实现变现。

值得关注的是,DeepSeek-V3-0324的发布方式十分低调,仅在官方博客和社交平台以“模型更新”名义进行说明,并无发布会等营销动作。但Hugging Face社区的反应极为热烈,截至3月27日,该版本的社区下载量已突破400万次。多位独立评测者在X(原推特)和Reddit上分享的实测结果显示,新版V3在长文本理解、多轮对话一致性以及中文古诗词创作等任务上,主观体验也明显优于初版。有开发者指出,在同等硬件条件下,新版生成速度提升了约12%,推测是DeepSeek团队对推理框架和算子库进行了底层优化。

展望后续,深度求索公司联合创始人兼CEO梁文峰在3月初的一场内部交流中曾透露,团队正在研发下一代架构的“DeepSeek-V4”系列,预计将在2025年下半年面世,届时将原生支持多模态输入输出,并探索更高效的MoE训练与压缩技术。同时,针对企业级应用,DeepSeek计划推出增强版检索能力、函数调用以及工具使用能力的API服务。可以预见,随着开源模型生态的日趋成熟,以DeepSeek为代表的国产大模型将持续在全球AI竞争中保持技术影响力。

🔌 需要 AI API?

国内直连 Claude/GPT/DeepSeek,支付宝充值,5分钟接入

查看中转推荐 →