DeepSeek R1与千问2.5-Max一周内相继发布，中国大模型打响推理能力与成本“双线战役”

AI资讯 · 0 阅读 · 2026-05-23 · 自动采集

2025年1月最后一周，中国人工智能大模型赛道再现密集发布：1月26日，量化基金幻方旗下AI公司深度求索（DeepSeek）推出新一代推理模型DeepSeek-R1；三天后，阿里云发布其通义千问旗舰版Qwen 2.5-Max。两模型在数学、编程和复杂逻辑推理等任务上对标甚至超越OpenAI o1-pro、GPT-4o等海外顶尖系统，同时将调用成本大幅下探，中国AI产业的“性能-成本”双螺旋竞争进入白热化阶段。

据深度求索官方公布的测试数据，DeepSeek-R1在美国数学竞赛AIME、代码生成平台Codeforces以及科学推理基准GPQA Diamond中的得分与OpenAI o1-pro相当，部分指标小幅领先。更令市场震动的是其API定价：输出每百万token仅需2.19美元，远低于OpenAI o1的60美元，甚至比深度求索自身上一代DeepSeek-V3还有所下降。这一“高质量、低价格”策略迅速引发开发者社区热议，Hugging Face等平台上的下载量和衍生项目在48小时内激增。

紧随其后，阿里云于1月29日上线的Qwen 2.5-Max同样主打推理能力。阿里云智能集团CTO周靖人在发布会上表示，该模型在多个权威测试集上取得“国产模型最优成绩”，尤其在MATH-500和GPQA Diamond等指标上“较DeepSeek-R1略胜一筹”，并在编程能力上“缩小了与Claude 3.5 Sonnet的差距”。尽管阿里云未直接公布训练成本，但强调其基于自研的“通义”底层架构实现了推理效率的数倍提升，使得商业化落地成为可能。

短短一周内的两次重磅发布，折射出中国AI公司的整体动向：在ChatGPT掀起的大模型竞赛中，本土企业正从单纯追逐参数规模转向推理能力、多模态与极致性价比的多维度比拼。字节跳动旗下火山引擎的豆包大模型自2024年下半年以来，通过连续的降价将日均token消耗量推至4万亿以上，同比增速超7倍。百度文心大模型ERNIE 4.0及系列轻量版本在2024年覆盖了政务、金融、医疗等20余个行业，百度创始人李彦宏多次强调“大模型落地拼的不是跑分，是成本效益”。腾讯混元则于2024年10月发布新一代多模态模型，聚焦视频生成与理解能力。

从资本和市场侧观察，中国AI大模型已走过“百模大战”的泡沫期，进入深度洗牌阶段。根据IT桔子和工信部数据，截至2024年底，中国完成备案并上线的生成式AI大模型数量超过200个，但能持续获得大额融资并实现规模化营收的头部梯队收窄至十余家。2024年全年，中国AI领域公开融资总额约1200亿元人民币，较2023年增长约15%，但资金明显向少数头部企业集中——深度求索、智谱AI、月之暗面、百川智能等获投额均超过30亿元。智谱AI于2024年12月完成新一轮30亿元战略融资，投后估值突破300亿元，成为估值最高的中国大模型创业公司之一。月之暗面（Moonshot AI）旗下的Kimi智能助手则在长上下文处理领域站稳脚跟，2025年1月其上下文长度拓展至1000万token，吸引了大量学术与法律用户。

价格战是中国AI竞赛的独特现象。自2024年5月深度求索率先宣布大幅降价开始，阿里云、字节跳动、百度、科大讯飞等迅速跟进，大模型API调用价格一年内降幅超过90%。以深度求索为例，其DeepSeek-V2在2024年5月发布时输入价格定为每百万token 1元人民币，引发行业“免费潮”——百度文心一言ERNIE Speed、阿里云通义千问Turbo等相继免费开放。这种近乎惨烈的成本压缩，一方面得益于模型架构创新——如DeepSeek采用的混合专家模型（MoE）和MLA（多头潜在注意力）技术，在保证性能的同时将计算量降至同类模型的三分之一以下；另一方面也受益于中国庞大的算力基建：截至2024年底，中国智能算力规模达到427 EFLOPS（百亿亿次浮点运算），同比增长超过35%。

政策端对AI产业的引导同样加速。2024年8月，《生成式人工智能服务管理暂行办法》落地满一周年，中国网信办累计批准了超过200个生成式AI服务备案，同时密集出台数据安全、算法备案和伦理审查细则。2025年1月，国务院办公厅印发《关于进一步推动人工智能赋能新型工业化的若干措施》，明确鼓励大模型在制造业、能源、交通等实体经济场景落地，并给予税收优惠和算力券支持。上海市、广东省等地也相继设立百亿级人工智能产业基金，重点投向模型层与具身智能。

竞争格局的另一重要变量是开源与闭源路线的分野。DeepSeek-R1在发布同时开源了模型权重，搭载MIT许可协议，允许商用和二次开发。阿里云亦始终坚持开源策略，其Qwen系列模型在全球开源社区Hugging Face上累计下载量超过1亿次，衍生产品超过8万个。与之相对，百度、华为等则选择闭源或有限开源的路线，将模型深度绑定自身云服务和智能硬件生态。分析人士指出，开源有利于快速积累生态、压低推理成本，但闭源模式能在垂直行业构建更深壁垒，两条路线将在2025年持续碰撞。

海外市场方面，中国AI公司的扩张面临愈发复杂的地缘技术博弈。2025年1月，美国政府更新AI芯片出口管制规定，限制向中国出口高端训练和推理芯片。深度求索等企业随后宣布，其最新模型训练已大量采用国产升腾910B等替代芯片，以降低对英伟达H100/H800的依赖。华为昇腾计算业务负责人透露，2024年昇腾AI芯片出货量同比增长超过200%，支撑了国内约30%的预训练算力。这种“倒逼式”的国产替代正加速重构中国AI硬件供应链。

站在2025年初观察，中国AI大模型赛道已从“有没有”跨入“好不好、贵不贵”的阶段。当深度求索将高端推理模型API价格压至每百万token数美元级别，阿里云以更强参数和精度紧随而来，整个行业面临的不再是技术可行性的质疑，而是商业可持续性的考验——如何在近乎“白菜价”的环境中，依靠规模效应、生态锁定和产业纵深实现盈利，将成为决定下一轮淘汰赛胜负的关键。随着DeepSeek、千问等模型向更多海外开发者开放，其与OpenAI、Anthropic及Meta Llama系列的全球对话，或将在2025年年中迎来更直接的交锋。

DeepSeek R1与千问2.5-Max一周内相继发布，中国大模型打响推理能力与成本“双线战役”

相关推荐