DeepSeek R1与千问2.5-Max一周内相继发布,中国大模型打响推理能力与成本“双线战役”
2025年1月最后一周,中国人工智能大模型赛道再现密集发布:1月26日,量化基金幻方旗下AI公司深度求索(DeepSeek)推出新一代推理模型DeepSeek-R1;三天后,阿里云发布其通义千问旗舰版Qwen 2.5-Max。两模型在数学、编程和复杂逻辑推理等任务上对标甚至超越OpenAI o1-pro、GPT-4o等海外顶尖系统,同时将调用成本大幅下探,中国AI产业的“性能-成本”双螺旋竞争进入白热化阶段。
据深度求索官方公布的测试数据,DeepSeek-R1在美国数学竞赛AIME、代码生成平台Codeforces以及科学推理基准GPQA Diamond中的得分与OpenAI o1-pro相当,部分指标小幅领先。更令市场震动的是其API定价:输出每百万token仅需2.19美元,远低于OpenAI o1的60美元,甚至比深度求索自身上一代DeepSeek-V3还有所下降。这一“高质量、低价格”策略迅速引发开发者社区热议,Hugging Face等平台上的下载量和衍生项目在48小时内激增。
紧随其后,阿里云于1月29日上线的Qwen 2.5-Max同样主打推理能力。阿里云智能集团CTO周靖人在发布会上表示,该模型在多个权威测试集上取得“国产模型最优成绩”,尤其在MATH-500和GPQA Diamond等指标上“较DeepSeek-R1略胜一筹”,并在编程能力上“缩小了与Claude 3.5 Sonnet的差距”。尽管阿里云未直接公布训练成本,但强调其基于自研的“通义”底层架构实现了推理效率的数倍提升,使得商业化落地成为可能。
短短一周内的两次重磅发布,折射出中国AI公司的整体动向:在ChatGPT掀起的大模型竞赛中,本土企业正从单纯追逐参数规模转向推理能力、多模态与极致性价比的多维度比拼。字节跳动旗下火山引擎的豆包大模型自2024年下半年以来,通过连续的降价将日均token消耗量推至4万亿以上,同比增速超7倍。百度文心大模型ERNIE 4.0及系列轻量版本在2024年覆盖了政务、金融、医疗等20余个行业,百度创始人李彦宏多次强调“大模型落地拼的不是跑分,是成本效益”。腾讯混元则于2024年10月发布新一代多模态模型,聚焦视频生成与理解能力。
从资本和市场侧观察,中国AI大模型已走过“百模大战”的泡沫期,进入深度洗牌阶段。根据IT桔子和工信部数据,截至2024年底,中国完成备案并上线的生成式AI大模型数量超过200个,但能持续获得大额融资并实现规模化营收的头部梯队收窄至十余家。2024年全年,中国AI领域公开融资总额约1200亿元人民币,较2023年增长约15%,但资金明显向少数头部企业集中——深度求索、智谱AI、月之暗面、百川智能等获投额均超过30亿元。智谱AI于2024年12月完成新一轮30亿元战略融资,投后估值突破300亿元,成为估值最高的中国大模型创业公司之一。月之暗面(Moonshot AI)旗下的Kimi智能助手则在长上下文处理领域站稳脚跟,2025年1月其上下文长度拓展至1000万token,吸引了大量学术与法律用户。
价格战是中国AI竞赛的独特现象。自2024年5月深度求索率先宣布大幅降价开始,阿里云、字节跳动、百度、科大讯飞等迅速跟进,大模型API调用价格一年内降幅超过90%。以深度求索为例,其DeepSeek-V2在2024年5月发布时输入价格定为每百万token 1元人民币,引发行业“免费潮”——百度文心一言ERNIE Speed、阿里云通义千问Turbo等相继免费开放。这种近乎惨烈的成本压缩,一方面得益于模型架构创新——如DeepSeek采用的混合专家模型(MoE)和MLA(多头潜在注意力)技术,在保证性能的同时将计算量降至同类模型的三分之一以下;另一方面也受益于中国庞大的算力基建:截至2024年底,中国智能算力规模达到427 EFLOPS(百亿亿次浮点运算),同比增长超过35%。
政策端对AI产业的引导同样加速。2024年8月,《生成式人工智能服务管理暂行办法》落地满一周年,中国网信办累计批准了超过200个生成式AI服务备案,同时密集出台数据安全、算法备案和伦理审查细则。2025年1月,国务院办公厅印发《关于进一步推动人工智能赋能新型工业化的若干措施》,明确鼓励大模型在制造业、能源、交通等实体经济场景落地,并给予税收优惠和算力券支持。上海市、广东省等地也相继设立百亿级人工智能产业基金,重点投向模型层与具身智能。
竞争格局的另一重要变量是开源与闭源路线的分野。DeepSeek-R1在发布同时开源了模型权重,搭载MIT许可协议,允许商用和二次开发。阿里云亦始终坚持开源策略,其Qwen系列模型在全球开源社区Hugging Face上累计下载量超过1亿次,衍生产品超过8万个。与之相对,百度、华为等则选择闭源或有限开源的路线,将模型深度绑定自身云服务和智能硬件生态。分析人士指出,开源有利于快速积累生态、压低推理成本,但闭源模式能在垂直行业构建更深壁垒,两条路线将在2025年持续碰撞。
海外市场方面,中国AI公司的扩张面临愈发复杂的地缘技术博弈。2025年1月,美国政府更新AI芯片出口管制规定,限制向中国出口高端训练和推理芯片。深度求索等企业随后宣布,其最新模型训练已大量采用国产升腾910B等替代芯片,以降低对英伟达H100/H800的依赖。华为昇腾计算业务负责人透露,2024年昇腾AI芯片出货量同比增长超过200%,支撑了国内约30%的预训练算力。这种“倒逼式”的国产替代正加速重构中国AI硬件供应链。
站在2025年初观察,中国AI大模型赛道已从“有没有”跨入“好不好、贵不贵”的阶段。当深度求索将高端推理模型API价格压至每百万token数美元级别,阿里云以更强参数和精度紧随而来,整个行业面临的不再是技术可行性的质疑,而是商业可持续性的考验——如何在近乎“白菜价”的环境中,依靠规模效应、生态锁定和产业纵深实现盈利,将成为决定下一轮淘汰赛胜负的关键。随着DeepSeek、千问等模型向更多海外开发者开放,其与OpenAI、Anthropic及Meta Llama系列的全球对话,或将在2025年年中迎来更直接的交锋。
据深度求索官方公布的测试数据,DeepSeek-R1在美国数学竞赛AIME、代码生成平台Codeforces以及科学推理基准GPQA Diamond中的得分与OpenAI o1-pro相当,部分指标小幅领先。更令市场震动的是其API定价:输出每百万token仅需2.19美元,远低于OpenAI o1的60美元,甚至比深度求索自身上一代DeepSeek-V3还有所下降。这一“高质量、低价格”策略迅速引发开发者社区热议,Hugging Face等平台上的下载量和衍生项目在48小时内激增。
紧随其后,阿里云于1月29日上线的Qwen 2.5-Max同样主打推理能力。阿里云智能集团CTO周靖人在发布会上表示,该模型在多个权威测试集上取得“国产模型最优成绩”,尤其在MATH-500和GPQA Diamond等指标上“较DeepSeek-R1略胜一筹”,并在编程能力上“缩小了与Claude 3.5 Sonnet的差距”。尽管阿里云未直接公布训练成本,但强调其基于自研的“通义”底层架构实现了推理效率的数倍提升,使得商业化落地成为可能。
短短一周内的两次重磅发布,折射出中国AI公司的整体动向:在ChatGPT掀起的大模型竞赛中,本土企业正从单纯追逐参数规模转向推理能力、多模态与极致性价比的多维度比拼。字节跳动旗下火山引擎的豆包大模型自2024年下半年以来,通过连续的降价将日均token消耗量推至4万亿以上,同比增速超7倍。百度文心大模型ERNIE 4.0及系列轻量版本在2024年覆盖了政务、金融、医疗等20余个行业,百度创始人李彦宏多次强调“大模型落地拼的不是跑分,是成本效益”。腾讯混元则于2024年10月发布新一代多模态模型,聚焦视频生成与理解能力。
从资本和市场侧观察,中国AI大模型已走过“百模大战”的泡沫期,进入深度洗牌阶段。根据IT桔子和工信部数据,截至2024年底,中国完成备案并上线的生成式AI大模型数量超过200个,但能持续获得大额融资并实现规模化营收的头部梯队收窄至十余家。2024年全年,中国AI领域公开融资总额约1200亿元人民币,较2023年增长约15%,但资金明显向少数头部企业集中——深度求索、智谱AI、月之暗面、百川智能等获投额均超过30亿元。智谱AI于2024年12月完成新一轮30亿元战略融资,投后估值突破300亿元,成为估值最高的中国大模型创业公司之一。月之暗面(Moonshot AI)旗下的Kimi智能助手则在长上下文处理领域站稳脚跟,2025年1月其上下文长度拓展至1000万token,吸引了大量学术与法律用户。
价格战是中国AI竞赛的独特现象。自2024年5月深度求索率先宣布大幅降价开始,阿里云、字节跳动、百度、科大讯飞等迅速跟进,大模型API调用价格一年内降幅超过90%。以深度求索为例,其DeepSeek-V2在2024年5月发布时输入价格定为每百万token 1元人民币,引发行业“免费潮”——百度文心一言ERNIE Speed、阿里云通义千问Turbo等相继免费开放。这种近乎惨烈的成本压缩,一方面得益于模型架构创新——如DeepSeek采用的混合专家模型(MoE)和MLA(多头潜在注意力)技术,在保证性能的同时将计算量降至同类模型的三分之一以下;另一方面也受益于中国庞大的算力基建:截至2024年底,中国智能算力规模达到427 EFLOPS(百亿亿次浮点运算),同比增长超过35%。
政策端对AI产业的引导同样加速。2024年8月,《生成式人工智能服务管理暂行办法》落地满一周年,中国网信办累计批准了超过200个生成式AI服务备案,同时密集出台数据安全、算法备案和伦理审查细则。2025年1月,国务院办公厅印发《关于进一步推动人工智能赋能新型工业化的若干措施》,明确鼓励大模型在制造业、能源、交通等实体经济场景落地,并给予税收优惠和算力券支持。上海市、广东省等地也相继设立百亿级人工智能产业基金,重点投向模型层与具身智能。
竞争格局的另一重要变量是开源与闭源路线的分野。DeepSeek-R1在发布同时开源了模型权重,搭载MIT许可协议,允许商用和二次开发。阿里云亦始终坚持开源策略,其Qwen系列模型在全球开源社区Hugging Face上累计下载量超过1亿次,衍生产品超过8万个。与之相对,百度、华为等则选择闭源或有限开源的路线,将模型深度绑定自身云服务和智能硬件生态。分析人士指出,开源有利于快速积累生态、压低推理成本,但闭源模式能在垂直行业构建更深壁垒,两条路线将在2025年持续碰撞。
海外市场方面,中国AI公司的扩张面临愈发复杂的地缘技术博弈。2025年1月,美国政府更新AI芯片出口管制规定,限制向中国出口高端训练和推理芯片。深度求索等企业随后宣布,其最新模型训练已大量采用国产升腾910B等替代芯片,以降低对英伟达H100/H800的依赖。华为昇腾计算业务负责人透露,2024年昇腾AI芯片出货量同比增长超过200%,支撑了国内约30%的预训练算力。这种“倒逼式”的国产替代正加速重构中国AI硬件供应链。
站在2025年初观察,中国AI大模型赛道已从“有没有”跨入“好不好、贵不贵”的阶段。当深度求索将高端推理模型API价格压至每百万token数美元级别,阿里云以更强参数和精度紧随而来,整个行业面临的不再是技术可行性的质疑,而是商业可持续性的考验——如何在近乎“白菜价”的环境中,依靠规模效应、生态锁定和产业纵深实现盈利,将成为决定下一轮淘汰赛胜负的关键。随着DeepSeek、千问等模型向更多海外开发者开放,其与OpenAI、Anthropic及Meta Llama系列的全球对话,或将在2025年年中迎来更直接的交锋。