告别英伟达?华为昇腾NPU跑出准万亿参数大模型,媲美DeepSeek R1
2025年5月9日消息传来,华为昇腾NPU成功跑出准万亿参数大模型,其表现足以媲美DeepSeek R1,这一成果无疑为国产AI芯片发展注入了一剂强心针。

近年来,人工智能和大模型的迅猛发展带动算力需求日益激增,AI芯片应用前景愈加广阔。然而,美国对高端AI芯片对华实施封锁禁运,给中国相关产业带来了巨大挑战。在此背景下,国产AI芯片正在加速突围,华为昇腾NPU此次的突破便是重要的里程碑。
此前,华为就已经展现出昇腾集群的强大实力。利用纯昇腾集群训练出的盘古Ultra,作为一个参数量135B的密集模型,达到了同尺度密集模型的最优表现,甚至可以与DeepSeek - R1等参数量更大的MoE模型竞争。在预训练阶段模型的评测中,盘古Ultra在绝大部分英文基准任务和全部中文任务上取得了最佳性能,优于Llama 405B、DeepSeek - V3等baseline模型。尤其在MMLU、TriviaQA、GSM8K等具有挑战性的数据集上,展现出了卓越的语言理解和推理能力。经过指令调优后,盘古Ultra在AIME 2024、MATH - 500等数学推理任务和LiveCodeBench等编程竞赛题上达到了SOTA水平,综合来看超越了包括GPT - 4o、Mistral - Large 2等强大模型,与DeepSeek R1等MoE模型竞争激烈。同时,整个训练过程零英伟达含量,且通过改进的模型架构和系统优化策略,拥有优异的性能表现和52%以上的算力利用率,训练中还未出现损失尖峰这一此前似乎从未实现的特征。

除了盘古Ultra,中科大与华为合作开发的生成式推荐大模型也首次在国产昇腾NPU上成功部署。在信息爆炸时代,推荐系统已成为生活中不可或缺的一部分。Meta率先提出了生成式推荐范式HSTU,将推荐参数扩展至万亿级别并取得显著成果,而华为昇腾NPU在这一领域的应用探索,也为未来推荐系统的发展提供了新的可能。

华为昇腾NPU跑出准万亿参数大模型并媲美DeepSeek R1,不仅仅是技术上的胜利,更代表着国产AI芯片在面对外部封锁时的坚韧与突破。这或许预示着在未来的AI芯片领域,中国有望逐步减少对英伟达等国外芯片的依赖,走出一条自主创新的发展道路。