告别英伟达？华为昇腾NPU跑出准万亿参数大模型，媲美DeepSeek R1

科技 05-12 阅读：35 评论：0

2025年5月9日消息传来，华为昇腾NPU成功跑出准万亿参数大模型，其表现足以媲美DeepSeek R1，这一成果无疑为国产AI芯片发展注入了一剂强心针。

近年来，人工智能和大模型的迅猛发展带动算力需求日益激增，AI芯片应用前景愈加广阔。然而，美国对高端AI芯片对华实施封锁禁运，给中国相关产业带来了巨大挑战。在此背景下，国产AI芯片正在加速突围，华为昇腾NPU此次的突破便是重要的里程碑。

此前，华为就已经展现出昇腾集群的强大实力。利用纯昇腾集群训练出的盘古Ultra，作为一个参数量135B的密集模型，达到了同尺度密集模型的最优表现，甚至可以与DeepSeek - R1等参数量更大的MoE模型竞争。在预训练阶段模型的评测中，盘古Ultra在绝大部分英文基准任务和全部中文任务上取得了最佳性能，优于Llama 405B、DeepSeek - V3等baseline模型。尤其在MMLU、TriviaQA、GSM8K等具有挑战性的数据集上，展现出了卓越的语言理解和推理能力。经过指令调优后，盘古Ultra在AIME 2024、MATH - 500等数学推理任务和LiveCodeBench等编程竞赛题上达到了SOTA水平，综合来看超越了包括GPT - 4o、Mistral - Large 2等强大模型，与DeepSeek R1等MoE模型竞争激烈。同时，整个训练过程零英伟达含量，且通过改进的模型架构和系统优化策略，拥有优异的性能表现和52%以上的算力利用率，训练中还未出现损失尖峰这一此前似乎从未实现的特征。

除了盘古Ultra，中科大与华为合作开发的生成式推荐大模型也首次在国产昇腾NPU上成功部署。在信息爆炸时代，推荐系统已成为生活中不可或缺的一部分。Meta率先提出了生成式推荐范式HSTU，将推荐参数扩展至万亿级别并取得显著成果，而华为昇腾NPU在这一领域的应用探索，也为未来推荐系统的发展提供了新的可能。

华为昇腾NPU跑出准万亿参数大模型并媲美DeepSeek R1，不仅仅是技术上的胜利，更代表着国产AI芯片在面对外部封锁时的坚韧与突破。这或许预示着在未来的AI芯片领域，中国有望逐步减少对英伟达等国外芯片的依赖，走出一条自主创新的发展道路。

告别英伟达？华为昇腾NPU跑出准万亿参数大模型，媲美DeepSeek R1

网友评论

胜卿看科技世界

最近发表

网站分类