阿里千问QwQ在产业届应用会比R1更广泛

财经 03-11 阅读:7 评论:0

阿里正式发布推理模型千问QwQ-32B以来,包括壁仞科技、摩尔线程、青云科技等在内的多家厂商陆续推出QwQ-32B适配的算力产品。昨日消息,国家超算互联网平台宣布接入阿里巴巴通义千问大模型,对外提供千问 QwQ-32B API服务。

据了解,千问QwQ-32B是阿里通义团队最新开源的推理模型,在数学、代码及通用能力的多项权威评测集中,表现与「满血版」671B的De­e­p­S­e­ek-R1相当,远胜于o1-mi­ni及相同尺寸的R1蒸馏模型。千问QwQ-32B发布后稳居全球最大AI开源社区HuggingFace趋势榜榜首,成为当下最受欢迎的开源大模型。

不同于QwQ-32B的稠密架构模型,DeepSeek走的是稀疏MoE模型路线,以满血版R1为例,6710亿参数至少要占据671GB显存,为了支持输入/输出、过程数据等,还需要更多显存空间来存放,但在每次推理时,6710亿参数中只有370参数被激活。

而千问QwQ-32B的发布给国产算力厂商带来了更大的利好,QwQ-32B遵循Apache 2.0协议开源,消费级显卡可部署,已经能够满足个人开发者和中小企业极低成本接入顶级模型的诉求。因此在年初DeepSeek点燃整个行业之后,千问QwQ-32B,因其参数和开源优势,或将有望成为超过R1的更广泛行业应用大模型。

网友评论