阿里开源Qwen3:全球最强开源大模型的新标杆

推荐 04-29 阅读:4 评论:0

今日,阿里巴巴正式宣布开源新一代通义千问Qwen3系列模型,一举登顶全球最强开源大模型宝座。此次开源包括两款混合专家(MoE)模型和六款密集(Dense)模型,共计8款“混合推理模型”,在性能、效率和创新性方面树立了新标杆。

Qwen3系列旗舰模型Qwen3-235B-A22B拥有2350亿总参数,但仅激活220亿参数,在代码、数学和通用能力基准测试中展现出与DeepSeek-R1、Grok-3和Gemini-2.5-Pro等顶级模型相匹敌的竞争力。更令人惊叹的是,小型MoE模型Qwen3-30B-A3B仅激活30亿参数(相当于QwQ-32B的10%),表现却更胜一筹;而Qwen3-4B这样的小模型性能已能媲美上一代Qwen2.5-72B-Instruct。

Qwen3最显著的创新在于其“混合推理”能力,将“快思考”与“慢思考”集成于同一模型。用户可根据任务需求选择两种模式:在“思考模式”下,模型会逐步深入推理;而在“非思考模式”中则提供快速响应。这种设计大大节省了算力消耗,使简单问题能“秒回”答案,复杂问题可多步骤“深度思考”。

Qwen3的推出不仅标志着人工智能领域的一次重大突破,更为全球开源模型树立了新的标杆,巩固了阿里在全球开源大模型领域的领导地位,并为AI研究和应用开发提供了强大工具,有望推动整个行业的技术创新和商业化进程。

网友评论