阿里开源Qwen3：全球最强开源大模型的新标杆

推荐 04-29 阅读：4 评论：0

今日，阿里巴巴正式宣布开源新一代通义千问Qwen3系列模型，一举登顶全球最强开源大模型宝座。此次开源包括两款混合专家(MoE)模型和六款密集(Dense)模型，共计8款“混合推理模型”，在性能、效率和创新性方面树立了新标杆。

Qwen3系列旗舰模型Qwen3-235B-A22B拥有2350亿总参数，但仅激活220亿参数，在代码、数学和通用能力基准测试中展现出与DeepSeek-R1、Grok-3和Gemini-2.5-Pro等顶级模型相匹敌的竞争力。更令人惊叹的是，小型MoE模型Qwen3-30B-A3B仅激活30亿参数(相当于QwQ-32B的10%)，表现却更胜一筹；而Qwen3-4B这样的小模型性能已能媲美上一代Qwen2.5-72B-Instruct。

Qwen3最显著的创新在于其“混合推理”能力，将“快思考”与“慢思考”集成于同一模型。用户可根据任务需求选择两种模式：在“思考模式”下，模型会逐步深入推理；而在“非思考模式”中则提供快速响应。这种设计大大节省了算力消耗，使简单问题能“秒回”答案，复杂问题可多步骤“深度思考”。

Qwen3的推出不仅标志着人工智能领域的一次重大突破，更为全球开源模型树立了新的标杆，巩固了阿里在全球开源大模型领域的领导地位，并为AI研究和应用开发提供了强大工具，有望推动整个行业的技术创新和商业化进程。

阿里开源Qwen3：全球最强开源大模型的新标杆

网友评论

机器智慧

最近发表

网站分类