Qwen新架构又快又便宜Qwen新模型秒解AIME数学题Qwen下一代模型架构,

量子位看科技 2025-09-12 18:17:12

Qwen新架构又快又便宜Qwen新模型秒解AIME数学题

Qwen下一代模型架构,抢先来袭!

Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。

基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。

模型参数80B,但训练成本连Qwen3-32B的十分之一都不到,并且在32 k以上的上下文推理吞吐能达到后者的十倍以上。

基于这一模型,团队接连出手,同步开发并发布了两大新模型:

- Qwen3-Next-80B-A3B-Instruct:在256K超长上下文处理任务中展现出显著优势。

- Qwen3-Next-80B-A3B-Thinking:在多项基准测试中超越闭源模型Gemini-2.5-Flash-Thinking。

网友表示,这更新频率令人震惊。话不多说,赶紧来看看新模型有哪些改进吧。

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注