[CL]《DiffusionLanguageModelsKnowthe

爱生活爱珂珂 2025-08-29 07:21:27

[CL]《Diffusion Language Models Know the Answer Before Decoding》P Li, Y Zhou, D Muhtar, L Yin... [The Hong Kong Polytechnic University & Dartmouth College & Max Planck Institute for Intelligent Systems] (2025)

Diffusion Language Models（DLM）展现了“答案提前收敛”的重要特性：在多数情况下，模型在完成全部迭代步骤前即已内部确定正确答案。基于此，Prophet算法提出了一种无训练、动态调控的早期提交解码策略，利用预测中最高与次高候选的置信差作为判定标准，自动决定何时终止迭代，显著提升推理速度。

• 早期答案收敛现象：在GSM8K和MMLU数据集上，分别有高达97%与99%的样本可在半数迭代步骤内正确解码，表明传统全步迭代存在大量冗余计算。

• Prophet算法：无需额外训练，通过动态阈值调整实现“早期提交解码”，兼容现有DLM架构，计算开销极低。

• 显著加速：在LLaDA-8B和Dream-7B模型上，Prophet最高可减少3.4倍解码步骤，同时保持甚至提升生成质量，证明其在速度与准确率间实现优雅平衡。

• 方法论启示：将DLM解码视为最优停止问题，强调动态判断何时完成生成，突破了固定迭代次数的传统限制。

• 实验覆盖广泛任务，包括数学推理、通用问答和规划，均展现稳定效果。

该研究不仅揭示了DLM推理内部机制的本质，也为提升大规模语言模型效率提供了可操作路径，助力Diffusion模型更好地服务于实际应用场景。

详情阅读👉 arxiv.org/abs/2508.19982

扩散语言模型模型加速早期解码自然语言处理机器学习

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

AI会赋予“进步”新的内涵。欢迎点赞关注！[鲜花]

2

早！[太阳] 早安

3

【[45星]Awesome-Affordance-Learning：为机器人与环

4

【[289星]Claude Code Action：为GitHub项目提供智能代

5

【[747星]Ultracite：AI就绪的代码格式化工具，让你和团队以及AI

6

【[89星]TabArena：一个为表格数据机器学习量身定制的动态基准测试系统。

7

【[73星] nsa-impl：高效实现原生稀疏注意力机制的PyTorch项目。

8

【[304星]Kwai Keye-VL：快手推出的多模态大语言模型，专为视频理解

9

【[80星]WorldVLA：一个自回归动作世界模型，将动作和图像理解与生成统一

10

“数学教会我们的不是答案，而是如何‘证明’一个答案是正确的，以及‘享受’这个过程

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

光刻机禁售，我忍了。芯片技术封锁，我也忍了。但全国首台国产电子束光刻机在杭州

2

太tm解气了，当华为pura80ultra更新后，麒麟9020出现的那一刻，心

3

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

4

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

5

华为的前三号员工1.任正非（工号001）华为创始人，1987年集资2.1万

6

追觅官宣造车追觅：要造最快的车！这么卷的汽车市场还有选手入场，给追觅点赞[爱你

7

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

8

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

9

实锤了！中国不买美国芯片，H20就暂停生产了，现在黄仁勋更加睡不着觉了，由于这次

10

9月骁龙峰会，六款国产旗舰新机扎堆硬刚苹果17：荣耀Magic8系列、iQ

科技最新文章

1

马斯克再次抛出惊人言论，振聋发聩！马斯克这次说的话太实在了！他坦言中国真的被

2

小米澎湃OS3已正式发布1、这张图可以讲就是整体亮点的回顾；2、同时官方也给

3

今天，又一家家电企业进入汽车领域，追觅官宣造车，并且是“打造世界级超豪华品牌”。

4

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

5

华为新款三折叠正式开启预约我已经预约上了，皓白、槿紫、瑞红、玄黑4个色，16+

6

追觅官宣造车追觅：要造最快的车！这么卷的汽车市场还有选手入场，给追觅点赞[爱你

7

华为MateXTs，四个配色：黑，白，紫和红；三个存储版本16+256GB16

8

好久不用追觅App了，平时都是直接抄起洗地机搞卫生，刚刚一打开发现……怎么首页全

9

iPhone17Pro这升级幅度，我看傻了苹果全新的发布会已经官宣了，而iP

10

华为的前三号员工1.任正非（工号001）华为创始人，1987年集资2.1万