换数据顺序模型更聪明微软教大模型按顺序学
模型训练重点在于数据的数量与质量?其实还有一个关键因素——
数据的出场顺序。
对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
该方法用优化训练数据的组织方式来让语言模型学得更好,还不用增加数据量或扩大模型规模。
换数据顺序模型更聪明微软教大模型按顺序学
模型训练重点在于数据的数量与质量?其实还有一个关键因素——
数据的出场顺序。
对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
该方法用优化训练数据的组织方式来让语言模型学得更好,还不用增加数据量或扩大模型规模。
作者最新文章
热门分类
科技TOP
科技最新文章