Meta推出REFRAG，彻底解决了RAG（检索增强生成）系统的最大痛点：大量无

爱生活爱珂珂 2025-11-15 08:59:16

Meta推出REFRAG，彻底解决了RAG（检索增强生成）系统的最大痛点：大量无用信息浪费计算资源。传统RAG会检索上百个文本块，导致模型处理成千上万无关token，成本高且效率低。REFRAG创新地在embedding层面进行压缩和筛选：- 每个文本块先压缩成单个embedding向量- 通过强化学习策略对embedding进行相关性评分- 只展开最相关的文本块送入LLM，其他保持压缩或被过滤- 这样LLM只处理真正重要的信息，显著降低token数量结果惊人：- 首个token响应速度提升30倍以上- 支持16倍更大的上下文窗口- 处理token数量减少2到4倍- 在16个RAG基准测试中超越LLaMA表现工作流程简单高效：1. 编码文档并存入向量数据库2. 查询时检索相关embedding块3. 强化学习策略筛选最优embedding4. 展开选中块为完整token向量5. 其余保持压缩状态6. 所有信息一并输入LLM处理这不仅极大提升了速度和规模，还保证了准确性零损失。REFRAG用“压缩-筛选-展开”的方法，优雅解决了RAG中“token膨胀”的隐藏成本。这一突破彰显了向量空间和强化学习结合在大模型优化中的巨大潜力，也暗示未来检索系统将越来越依赖智能筛选策略，而非盲目堆积信息。它让我们思考：真正的效率，不是无尽扩容，而是精准提炼。论文地址：arxiv.org/abs/2509.01092原推：x.com/akshay_pachaar/status/1989327114303398379

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

治愈拖延（懒惰）的十剂良方。

2

软件开发的现代工作流（解读见长图）人工智能 ai兴趣创作计划

3

微积分的直觉理解

4

早！[太阳] 早安

5

晚安～ [月亮] 晚安

6

《爱可可微博热门分享(6.9)》

7

“完美主义是毒，拖延是病，唯有行动是解药。” —— Richie Norton

8

【[580星]Gauntlet：一个灵感来源于Raycast的开源跨平台应用启动

9

【[292星]SWE Agent with LangGraph：一款强大的AI驱

10

【[236星]wheel_legged_genesis：基于Genesis的轮足

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

3

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

6

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

7

陈奕迅将现身K90发布会今晚陈奕迅会携新版《K歌之王》空降K90系列发布会现场，

8

中国移动你是良心发现了吗？中国移动你是良心发现了吗？18年的老用户了，每个月就

9

这下你用iPhone的控制中心不会迷茫了。

10

小鹏机器人“猫步”惊艳全场！网友疑是真人，何小鹏四字回应暗藏玄机昨日，第七届小

科技最新文章

1

走量大头1+3+4架构的就叫麒麟9030，顶级折叠旗舰上1+4+4架构的叫麒麟9

2

看到Y500Pro这个外观，只想说“又是这个奥利奥”，从X系列到Y系列已经用过

3

这次华为Mate80系列，五款全系列都是搭载麒麟9030处理器，连标准版可能上麒

4

不装了！余承东摊牌了，给下马威，24GB+等效5nm芯片，统统给齐！华为Mate

5

董明珠现在是全网最开心人了自己说过的话，培养人才的速度远远低于挖人的速度。雷

6

荣耀500系列这个配置不难让人不期待，标准版和Pro都很猛。标准版和Pro最

7

如果Mate80ProMax整机如下图，诸君又会如何评价呢？用Mate80致

8

荣耀500系列为什么是横向模组，荣耀方飞总给出了答案。荣耀400pro的设计上面

9

荣耀500系列海报正式亮相！提前上手真机的用户纷纷表示，从实际观感来看，荣耀50

10

荣耀500系列包含标准版和Pro版，真的是漂亮呀。目前在官网可以预定，预计11月