[LG]《AutonomousCodeEvolutionMeetsNP-

爱生活爱珂珂 2025-09-11 06:38:42

[LG]《Autonomous Code Evolution Meets NP-Completeness》C Yu, R Liang, C Ho, H Ren [NVIDIA Research] (2025)

SATLUTION：首个基于大型语言模型（LLM）的布尔可满足性问题（SAT）求解器仓库级自主进化框架，实现NP完备问题领域的突破。

• 规模空前：可同时演化包含数百个文件、数万行C/C++代码的完整求解器仓库，超越以往仅限单文件百行代码的AlphaEvolve。

• 双阶段智能代理：规划代理负责高层策略思考，编码代理执行具体代码改动，结合静态规则与自我进化规则保障代码正确性与性能提升。

• 严格正确性验证：两阶段验证体系（编译+烟雾测试，SAT/UNSAT结果及DRAT证明校验）确保无误导性优化，避免退化和错误结果。

• 分布式大规模评测：800核CPU集群并行运行400实例测试，实时反馈PAR-2（惩罚平均运行时间）等多维性能指标，指导迭代优化。

• 超越人类专家：仅基于2024年赛题和5个开源求解器为种子，经过70次迭代演化，产出性能超越2025年SAT竞赛冠军的求解器，表现稳定优异。

• 规则与自我进化：结合领域知识与自动规则更新机制，构建可随着迭代持续学习和完善的规则系统，保障演化效率和质量。

• 代码与文档规范化：强制统一仓库结构及文档（CHANGELOG.md、HYPOTHESIS.md、RESULTS.md），实现演化过程全透明、可追溯。

• 资源节约显著：耗费不足2,000美元令牌费用加9,000-13,500美元计算资源，远低于人工开发数月成本。

心得：

1. 从单文件到仓库级的自主演化，是复杂系统自动优化的里程碑，证明LLM结合规则和反馈能驾驭大规模软件工程任务。

2. 严格的验证管控是自动代码演化的根基，防止错误传播、加快迭代速度，是AI自动编程成功的关键。

3. 多维性能反馈（如SAT/UNSAT分解、不同时间阈值分布）促进了更全面且平衡的优化，避免单目标陷阱。

了解详情🔗 arxiv.org/abs/2509.07367

人工智能自动编程算法优化SAT求解器大规模软件演化NP完全

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

新书《Build a Reasoning Model (From Scratch

2

[人人能懂] 当AI不再需要人类“喂”数据，会发生什么？（扫码收听）我们总觉得

3

AI正重塑经济格局，创业机会前所未有地密集且多元化：• 移动应用重焕生机：AI激

4

RAG 系统是否真能“动脑”，关键在于它能否处理连续追问，真正做到“思考、推理与

5

[CL]《Causal Attention with Lookahead Key

6

[LG]《Autonomous Code Evolution Meets NP-

7

[CL]《Parallel-R1: Towards Parallel Think

8

早！[太阳] 早安

9

不同类型的嵌入向量在检索和推荐系统中的表现大相径庭，选择合适的类型至关重要。Vi

10

[AI评论] AI会取代教师吗？今天，我们致敬老师，也探讨老师的未来。 🙏AI

热门分类

科技TOP

1

光刻机禁售，我忍了。芯片技术封锁，我也忍了。但全国首台国产电子束光刻机在杭州

2

太tm解气了，当华为pura80ultra更新后，麒麟9020出现的那一刻，心

3

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

4

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

5

华为的前三号员工1.任正非（工号001）华为创始人，1987年集资2.1万

6

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

7

追觅官宣造车追觅：要造最快的车！这么卷的汽车市场还有选手入场，给追觅点赞[爱你

8

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

9

实锤了！中国不买美国芯片，H20就暂停生产了，现在黄仁勋更加睡不着觉了，由于这次

10

中芯国际目前已经全部掌握了最新的芯片代工技术，同时能够不断迭代进化。虽然受制于光

科技最新文章

1

彻底告别电量焦虑朋友们，手机没电的恐慌可以画上句号了。荣耀Magic8系列重

2

最新消息马斯克突然宣布9月10日，马斯克突然宣布特斯拉正在敲定Optimus

3

刚收到系统推送马上更新，给兄弟们分享一波。图一、系统更新后的画面，给人感觉这是荣

4

iPhone新机首次支持国补所以说各位！这代尤其是标准版，别着急抢首发！等国补

5

荣耀吃了大补丸，堆料这么猛？好家伙钢铁侠的爆料真是吓人，荣耀Magic8Pro的

6

9月10日，英伟达又扔出一颗“技术核弹”，推出了名为RubinCPX的新一代专

7

网友表示iPhone17标准版最值得入手，可以闭眼冲原因是屏幕上了高刷，而且

8

小米对应届毕业生是真照顾啊！7月1日小米集团副总裁张剑慧发文，小米在北京昌平园

9

前段时间，我拿华为手机在阿联酉的售价和国内对比，得出阿联酉更实惠。这次，我们来对

10

iPhone17变成印度制造，瞬间觉得不香了苹果已将面向美国的iPhone