【广发通信】OpenAI发布ChatGPT Agent工具,看好推理算力需求进一步爆发 🪶原理是什么 ChatGPT Agent=Deep Research+Operator,前者擅长获取信息并深度分析,后者提供网页交互能力,支持滚动、点击等模拟人类的操作,GPT负责指挥两个功能,相当于将手、眼、脑三个功能进行了深度融合。 🪶如何实现的 使用强化学习,一开始模型会「笨拙」地尝试用所有工具解决一个相对简单的问题,通过奖励解决问题更高效、准确、合理的行为,模型能逐渐调整其工作方式。在推理工作中模型也会动态评估工作成果调整其任务达成路径。 实例:用户想参加婚礼,Agent会启动虚拟机(便于点击网页),自主判断应调用浏览器、文本解析器还是终端,并开始依次调取婚礼日期、搜索天气、推荐西装搭配、筛选酒店。 🪶效果如何 跑分:ChatGPT Agent在HLE、FrontierMath、WebArena等测试中跑出高于o3、Deep Research 10-30%分数的成绩; 实际体验:基于文字的旅行计划内容比较充分翔实,生成的PPT、Excel等还比较简单,期待后续的迭代。 我们认为深度思考模型(脑)和Agent工具(手、眼)产生的化学反应才初步显露。 [红包]投资建议 强烈看好推理算力需求的进一步爆发。今年是海内外AI应用爆发元年,tokens输出量、模型调用次数同环比高歌猛进,而Agent每次执行任务都需要10-30分钟,背后的token量相比之前1-2分钟的深度思考可能是几十倍增长。继续推荐受益于算力需求增长的 光模块产业链 风险提示:产业发展不及预期