全球首个通用AI Agent,到底是科技颠覆还是伪创新?

科技 03-12 阅读:1 评论:0

北京中关村的一家咖啡厅,周围科技公司的白领们在讨论一件近来颇为热门的话题。

一位投资人的手机上显示着一个“内测码”,他微微一笑,像是拿到了通往未来的门票。

而咖啡厅的另一个角落,几位技术人员正冷笑,他们认为这不过是又一场“PPT造神”的游戏。

那么,这款号称“全球首个通用AI Agent”的产品,究竟是科技的革新,还是伪创新呢?

吹爆还是群嘲?

先拆穿三个牛皮

这款产品一上线便引起了广泛关注。

宣传影片里展示了它如同人的助手般,能自动完成简历筛选、股票分析、旅行规划等任务。

不少用户看到后,跃跃欲试,认为终于找到了一个能替他们“打工”的AI管家。

几天后,他们的反馈却出奇的一致:“标榜智能,动作却像个傻子。”

比如,某位用户尝试使用它来解压简历压缩包,系统却花了整整两个小时。

旅行规划功能更是离谱,被推荐去北京八达岭野生动物园看企鹅。

所谓的“自动执行”不过是将一些常见的API调用封装成黑箱,并配上了“假装在思考”进度条,从而营造出智能的假象。

再看看他们标榜的“技术吊打国际大厂”,宣称GAIA基准测试领先OpenAI 20%。

业内专家一眼就看出端倪,原来测试使用的数据集高度结构化,根本无法应对实际开放场景。

就像说某人跑步比博尔特快,但实际上只是在和拄拐杖的人比赛。

所谓“改变人类生产力”的号称就更夸张了。

二手市场上,内测码被炒到五万元一个。

买回来后,用户们发现连最基础的PDF转Excel都需要调用第三方工具,实用性极差。

一位用户愤怒地表示:“我雇个实习生都比它靠谱,至少实习生不会半夜把公司服务器搞瘫。”

创新还是套壳?

三小时现原形

更让人哭笑不得的是,有个AI研究小组花了三小时直播复刻了一个简化版,让这个所谓的“创新”彻底现了原形。

很多人突然明白,这款产品其实没有什么核心技术,完全是在玩资源整合的游戏。

技术原理非常简单:使用现成的Claude、Qwen等大模型,加上各种Python自动化脚本,最后在API调用的过程中加上一个“思考中...”的动画显示。

这组合就像是AI界的拼多多,全靠拼资源来制造表象。

事实上,OpenAI早就能使用代码解释器调用工具,DeepSeek也能用AI写出数学证明。

他们的技术才是真正的前沿,而这个所谓的通用AI Agent,除了炫技,几乎没有任何实质性创新。

营销还是割韭菜?

互联网老套路

他们的成功主要依赖于一套非常老道的互联网营销手段。

首先是饥饿营销,只放出500个内测码,迅速在二手市场被炒作成“AI圈爱马仕”。

然后是碰瓷式营销,自媒体们纷纷用“炸裂!

中国团队暴打OpenAI”这样的标题来吸引眼球,再加上造神式营销,每次创始人接受采访总会提到“清华天才团队”“十年磨一剑”。

但这些营销很快被打脸,有人挖出其CTO半年前还在做区块链资金盘,连官网上的演示视频也被实锤经过了剪辑加速处理。

所谓的“超强能耗比”同样被证实是夸大其词,同一任务上,GPU耗电竟然是ChatGPT的三倍。

行业集体打脸,技术圈怎么看?

面对这场闹剧,技术圈的反应就是不断地嘲讽。

某位行业专家戏称这款产品应该改名叫Manual,因为几乎所有功能都是依靠人工预设规则。

一位大厂算法总监表示,他们团队开会看完整个发布会,笑得肚子疼。

GitHub社区也不乏热评,有人建议开源代码,他们公司的保洁阿姨都能改出更好的版本。

但业内人士最担心的还是市场影响,当PPT造神能轻松吸引流量和融资,那些真正搞技术创新的团队反而会因为入不敷出而举步维艰。

这背后的风险不容小觑。

结尾:升华主题

这场闹剧实际上揭示了一个更为普遍的问题,即资本市场对高科技项目的非理性追逐。

在资本的催熟下,不少科研团队被迫不断吹泡泡,而大模型研究本身也遇到了一些瓶颈,只能通过包装应用层讲故事来维持热度。

而作为用户,信息差往往让人们误以为自己在见证未来,实则沦为收割的对象。

不过,这闹剧并非全无价值,至少它证明了中国市场对于AI Agent的巨大需求。

希望下一次,能少一点重新定义行业的夸张PPT,多一些真正帮我们节省时间、提高效率的实用功能。

毕竟,对于打工人来说,下班能早走半小时,比任何“假装智能”的进度条都要来得真实和美好。

网友评论