17岁少年改写AI未来:一个Prompt让Claude获得"人类式思考"
最近我被一个Claude3.5的神级Prompt彻底震撼了
简单来说,这个Prompt通过给Claude3.5注入一个O1级别的思维链,把它的思考过程变得更人性化,逻辑也更详细,甚至能够像O1一样展开和折叠。
经过这个强化,Claude3.5的智能水平、成功率和类人化程度都大幅提升。
群里的朋友们都玩得不亦乐乎。有人直接用这个经过强化的Claude3.5,现场造出了一个可以玩的Flappy Bird。没错,是真的可以玩,给大家看得目瞪口呆。
有人做了一个德州扑克游戏,除了可以玩,里面还有AI玩家…整个人都炸了。
然而,这一切都还没完,大家的赞叹才刚刚开始,接下来有几个更炫酷的案例紧随其后。
所有这一切的源头,都来自那段神级Prompt,而这段Prompt名叫“Thinking Claude”。顾名思义,就是一个强化思考能力的Claude。
我先给大家贴一下它的原始Prompt,虽然很长,大家可以去作者的Github页面查看,链接地址是:
更让人震撼的是,这个Prompt的作者是个17岁的高中生——涂津豪(@Richards Tu),他出生于2007年,之前还在阿里巴巴全球数学竞赛AI赛道中夺得了全球第一。
我的17岁,和他的17岁,真的是天差地别。
这个Prompt非常复杂,我先大概给大家讲讲它的能力,让大家能更直观地了解。
整个AI圈都有共识:思维链对大模型有很大的加成作用。从去年到现在,大家看到O1的成功,都已经不再怀疑这一点。
但在O1之前,思维链的实际效果离我们想要的思考方式还有不小的差距。我们希望模型的思维链能更像人类的思考过程,但实际上,模型只是照搬它在预训练中遇到的推理路径。
而O1之后,思维链发生了改变。你可以看到,模型的推理不再是死板的教科书式解法,反而像是人类在思考时的“内心独白”或“意识流”——更具人性化。
涂津豪写这个Prompt的灵感正是来自于此。
Claude本身就很强,如果能够给Claude加上一层类似O1的拟人化思维链,尽管无法完全比肩O1,但或许能在Claude的基础上大幅提升它的表现。
于是,涂津豪按自己的理解,徒手编写了这段拟人化的思维链Prompt。这也就是Thinking Claude的雏形,版本0.01。最初的Prompt是英文的,我把它翻译成中文给大家看。
这个Prompt的核心思想就是:“Claude的思维应该更像是一个意识流。” 虽然这版思维链的效果有些生硬,但涂津豪没有放弃,而是做了一件有趣的事情。
他把这段Prompt扔给了Claude,询问人类的思考框架是什么样的,以及如何优化自己的Prompt。
Claude给出的框架非常棒,涂津豪就把Claude的建议修改后添加到Prompt中。
接着,涂津豪又开了一个窗口,把修改后的Prompt再次交给Claude3.5进行迭代,经过80多次修改后,最终才有了今天的Thinking Claude。
这个过程中,他几乎用完了Team版的对话额度。
当你把这个Prompt输入Claude后,你就可以随意提出问题。
比如让它做一个计算器,它会先思考出一整段“如何做”的步骤,然后再开始执行。这个思考过程非常有趣。
让我们来看一下Claude3.5在加上这个Prompt后,如何思考的。
最关键的一句话是:“但我应该包括更高级的操作吗?也许是科学功能?不,让我们从基础知识开始,因为用户没有指定任何更复杂的东西。”
这个自问自答的思考过程非常贴近人类,能够理清需求。
当然,最终这个计算器是成功的,对于Claude3.5来说,几乎没有任何难度。
而在文学创作方面,Thinking Claude也表现得同样出色。
例如,如果你让它“给我一个关于科幻短篇小说的糟糕的想法,但要出色地执行它”,这听起来是个挑战吧?但是看看Thinking Claude是怎么思考的:
“或者…等等,有了!”这些语气词和人类思考的流畅感,都表现在这条思维链里。
最终,它成功创作出了这篇短篇小说。
这是一个由AI写出来的故事,给我带来了极大的震撼。
而这一切,都是Thinking Claude加持后的成果。
涂津豪不仅仅满足于此,他希望Claude3.5的思考过程也能像O1那样,允许用户选择是否展开或收起思维链。
目前,Claude3.5的思维链是一直展开的。
涂津豪想要完全复刻O1的功能,于是他向Thinking Claude求助,而Claude告诉他:“开发一个Chrome插件吧,就能解决这个问题。”
经过一番折腾,这个插件终于出炉了。
当你安装它后,Claude的思维过程会被折叠起来,只有在需要的时候才会展开,极其方便。
通过Thinking Claude的思维链强化,再加上Claude底层的强大能力,配合强无敌的Artifacts功能,Claude3.5几乎可以媲美O1了。
相比之下,现在的O1不仅不能识图,不能运行代码,排版也一团糟,体验差距巨大。
最后,感谢Claude,感谢涂津豪,感谢这个17岁的少年,他的热血和才华真的让我深感敬佩。
我相信,随着这样的进步,我们将一起走向更加强大的未来。