简短聊聊 Kimi真正火在哪里？第一眼看Kimi其实不会觉得是技术上的大幅突

简短聊聊 Kimi真正火在哪里？第一眼看Kimi其实不会觉得是技术上的大幅突破，更多是在原DS架构上的工程化改善，砍了head_n加了expert_num这种操作更类似“面多加水水多加面”，最后调整出一个性能更好的版本，万亿参数不是核心重点。在翻了一晚上推特之后，个人认为Kimi在外网的爆火主要来自三点原因： 1）开源而且便宜（相对Claude）而且编程能力强：便宜的生产力工具总是容易出圈的； 2）极强的工具调用能力：从grok 4到kimi再到今晚放出来的Chatgpt Agent，一个共同的趋势是在训练中大量合成API Call 案例代码，通过在模型训练时大量加入以代码定义的工具调用行为，来实际增强模型的工具调用能力。过往Agent训练的困扰往往在于如何制作Agent行为数据，但通过把行为任务拆分成工具调用、环境反馈、错误重试、输出内容的代码，确实能得到极高的工具调用成功率； 3）从 chat-first 变成 artifact-first：简单来说从输出文本转变成输出“代码构成的页面”，这种范式下也方便用户做进一步的追问、修改、迭代，核心是提升用户的体验感。总结一下来说，从Kimi再到今晚流出的Chatgpt Agent，本质上是在编程能力过线的基础上，重点通过对工具使用、输出界面的优化（都是以编程为基础），从而实现用户体验的大幅提升，个人认为这是Kimi火爆出圈的核心原因。后续基于编程能力+浏览器工具交互+前端界面编程输出的范式，大概率会成为一种常态，核心在于代码行为数据丰富且容易定义，期待这种范式继续演进后，用户体验能提升到何种地步。

HTK新闻网

简短聊聊 Kimi真正火在哪里？第一眼看Kimi其实不会觉得是技术上的大幅突

热门分类

简短聊聊 Kimi真正火在哪里？ 第一眼看Kimi其实不会觉得是技术上的大幅突

猜你喜欢

人工智能kimi开源了自己的模型总体而言，还是在用DeepSeek的开源技术，

平时大家同情可怜的外卖小哥，人性的弱点暴露出来了京东外卖改了规则，晚到20分

华为正面回应了盘古大模型里面有阿里的代码问题。从而印证了我昨天说的，引用了就是引

计算机高手来了，这是真的厉害

热门分类

简短聊聊 Kimi真正火在哪里？第一眼看Kimi其实不会觉得是技术上的大幅突