小米最近又有大动作了。 11月12日中午，一条朋友圈截图在科技圈刷屏了。一位9

小米最近又有大动作了。 11月12日中午，一条朋友圈截图在科技圈刷屏了。一位95后研究员发了条动态："加入小米MiMo大模型团队，智能终将从语言迈向物理世界。"这位95后叫罗福莉，之前在DeepSeek做大模型。传闻雷军用千万年薪把她挖过来的。一家主业是做手机和家电的公司，为什么要在这个节点，用不惜重金的方式去挖一位“做语言模型”的95后研究员？这件事背后，藏着小米一个更大的布局。先说说罗福莉是谁。她的履历并不神秘。她是北大硕士，学的是自然语言处理。毕业后去了阿里达摩院，做跨语言的AI模型。毕业后在阿里达摩院做跨语言预训练，做出了 VECO模型。并作为第一作者，发表在了AI顶级会议ACL上。这个VECO模型，你可以理解为它是一个“翻译型大脑”。传统的语言模型，比如GPT，通常只在一种语言上训练。而 VECO 的做的是，用一个模型，理解并生成多种语言内容。它不是机械的语言翻译，而能同时“听懂”多种语言。比如你说“我爱你”，它会自动知道英文是“I love you”，再遇到“Je t’aime”（法语）也能知道这三个句子的意思是一样的。所以，它不只是学会单个语言，而是学会了语言之间怎么互相理解。这在小米的产品里，就能让“小爱同学”听懂多国语言，或者在手机、汽车里跨语言操作。后来她去了幻方量化旗下的DeepSeek团队。罗福莉在DeepSeek主要参与的是DeepSeek-V2这个模型中，一种叫做稀疏专家（MoE）路线的研发。根据DeepSeek发布的论文，这个模型有个很厉害的特点：总共236B个参数，但每次处理一个token只激活约21B个参数。这个算法的优势就是，我打个比方，如果你有一群老师，每个老师只擅长一门课。有人懂数学，有人懂英语，有人懂历史..当你提问题时，不是让所有老师都回答，而是只挑最对口的那位老师来解答就可以了。这种算法放在大模型中，不仅回答问题更快，而且更节省算力。它最大的好处是，让大模型能跑在手机、汽车这些算力有限的设备上。从她的学术背景和履历，就不难看出雷军挖她的原因了。表面上看，小米是在补AI短板。雷军自己也承认，小米在大模型上起步偏晚。所以要重金招揽能带队的人。而罗福莉身上正好有三样东西，是小米最需要的。先说她的本专业，就是跨语言能力。小米是一家全球化公司。手机卖到全世界，印度、欧洲、拉美都有市场。小米如果要升级小爱同学，要在不同国家和地区使用，就必须能理解多种语言。罗福莉过去的工作恰好解决的就是这个问题。这对小米的全球化设备矩阵来说，太重要了。然后是她懂怎么把大模型塞进小设备。小米不只做手机，还做电视、音箱、汽车、机器人。要知道，单个的设备的算力都很有限，不可能像服务器那样猛堆参数。怎么让AI跑在这些设备上，一直是个困扰终端厂商的难题。而罗福莉在DeepSeek做的那套"稀疏专家"算法，这里就派上用场了。可以用最小的算力和功耗，还能保证效果，把大模型塞进手机、智能家电和车机里。还有一点就是，罗福莉的加入可以成为盘活小米AI战略的布局的一颗关键棋子。今年4月，小米开源了一个7B级的大模型，叫MiMo。推出的口号喊的也很重量级，叫“为推理而生”。根据相关报道，这个模型的目标不是聊天，是推理。为什么要做推理？因为未来的AI设备，要能自己判断、自己决策。比如你跟小爱说"帮我订个外卖"，它要能理解你在哪儿、想吃什么、预算多少，然后自己去完成。罗福莉加入后，就是要把MiMo从一个"能用"的模型，升级成一个"好用"的推理引擎。罗福莉在自己的社交媒体说"从语言到物理世界"。也表达了这种愿景。未来的AI不能只是会聊天的“傻白甜”，而要能真干活。在物理世界里，手机要能帮你自动工作，汽车要能自动驾驶，机器人要能做家务。这些都需要强大的AI模型作为底层。这恰好和小米的产品图谱完全对上。小米到底在下一盘什么棋？就很清晰了。现在的小米，不只是做手机、造汽车、搞家电，而是在干一件更底层的事。最明显的变化是，小米不再把AI当"增配"了。你看小米在推出MiMo时，给出的定位叫"为推理而生"。这个口号直接呼应了小米起家时的口号“为发烧而生”。可见它战略层面的重要性。这说明AI不是附加功能，而是整个系统的核心。我觉得，未来小米的设备的方向就是，要能理解你说的话、能看懂画面、能听懂声音，然后在手机、汽车、电视、音箱这些设备上帮你真正地干事儿。罗福莉加入小米，表面上看是一次重金挖角。但往深了看，这是小米从"做硬件"到"做智能系统"的转变。

小米最近又有大动作了。 11月12日中午，一条朋友圈截图在科技圈刷屏了。 一位9

小米最近又有大动作了。 11月12日中午，一条朋友圈截图在科技圈刷屏了。一位9