小米最近又有大动作了。 11月12日中午,一条朋友圈截图在科技圈刷屏了。 一位9

财才单挑 2025-11-12 18:14:51

小米最近又有大动作了。 11月12日中午,一条朋友圈截图在科技圈刷屏了。 一位95后研究员发了条动态:"加入小米MiMo大模型团队,智能终将从语言迈向物理世界。"这位95后叫罗福莉,之前在DeepSeek做大模型。传闻雷军用千万年薪把她挖过来的。 一家主业是做手机和家电的公司,为什么要在这个节点,用不惜重金的方式去挖一位“做语言模型”的95后研究员?这件事背后,藏着小米一个更大的布局。 先说说罗福莉是谁。 她的履历并不神秘。她是北大硕士,学的是自然语言处理。毕业后去了阿里达摩院,做跨语言的AI模型。毕业后在阿里达摩院做跨语言预训练,做出了 VECO模型。并作为第一作者,发表在了AI顶级会议ACL上。这个VECO模型,你可以理解为它是一个“翻译型大脑”。传统的语言模型,比如GPT,通常只在一种语言上训练。而 VECO 的做的是,用一个模型,理解并生成多种语言内容。它不是机械的语言翻译,而能同时“听懂”多种语言。比如你说“我爱你”,它会自动知道英文是“I love you”,再遇到“Je t’aime”(法语)也能知道这三个句子的意思是一样的。 所以,它不只是学会单个语言,而是学会了语言之间怎么互相理解。 这在小米的产品里,就能让“小爱同学”听懂多国语言,或者在手机、汽车里跨语言操作。 后来她去了幻方量化旗下的DeepSeek团队。罗福莉在DeepSeek主要参与的是DeepSeek-V2这个模型中,一种叫做稀疏专家(MoE)路线的研发。根据DeepSeek发布的论文,这个模型有个很厉害的特点:总共236B个参数,但每次处理一个token只激活约21B个参数。这个算法的优势就是,我打个比方,如果你有一群老师,每个老师只擅长一门课。有人懂数学,有人懂英语,有人懂历史..当你提问题时,不是让所有老师都回答,而是只挑最对口的那位老师来解答就可以了。 这种算法放在大模型中,不仅回答问题更快,而且更节省算力。 它最大的好处是,让大模型能跑在手机、汽车这些算力有限的设备上。 从她的学术背景和履历,就不难看出雷军挖她的原因了。 表面上看,小米是在补AI短板。雷军自己也承认,小米在大模型上起步偏晚。所以要重金招揽能带队的人。 而罗福莉身上正好有三样东西,是小米最需要的。 先说她的本专业,就是跨语言能力。小米是一家全球化公司。手机卖到全世界,印度、欧洲、拉美都有市场。小米如果要升级小爱同学,要在不同国家和地区使用,就必须能理解多种语言。罗福莉过去的工作恰好解决的就是这个问题。这对小米的全球化设备矩阵来说,太重要了。 然后是她懂怎么把大模型塞进小设备。小米不只做手机,还做电视、音箱、汽车、机器人。要知道,单个的设备的算力都很有限,不可能像服务器那样猛堆参数。怎么让AI跑在这些设备上,一直是个困扰终端厂商的难题。而罗福莉在DeepSeek做的那套"稀疏专家"算法,这里就派上用场了。可以用最小的算力和功耗,还能保证效果,把大模型塞进手机、智能家电和车机里。 还有一点就是,罗福莉的加入可以成为盘活小米AI战略的布局的一颗关键棋子。 今年4月,小米开源了一个7B级的大模型,叫MiMo。推出的口号喊的也很重量级,叫“为推理而生”。根据相关报道,这个模型的目标不是聊天,是推理。为什么要做推理?因为未来的AI设备,要能自己判断、自己决策。比如你跟小爱说"帮我订个外卖",它要能理解你在哪儿、想吃什么、预算多少,然后自己去完成。罗福莉加入后,就是要把MiMo从一个"能用"的模型,升级成一个"好用"的推理引擎。 罗福莉在自己的社交媒体说"从语言到物理世界"。也表达了这种愿景。未来的AI不能只是会聊天的“傻白甜”,而要能真干活。在物理世界里,手机要能帮你自动工作,汽车要能自动驾驶,机器人要能做家务。这些都需要强大的AI模型作为底层。这恰好和小米的产品图谱完全对上。 小米到底在下一盘什么棋?就很清晰了。 现在的小米,不只是做手机、造汽车、搞家电,而是在干一件更底层的事。 最明显的变化是,小米不再把AI当"增配"了。你看小米在推出MiMo时,给出的定位叫"为推理而生"。这个口号直接呼应了小米起家时的口号“为发烧而生”。可见它战略层面的重要性。这说明AI不是附加功能,而是整个系统的核心。我觉得,未来小米的设备的方向就是,要能理解你说的话、能看懂画面、能听懂声音,然后在手机、汽车、电视、音箱这些设备上帮你真正地干事儿。 罗福莉加入小米,表面上看是一次重金挖角。但往深了看,这是小米从"做硬件"到"做智能系统"的转变。

0 阅读:0
财才单挑

财才单挑

感谢大家的关注