马斯克再次抛出惊人“言论”,振聋发聩!他说:“在人类历史的大部分时间里,中国都是地球上最强大的国家,他们会做出许多伟大的事情,DeepSeek就是其中之一”可谓是一针见血!
一个国际峰会现场,全球目光聚焦,中国AI突然成为焦点,马斯克直言中国将重返科技巅峰,这番话会引发什么连锁反应?DeepSeek的横空出世,正悄然改变世界AI格局,让人忍不住想知道,中国创新将如何继续领跑?
人工智能这几年发展得飞快,中国在这块儿没少下功夫。2025年2月10日,在德国柏林的WELT经济峰会上,特斯拉老板埃隆·马斯克公开表扬了中国AI的进步。他提到,中国在人类历史上大部分时间里都是世界强国,现在也一样,会带来很多了不起的成果。DeepSeek就是个例子,他说中国工程师聪明又有干劲,能做出DeepSeek这样的模型。这话一出,现场掌声雷动,国际媒体也跟着报道起来。马斯克的评价不是空谈,DeepSeek确实用实际行动证明了中国AI的实力。
DeepSeek是杭州一家AI公司,2023年7月成立,由量化基金High-Flyer支持。创始人梁文峰是浙大毕业的,之前在金融领域搞量化交易,现在转战AI。他想让中国AI不再只是跟跑,而是真正创新。DeepSeek从2023年11月就发布了第一个模型DeepSeek Coder,专攻代码生成。接着,12月推出DeepSeek-LLM系列,有7B和67B参数的版本,用了2万亿tokens训练,英语和中文数据都有,基准测试比当时很多开源模型强。
2024年1月,他们开源了国内首个MoE大模型DeepSeek-MoE,混合专家架构,让计算更高效。4月,又出DeepSeek-Math系列,针对数学推理。5月,DeepSeek-V2问世,成本低性能高。6月,DeepSeek-Coder V2跟上。9月,V2.5优化了。12月,DeepSeek-V3发布,训练成本据说只有560万美元,比OpenAI的GPT-4低多了,用了不到Meta Llama 3.1的十分之一算力。V3用A100和H800 Nvidia GPU训练,连接InfiniBand和NVLink,上下文长度达到128K。
2025年1月20日,DeepSeek-R1模型推出,这是他们的推理模型,能一步步思考问题,像OpenAI的o1一样。聊天机器人也同步上线,免费给iOS和Android用。没几天,1月27日,它在美国苹果App Store免费榜超ChatGPT,日活跃用户破3000万。开发者用API集成到各种应用,文本生成、数据分析、代码调试都行。R1开源MIT许可,参数规模大,但训练高效,成本控制得好。
马斯克在峰会上特别点名DeepSeek,说中国团队会做更多大事。这话接地气,因为DeepSeek的成功不是靠烧钱,而是优化算法和资源。国家政策支持是关键,国务院推“人工智能+”行动,鼓励创新。DeepSeek的开源策略,也让全球开发者参与,GitHub上代码贡献多,推动社区进步。中国AI就这样从实验室走向大众,影响深远。
当然,AI发展也带来挑战。像IBM用AI替换岗位,亚马逊仓库机器人上岗,银行分析师岗位减少。麦肯锡预测,到2030年,全球14%工作岗位受影响。中国也一样,但我们看到机遇更多。报告说,到2030年,中国AI人才需求600万,缺口400万。这就需要加强教育,从娃娃抓起。
教育部印发通知,推动中小学AI教育。要求探索实施路径,从小学起上AI课,至少8课时,教人机协同。江苏省电化教育馆开发资源,空中课堂开AI通识专栏。上海市徐汇区启动三年行动计划,普及教育、提升教学、培养素养、加强治理。高校行动快,清华大学、北京大学等500多所学校开AI专业或建学院,培养高素质人才。
这些政策不是空话,是实打实的战略布局。国家重视AI,就是为了在新时代弯道超车。DeepSeek的例子说明,中国工程师有实力,有创新精神。马斯克的赞扬,也反映国际对中国科技的认可。我们不能松懈,得继续努力,让AI为人民服务,为国家发展助力。
DeepSeek的V3在2025年3月24日更新为V3-0324,5月28日R1升级R1-0528,更注重官方导向。8月21日,V3.1发布,混合架构,支持思考和非思考模式,工具调用更聪明,在SWE-bench等基准上超前40%。这些迭代,让DeepSeek在全球站稳脚跟。成本低、开源、实用,这就是中国AI的特色。
回想马斯克的话,中国历史悠久,科技底蕴深厚。现在,DeepSeek这样的成果,正让世界看到我们的潜力。AI时代,大家得适应变化,学习新技能。职场人要升级,学生要早学。就像20年前学外语,现在AI就是必备。国家教育改革,就是帮大家抓住机遇。