9月29日，DeepSeek正式发布实验性大模型DeepSeek-V3.2-Ex

溪边闲适的鱼 2025-09-30 16:29:17

9月29日，DeepSeek正式发布实验性大模型DeepSeek-V3.2-Exp并全面开源，以技术创新突破效率与成本瓶颈，引发行业关注。该模型已同步上线Hugging Face与魔搭社区，技术报告及TileLang、CUDA双版本GPU算子也随开源公布，为开发者提供全栈工具支持。核心升级在于全新的DeepSeek Sparse Attention（DSA）稀疏注意力机制。通过闪电索引器与细粒度token选择机制，模型可精准筛选关键信息，将Transformer注意力计算复杂度从O(L)降至O(Lk)，在128K长文本场景下推理成本显著降低，同时保持核心性能稳定。评测显示，其在MMLU-Pro保持85.0分，数学推理AIME 2025、编程Codeforces等任务得分较前代还有小幅提升。生态适配与成本优化成为亮点。华为、寒武纪等芯片厂商已完成适配，华为云等平台同步上线服务，模型最大支持160K上下文长度，可高效处理长篇文档、代码库等场景。API调用成本同步降低超50%，输出价格低至3元/百万tokens，大幅降低开发者与企业使用门槛。目前，DeepSeek App、网页端及小程序均已更新该模型，且临时保留旧版API接口供对比验证。此次发布通过算法创新实现“性能不降、成本减半”，为长文本处理等场景提供高性价比解决方案，开源举措更助力AI技术生态协同发展。

0 阅读：0

溪边闲适的鱼

感谢大家的关注

作者最新文章

1

芯片行业有多种新技术都极具潜力，以下是一些被广泛看好的技术： - 光子芯片：

2

9月29日，DeepSeek正式发布实验性大模型DeepSeek-V3.2-Ex

3

芯片产业的未来趋势将呈现出技术持续突破、市场需求结构变化、产业生态重构等特点：

4

鸡排哥的“安全承诺”，瓷都文旅的民生温度 9月28日，江西景德镇文旅推广座谈

5

假期临近，消费市场热力渐浓随着国庆、中秋8天长假临近，全国各地消费市场已悄

6

医保谈判破天价：SMA患儿的校园新生 2025 年 9 月，济南某小学的开学日里

7

戳这里👉🏻快来看看你能抽到什么签文吧~

8

这就是新疆！你以为它只有茫茫戈壁和沙漠？其实它藏着半个中国的浪漫与鲜活——

9

百万房车不上锁停街头，陌生人开走带全家旅游！车主一句话戳中无数人街头偶遇一

10

美国人抢到的iPhone17，全是咖喱味的由于关税的影响，苹果发往美国的i

热门分类

社会TOP

1

#1.5米蓝绿怪蛇爬到村民家#‌【#专家回应1.5米灰腹绿锦蛇现身村民家#‌】

2

【真的泪目！#老战士起身敬礼场面看哭了#】阅兵式期间，天安门城楼上，参加过抗战的

3

【#接下来3天广东热热热#】#下周或有新台风#9月12日，广东省应急管理厅发文提

4

【#这些笑容太有感染力了#！】场上坚毅，场下活泼，速看超有感染力的笑容！（新华社

5

【#18岁内地女子在香港坠楼身亡#！警务处回应称死因正在调查】#警方调查内地女子

6

【#这些笑容太有感染力了#！】场上坚毅，场下活泼，速看超有感染力的笑容！#新华社

7

【受台风“桦加沙”影响香港天文台改发“十号风球”】24日凌晨2时40分，香港天

8

【台风“米娜”逼近，#粤东多地发布暴雨红色预警信号#！三台共舞】9月19日10时

9

#5万坑位费只卖出58双鞋#【#千万网红带货只卖出1单#：卖产品终究不是“卖面子

10

西贝故事：重度昏迷老人出院后第一时间想吃西贝

社会最新文章

1

#得力道歉##得力集团发布致歉声明#【得力集团回应“员工因跛脚入职当天被辞退”：

2

#城管局副局长涉嫌长期性侵继女被批捕#【六盘水城管局副局长涉嫌“长期性侵继女”，

3

#17岁女孩跳拉丁舞获270万点赞#【#17岁小胖丫跳拉丁舞引人民日报点赞#】最

4

【#警方通报短剧导演熬夜猝死系谣言#】#男子编造短剧导演熬夜猝死被行拘#9月2

5

这位“一把手”安排单位买500斤散装白酒用于公务接待，不知是啥白酒，都接待了谁？

6

【#北京傍晚天空奇观是火箭云#】今晚，很多市民在北京天空看见了“奇观”，大家纷纷

7

【#警方介入女子称被锁办公室殴打#】9月28日（发布），内蒙古鄂尔多斯，一女子报

8

【#女孩卖惨诈骗160万维持富二代人设#】在朋友眼中，婷婷是个真正的富二代，她零

9

【#女婿杀害丈母娘潜逃27年落网#】“这场迟到了27年的正义，今天终于到站了。”

10

【#景区回应男子停车费超20000000#】#男子停车费超20000000不敢取