DeepSeek大模型上新 关联下代中国芯

新闻探索 2025-09-14 18:43:55 9721

  【大公报讯】据中通社报道:中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,模型其最新大语言模型DeepSeek-V3.1正式发布。上新

  据DeepSeek介绍,关联半半拉拉网新升级版本变化体现在三方面:混合推理架构、下代芯更高的中国思考效率、更强的模型Agent(智能体)能力。通过“深度思考”按钮切换,上新DeepSeek-V3.1实现一个模型同时支持两种模式:面对简单问题时,关联能以“非思考模式”快速回答。下代芯处理复杂问题时,中国半半拉拉网可切换到“思考模式”,模型给出更具深度和逻辑的上新解答。此外,关联DeepSeek-V3.1使用了UE8M0 FP8 Scale的下代芯参数精度。DeepSeek官方公众号在其文章置顶留言里说,中国UE8M0 FP8是针对即将发布的下一代中国产芯片设计。

  官方数据显示,与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间给出答案,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务平均表现与R1-0528持平。

本文地址:http://kunming.fzdingsheng.net/html/79c93898982.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

十年间,这个两岸青创赛事助万名青年携手逐梦

【新闻随笔】看航天科技融入烟火人间

光明文化周末:谁是孔门最可爱的弟子

【光明时评】让更多人享受海洋旅游的乐趣

北京楼市新政落地首周市场观望情绪浓厚

友情链接