👉 项目官网:https://www.python-office.com/ 👈

👉 本开源项目的交流群 👈

atomgit star github star gitee star PyPI Downloads AI交流群

官方群发布信息

AI迭代的速度,已经快到了连吐槽都跟不上的地步。

8月19日晚间,DeepSeek悄无声息地在官方群宣布:线上模型版本已升级至V3.1。没有预热海报,没有发布会,甚至没有一条微博通知,只有一句轻描淡写的“上下文长度拓展至128k”。

这已经是DeepSeek今年第三次重大更新了。距离3月25日的V3-0324版本发布仅过去五个月,距离R1模型5月28日的小版本升级也不过三个月时间。


01 速度狂热

AI领域的竞争已经白热化到什么程度?一家公司五个月内发布三次重大更新[@citation:2]。DeepSeek的迭代速度让人想起智能手机时代的军备竞赛,只不过节奏更快了数倍。

就在不久前,Claude刚刚发布了Opus4.1版本,编程能力提升74.5%。谷歌DeepMind也不甘示弱,推出了能够实时生成交互式3D环境的Genie 3世界模型。

在这样的竞争压力下,DeepSeek似乎选择了以快打慢的策略[@citation:4]。

曾经的大模型霸主

02 V3.1实力如何?

根据官方说法,V3.1最显著的改进是上下文长度从64k扩展到128k。换算成汉字,相当于可以处理10万至13万字的超长文本,足以吞下一整部《骆驼祥子》或《活着》。

多步推理任务的表现较前代提升43%,在数学计算、代码生成和科学分析等复杂任务中准确性更高。同时,模型产生“幻觉”(生成不实信息)的情况减少38%,输出可靠性显著增强。

多语言支持方面,V3.1能处理超过100种语言,尤其提升了对亚洲语言及小众语种的处理能力。

03 用户体验提升

对普通用户来说,128k上下文意味着什么

长文档分析变得轻松了。再也不用把长文切成碎片喂给AI,而是可以直接将整本书、整个项目文档扔给DeepSeek V3.1处理。

程序员们应该会感到开心——模型现在能够更好地理解大型代码库,进行更准确的代码审查和建议。前端代码能力也得到了部分用户的认可。

多轮对话的连贯性也有所提升。AI能够记住更长的对话历史,减少了“金鱼记忆”的尴尬局面。

04 R2何时来?

尽管V3.1带来了不少改进,但用户更期待的显然是下一代大模型DeepSeek-R2。

此前市场传闻R2将于8月15日至30日发布,但接近DeepSeek的知情人士表示,该消息不属实,官方目前无具体发布计划。

有外媒报道称,DeepSeek R2在训练时由于芯片问题导致发生严重错误,可能是延迟发布的原因之一。CEO梁文峰的完美主义倾向也被认为是影响因素。

05 开源承诺

DeepSeek重申了其对开源社区的长期承诺,表示将继续遵循开源发布策略,为全球AI研究社区和开发者提供技术支持。

DeepSeek 在开源方面做了很多工作,涵盖了模型、高性能计算库、文件系统等多个方面。下面我为你整理了它的主要开源项目地址,希望能帮你快速找到需要的资源。

类别项目名称GitHub地址
大模型DeepSeek-V3-0324https://github.com/deepseek-ai/DeepSeek-V3-0324
DeepSeek-R1-0528https://github.com/deepseek-ai/DeepSeek-R1-0528
基础设施3FShttps://github.com/deepseek-ai/3FS
Smallpondhttps://github.com/deepseek-ai/smallpond
高性能计算DeepEPhttps://github.com/deepseek-ai/DeepEP
DeepGEMMhttps://github.com/deepseek-ai/DeepGEMM
FlashMLAhttps://github.com/deepseek-ai/FlashMLA
训练优化DualPipehttps://github.com/deepseek-ai/DualPipe
EPLBhttps://github.com/deepseek-ai/eplb
Profile-Datahttps://github.com/deepseek-ai/profile-data
索引与协作open-infra-indexhttps://github.com/deepseek-ai/open-infra-index

截至发稿时,Hugging Face平台尚未提供V3.1版本的模型权重文件下载。但基于DeepSeek以往的做法,开源版本很可能在不久后发布

06 国际竞争格局

DeepSeek的速度和流行度已经对OpenAI等美国 incumbent 构成了挑战。它展示了中国公司如何以 seemingly a fraction of the cost(看似低得多的成本)在人工智能领域取得长足进步。

是下一个openai吗?

在全球AI技术竞争日趋激烈的背景下,DeepSeek的快速产品迭代策略充分展现了其技术创新能力和市场响应速度。

尽管面临国际制裁带来的高端计算资源获取限制,DeepSeek依然通过创新的高效训练方法和优化策略,在开源大语言模型领域保持了强劲的竞争优势。


API接口调用方式保持不变,开发者无需额外调整即可无缝切换。版本号只是小数点后一位的变化。

但用户体验的改进却是实实在在的:更长的上下文、更准的推理、更少的幻觉。技术迭代不再追求大版本文档的颠覆性变革。

也许我们正在进入AI发展的新阶段:从追求参数的爆炸式增长,转向精细化、实用化的体验优化


另外,大家去给小明的小红书👇账号点点赞吧~!我不想努力了,想吃软饭了。

小红书:爱吃火锅的小明

扫一扫,领红包

美团红包

滴滴红包

程序员晚枫专注AI编程培训,小白看完他和图灵社区合作的教程《30讲 · AI编程训练营》就能上手做AI项目。

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!