👉 项目官网:https://www.python-office.com/ 👈
👉 本开源项目的交流群 👈
AI迭代的速度,已经快到了连吐槽都跟不上的地步。
8月19日晚间,DeepSeek悄无声息地在官方群宣布:线上模型版本已升级至V3.1。没有预热海报,没有发布会,甚至没有一条微博通知,只有一句轻描淡写的“上下文长度拓展至128k”。
这已经是DeepSeek今年第三次重大更新了。距离3月25日的V3-0324版本发布仅过去五个月,距离R1模型5月28日的小版本升级也不过三个月时间。
01 速度狂热
AI领域的竞争已经白热化到什么程度?一家公司五个月内发布三次重大更新[@citation:2]。DeepSeek的迭代速度让人想起智能手机时代的军备竞赛,只不过节奏更快了数倍。
就在不久前,Claude刚刚发布了Opus4.1版本,编程能力提升74.5%。谷歌DeepMind也不甘示弱,推出了能够实时生成交互式3D环境的Genie 3世界模型。
在这样的竞争压力下,DeepSeek似乎选择了以快打慢的策略[@citation:4]。
02 V3.1实力如何?
根据官方说法,V3.1最显著的改进是上下文长度从64k扩展到128k。换算成汉字,相当于可以处理10万至13万字的超长文本,足以吞下一整部《骆驼祥子》或《活着》。
多步推理任务的表现较前代提升43%,在数学计算、代码生成和科学分析等复杂任务中准确性更高。同时,模型产生“幻觉”(生成不实信息)的情况减少38%,输出可靠性显著增强。
多语言支持方面,V3.1能处理超过100种语言,尤其提升了对亚洲语言及小众语种的处理能力。
03 用户体验提升
对普通用户来说,128k上下文意味着什么?
长文档分析变得轻松了。再也不用把长文切成碎片喂给AI,而是可以直接将整本书、整个项目文档扔给DeepSeek V3.1处理。
程序员们应该会感到开心——模型现在能够更好地理解大型代码库,进行更准确的代码审查和建议。前端代码能力也得到了部分用户的认可。
多轮对话的连贯性也有所提升。AI能够记住更长的对话历史,减少了“金鱼记忆”的尴尬局面。
04 R2何时来?
尽管V3.1带来了不少改进,但用户更期待的显然是下一代大模型DeepSeek-R2。
此前市场传闻R2将于8月15日至30日发布,但接近DeepSeek的知情人士表示,该消息不属实,官方目前无具体发布计划。
有外媒报道称,DeepSeek R2在训练时由于芯片问题导致发生严重错误,可能是延迟发布的原因之一。CEO梁文峰的完美主义倾向也被认为是影响因素。
05 开源承诺
DeepSeek重申了其对开源社区的长期承诺,表示将继续遵循开源发布策略,为全球AI研究社区和开发者提供技术支持。
DeepSeek 在开源方面做了很多工作,涵盖了模型、高性能计算库、文件系统等多个方面。下面我为你整理了它的主要开源项目地址,希望能帮你快速找到需要的资源。
类别 | 项目名称 | GitHub地址 |
---|---|---|
大模型 | DeepSeek-V3-0324 | https://github.com/deepseek-ai/DeepSeek-V3-0324 |
DeepSeek-R1-0528 | https://github.com/deepseek-ai/DeepSeek-R1-0528 | |
基础设施 | 3FS | https://github.com/deepseek-ai/3FS |
Smallpond | https://github.com/deepseek-ai/smallpond | |
高性能计算 | DeepEP | https://github.com/deepseek-ai/DeepEP |
DeepGEMM | https://github.com/deepseek-ai/DeepGEMM | |
FlashMLA | https://github.com/deepseek-ai/FlashMLA | |
训练优化 | DualPipe | https://github.com/deepseek-ai/DualPipe |
EPLB | https://github.com/deepseek-ai/eplb | |
Profile-Data | https://github.com/deepseek-ai/profile-data | |
索引与协作 | open-infra-index | https://github.com/deepseek-ai/open-infra-index |
截至发稿时,Hugging Face平台尚未提供V3.1版本的模型权重文件下载。但基于DeepSeek以往的做法,开源版本很可能在不久后发布。
06 国际竞争格局
DeepSeek的速度和流行度已经对OpenAI等美国 incumbent 构成了挑战。它展示了中国公司如何以 seemingly a fraction of the cost(看似低得多的成本)在人工智能领域取得长足进步。
在全球AI技术竞争日趋激烈的背景下,DeepSeek的快速产品迭代策略充分展现了其技术创新能力和市场响应速度。
尽管面临国际制裁带来的高端计算资源获取限制,DeepSeek依然通过创新的高效训练方法和优化策略,在开源大语言模型领域保持了强劲的竞争优势。
API接口调用方式保持不变,开发者无需额外调整即可无缝切换。版本号只是小数点后一位的变化。
但用户体验的改进却是实实在在的:更长的上下文、更准的推理、更少的幻觉。技术迭代不再追求大版本文档的颠覆性变革。
也许我们正在进入AI发展的新阶段:从追求参数的爆炸式增长,转向精细化、实用化的体验优化。