DeepSeek V3.1深夜上线！这次还行吗？

官方群发布信息

AI迭代的速度，已经快到了连吐槽都跟不上的地步。

8月19日晚间，DeepSeek悄无声息地在官方群宣布：线上模型版本已升级至V3.1。没有预热海报，没有发布会，甚至没有一条微博通知，只有一句轻描淡写的“上下文长度拓展至128k”。

这已经是DeepSeek今年第三次重大更新了。距离3月25日的V3-0324版本发布仅过去五个月，距离R1模型5月28日的小版本升级也不过三个月时间。

01 速度狂热

AI领域的竞争已经白热化到什么程度？一家公司五个月内发布三次重大更新[@citation:2]。DeepSeek的迭代速度让人想起智能手机时代的军备竞赛，只不过节奏更快了数倍。

就在不久前，Claude刚刚发布了Opus4.1版本，编程能力提升74.5%。谷歌DeepMind也不甘示弱，推出了能够实时生成交互式3D环境的Genie 3世界模型。

在这样的竞争压力下，DeepSeek似乎选择了以快打慢的策略[@citation:4]。

曾经的大模型霸主

根据官方说法，V3.1最显著的改进是上下文长度从64k扩展到128k。换算成汉字，相当于可以处理10万至13万字的超长文本，足以吞下一整部《骆驼祥子》或《活着》。

多步推理任务的表现较前代提升43%，在数学计算、代码生成和科学分析等复杂任务中准确性更高。同时，模型产生“幻觉”（生成不实信息）的情况减少38%，输出可靠性显著增强。

多语言支持方面，V3.1能处理超过100种语言，尤其提升了对亚洲语言及小众语种的处理能力。

对普通用户来说，128k上下文意味着什么？

长文档分析变得轻松了。再也不用把长文切成碎片喂给AI，而是可以直接将整本书、整个项目文档扔给DeepSeek V3.1处理。

程序员们应该会感到开心——模型现在能够更好地理解大型代码库，进行更准确的代码审查和建议。前端代码能力也得到了部分用户的认可。

多轮对话的连贯性也有所提升。AI能够记住更长的对话历史，减少了“金鱼记忆”的尴尬局面。

尽管V3.1带来了不少改进，但用户更期待的显然是下一代大模型DeepSeek-R2。

此前市场传闻R2将于8月15日至30日发布，但接近DeepSeek的知情人士表示，该消息不属实，官方目前无具体发布计划。

有外媒报道称，DeepSeek R2在训练时由于芯片问题导致发生严重错误，可能是延迟发布的原因之一。CEO梁文峰的完美主义倾向也被认为是影响因素。

DeepSeek重申了其对开源社区的长期承诺，表示将继续遵循开源发布策略，为全球AI研究社区和开发者提供技术支持。

DeepSeek 在开源方面做了很多工作，涵盖了模型、高性能计算库、文件系统等多个方面。下面我为你整理了它的主要开源项目地址，希望能帮你快速找到需要的资源。

类别	项目名称	GitHub地址
大模型	DeepSeek-V3-0324	https://github.com/deepseek-ai/DeepSeek-V3-0324
	DeepSeek-R1-0528	https://github.com/deepseek-ai/DeepSeek-R1-0528
基础设施	3FS	https://github.com/deepseek-ai/3FS
	Smallpond	https://github.com/deepseek-ai/smallpond
高性能计算	DeepEP	https://github.com/deepseek-ai/DeepEP
	DeepGEMM	https://github.com/deepseek-ai/DeepGEMM
	FlashMLA	https://github.com/deepseek-ai/FlashMLA
训练优化	DualPipe	https://github.com/deepseek-ai/DualPipe
	EPLB	https://github.com/deepseek-ai/eplb
	Profile-Data	https://github.com/deepseek-ai/profile-data
索引与协作	open-infra-index	https://github.com/deepseek-ai/open-infra-index