DeepSeek最新的人工智能模型现在快了2.5倍

2025年8月21日, 18:07

中国人工智能初创公司DeepSeek已推出其神经网络的更新版本，DeepSeek-V3.1。这个新模型引入了对中国处理器的支持，显著提升了速度，并且采用了一种新颖的混合模式。DeepSeek-V3.1利用了一种新的计算类型UE8M0 FP8，减少了内存负担并加快了数据处理。这一发展尤其重要，因为对进口西方半导体的限制日益增加。

根据其创造者的说法，新模型的运行速度比其前身快2.5倍，并支持128K令牌的上下文窗口——是前一个模型的两倍。用户现在可以通过界面中的按钮在“深度”和标准思维模式之间切换，从而根据手头任务灵活管理模型的资源。

新模型在其聊天界面中完全免费使用。对于开发者，API访问定价正在变化：从9月6日起，集成的费用将降低至每100万个输入令牌0.07美元。DeepSeek-V3.1在基准测试中表现出色。它在SVG基准测试中得分53.1%，超越了Gemini 2.5 Flash和GPT-5 Chat。它在ADA测试中也取得了71.6%的得分。

该开源模型可在 Hugging Face上

下载，使用户能够在自己的硬件上本地运行。

此发布是在OpenAI 于8月初推出其新GPT-5 模型后不久。虽然其基础版本也向所有用户开放，无需订阅，但其发布遭到了批评，促使公司恢复了对其前一个模型GPT-4o的访问，尽管其基准性能较低。

帖子已翻译显示原文 (EN)

新闻硬件和技术

关于作者

Arkadiy Andrienko

文章和新闻的作者

作为VGTimes的技术记者，我同样乐于讨论最新的图形处理器，也深入探讨经典RPG的细节。自2018年以来，我一直在撰写关于游戏和设备的文章，我在音频制作领域的工作经验使我能够很好地理解音频技术的细微差别，我总是在寻找游戏设备领域的新事物。当我不在写技术文章时，我很可能在《辐射》中探索后末日的荒原，在《边缘世界》中管理一个殖民地，或者在《钢铁雄心IV》中指挥军队。对我来说，游戏不仅仅是一种爱好——它是一种激情，激发我的创造力，并与不断发展的技术世界保持联系。

...展开