中国人工智能初创公司DeepSeek已 推出其神经网络的更新版本,DeepSeek-V3.1。这个新模型引入了对中国处理器的支持,显著提升了速度,并且采用了一种新颖的混合模式。DeepSeek-V3.1利用了一种新的计算类型UE8M0 FP8,减少了内存负担并加快了数据处理。这一发展尤其重要,因为对进口西方半导体的限制日益增加。
根据其创造者的说法,新模型的运行速度比其前身快2.5倍,并支持128K令牌的上下文窗口——是前一个模型的两倍。用户现在可以通过界面中的按钮在“深度”和标准思维模式之间切换,从而根据手头任务灵活管理模型的资源。
新模型在其聊天界面中完全免费使用。对于开发者,API访问定价正在变化:从9月6日起,集成的费用将降低至每100万个输入令牌0.07美元。DeepSeek-V3.1在基准测试中表现出色。它在SVG基准测试中得分53.1%,超越了Gemini 2.5 Flash和GPT-5 Chat。它在ADA测试中也取得了71.6%的得分。
该开源模型可在 Hugging Face上
下载,使用户能够在自己的硬件上本地运行。
此发布是在OpenAI 于8月初推出其新GPT-5 模型后不久。虽然其基础版本也向所有用户开放,无需订阅,但其发布遭到了批评,促使公司恢复了对其前一个模型GPT-4o的访问,尽管其基准性能较低。
帖子已翻译 显示原文 (EN)