中國AI公司深度求索宣布正式發布DeepSeek-V3.1版本,涉及混合推理架構的升級,一個模型將能夠同時支持思考模式與非思考模式。思考效率得以提升,相較DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內給出答案。
DeepSeek-V3.1版本亦擁有更強的Agent能力,通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。目前官方應用程式及網頁模型均已同步升級為DeepSeek-V3.1,用戶可以通過深度思考按鈕,實現思考模式與非思考模式的自由切換。
在代碼修復測評SWE與命令行終端環境下的複雜任務測試中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明顯提高,在多項搜索評測指標上也取得較大提升。在需要多步推理的複雜搜索測試與多學科專家級難題測試上,DeepSeek-V3.1性能大幅領先R1-0528。測試結果顯示,經過思維鏈壓縮訓練後,V3.1-Think在輸出token數減少20%至50%的情況下,各項任務的平均表現與R1-0528持平。
DeepSeek API亦已同步升級,Deepseek-chat對應非思考模式,Deepseek-reasoner對應思考模式,上下文均已擴展為128K,並新增對Anthropic API格式的支持,用戶可將DeepSeek-V3.1的能力接入Claude Code框架。
深度求索表示,將於9月6日凌晨起調整DeepSeek開放平台API接口調用收費,DeepSeek-V3.1輸入每百萬tokens緩存命中及緩存未命中收費分別為0.5及4元人民幣,輸出每百萬tokens收費12元人民幣,同時將取消夜間時段優惠。(gc/j)
AASTOCKS新聞