DeepSeek-R1-0528模型官方说明出来了,思考更深,推理更强!
1、深度思考能力强化
0528仍使用2024年12月发布的DeepSeek V3 Base作为基座,后训练中投入了更多算力,来提升模型的思维深度与推理能力
在数学、编程、通用逻辑等能力优秀,在整体表现上已接近o3、Gemini-2.5-Pro
较于旧版R1,新模型在复杂推理任务中有显著提升,在AIME 2025测试中,新版模型准确率由70%提升至 87.5%
通过蒸馏DeepSeek-R1-0528的思维链后训练Qwen3-8B Base,得到了一个DeepSeek-R1-0528-Qwen3-8B
8B在数学测试AIME 2024中仅次于DeepSeek-R1-0528,超越Qwen3-8B (+10.0%),与Qwen3-235B相当
2、其他能力更新
幻觉改善,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右
创意写作,新模型能够输出篇幅更长、结构内容更完整的长篇作品,可呈现出更加贴近人类偏好的写作风格
工具调用:0528支持工具调用(不支持在thinking中进行工具调用),能力与OpenAI o1-high 相当,与o3-High以及 Claude 4 Sonnet仍有差距
在前端代码生成、角色扮演等领域的能力均有更新提升
3、API 更新
已同步更新,接口与调用方式不变。新版R1 API仍支持查看模型思考过程,同时还增加了Function Calling和JsonOutput的支持
现在max_tokens用于限制模型单次输出的总长度(包括思考过程),默认为 32K,最大为 64K
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。