阿里刚刚放出了:QwenLong-L1-32B,一款用于长上下文推理的LLM,性能优于o3-mini、Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking相当Qwen
DeepSeek-R1-0528模型官方说明出来了,思考更深,推理更强!1、深度思考能力强化0528仍使用2024年12月发布的DeepSeek V3 Base作为基座,后训练中投入了更多算力,来提升