MiniMax深夜发货,放出了全球最长上下文推理模型:M1,原生支持100万token上下文,是DeepSeek R1 8倍在复杂的软件工程、工具使用、以及长上下文任务上优于DeepSeek-R1、Q
酷,阿里通义团队刚刚放出了一款基于视觉感知RAG框架:VRAG-RL,在Qwen2.5-VL-3B上性能提升了30%VRAG使用强化学习训练模型,使其具备多轮思考和推理能力,来逐步提高VML的理解能力