语言模型_AI开源软件

语言模型

Qwen-32B：阿里模型

阿里刚刚放出了：QwenLong-L1-32B，一款用于长上下文推理的LLM，性能优于o3-mini、Qwen3-235B-A22B，与Claude-3.7-Sonnet-Thinking相当Qwen

MiniMax：语言模型

MiniMax深夜发货，放出了全球最长上下文推理模型：M1，原生支持100万token上下文，是DeepSeek R1 8倍在复杂的软件工程、工具使用、以及长上下文任务上优于DeepSeek-R1、Q

Ecne-AI：视频播客生成

给个关键词，就能搜资料、写脚本、完成配音配乐的一款视频播客自动生成工具：Ecne-AI-Podcaster支持男女声，可以给不同的角色（主持人/嘉宾）设置不同的声音可以基于主题，或上传文档生成脚本

MaskSearch：AI推理能力

阿里通义实验室开源了：MaskSearch，增强AI推理能力的框架，让AI学会主动搜索+多步推理，实现复杂问题的精准回答Qwen2.5-1.5B用MaskSearch预训练后，在Bamboogle数据

DeepSeek-R1-0528模型

DeepSeek-R1-0528模型官方说明出来了，思考更深，推理更强！1、深度思考能力强化0528仍使用2024年12月发布的DeepSeek V3 Base作为基座，后训练中投入了更多算力，来提升

VRAG-RL：阿里新的语言模型

酷，阿里通义团队刚刚放出了一款基于视觉感知RAG框架：VRAG-RL，在Qwen2.5-VL-3B上性能提升了30%VRAG使用强化学习训练模型，使其具备多轮思考和推理能力，来逐步提高VML的理解能力

Qwen2.5-Omni

与7B比，处理长文本序列上，显存占用降低了50%，在24GB消费级显卡上也能支持30秒音视频交互保留了7B 90%以上的多模态理解能力，语音输出的准确和稳定性与7B相当

MiMo-7B:小米大模型

小米已入局大模型行列，昨天放出了MiMo-7B，其核心是能解决数学以及代码等复杂的推理问题，说是性能超32B，MiMo-7B-RL媲美OpenAI o1-mini 在数学AIME24/25上分别是68

AI工具箱收录了国内外数百个不同类型的AI工具，每日更新和添加最新AI工具，AI工具集还推荐了AI学习开发的常用网站、框架和模型，帮助你加入人工智能浪潮，自动化高效完成任务！AI脱衣， Undress AI（脱衣AI）， DeepNude（深度裸体），AI去衣裸体生成器，AI消除衣服（消除衣物），Deepfake脱衣（深度伪造脱衣）， GAN脱衣技术（生成对抗网络），AI裸照制作，数字脱衣工具。 Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

AI工具箱导航关于我们免责声明友情链接

关注我们