盲测击败了ElevenLabs的一款TTS:Chatterbox,有极强的情感控制能力,可以调整其语音表现力支持语音克隆、风格定制除了正常对话,可以用于一些戏剧化的语音场景隆重推出 Chatterbo
阿里通义实验室开源了:MaskSearch,增强AI推理能力的框架,让AI学会主动搜索+多步推理,实现复杂问题的精准回答Qwen2.5-1.5B用MaskSearch预训练后,在Bamboogle数据
可以把非结构化文本转为可视化可交互的知识图谱的一款AI工具:ai-knowledge-graph它通过LLM从文本中提取实体和关系,并以交互式知识图谱的形式可视化这些关系知识图谱可以通过缩放、拖动、点
酷,阿里通义团队刚刚放出了一款基于视觉感知RAG框架:VRAG-RL,在Qwen2.5-VL-3B上性能提升了30%VRAG使用强化学习训练模型,使其具备多轮思考和推理能力,来逐步提高VML的理解能力
基于FastMCP和nut.js实现的桌面自动化,用AI自动化你电脑上的一切操作:automation-mcp支持鼠标控制、键盘输入、屏幕截图与分析、窗口管理、UI交互等操作,可以基于它实现复杂的自动