Manus类agent卷疯了,又出来一款ii-agent开源框架,擅长构建跨多个领域工作流的Agent,能独立执行复杂任务已是Agent标配其技能覆盖研究与核查、内容生成、数据分析可视化、软件开发、工
量化投资算法开发平台构建并优化基于人工智能(深度神经网络)的投资算法▸ 集成分布式技术栈,支持使用上市公司实时行情数据执行回测▸ 自动化数据流接入三大金融数据源:IEX Cloud:行情/期权/新闻/
CryptoAlgo AI交易机器人是一款面向以太坊和币安智能链的尖端全自动交易工具。该工具搭载先进算法,通过跨DEX套利、波段交易和网格交易策略实现收益最大化,同时显著降低Gas成本并防御MEV(矿
谷歌基于Gemma 3的一款多模态医疗模型:MedGemma,可以根据医学影像和病历描述生成诊断报告它在胸部X光片、皮肤病图像、眼科图像、病理切片等大量医疗数据上进行了预训练和微调可以看图说话,给一张
想用Python和机器学习增强交易策略?PyBroker正是您需要的工具!这款专为量化交易策略开发的Python框架,尤其专注于机器学习驱动的策略构建。通过PyBroker,您能轻松:✅ 创建与优化交
一个AI保姆项目:ai-baby-monitor,让家长不必时刻紧盯着婴儿,可以安心的做其他事情,也可以延伸到老人看护场景ai-baby-monitor是一个基于本地视频和LLM的AI婴儿监视器,可作
MiniMax深夜发货,放出了全球最长上下文推理模型:M1,原生支持100万token上下文,是DeepSeek R1 8倍在复杂的软件工程、工具使用、以及长上下文任务上优于DeepSeek-R1、Q
酷,浙大、vivo最新出的一款视频虚拟试衣模型:MagicTryOn,服装的时空一致性、稳定性、服装细节都保持的不错,效果可以直接用于电商广告了支持图像试穿、视频试穿,以及自定义试穿擅长在比如跳舞这种
盲测击败了ElevenLabs的一款TTS:Chatterbox,有极强的情感控制能力,可以调整其语音表现力支持语音克隆、风格定制除了正常对话,可以用于一些戏剧化的语音场景隆重推出 Chatterbo
给个关键词,就能搜资料、写脚本、完成配音配乐的一款视频播客自动生成工具:Ecne-AI-Podcaster支持男女声,可以给不同的角色(主持人/嘉宾)设置不同的声音可以基于主题,或上传文档生成脚本
阿里通义实验室开源了:MaskSearch,增强AI推理能力的框架,让AI学会主动搜索+多步推理,实现复杂问题的精准回答Qwen2.5-1.5B用MaskSearch预训练后,在Bamboogle数据
酷,市场部门的AI利器,Firecrawl刚刚放出的:Fire Enrich,给它一份包含电子邮件的表格,它能自动补齐邮件中对应的公司名称、行业、规模等等信息输入电子邮件地址它能输出,包含公司名称、行
赋能AI成为智能视频会议助手的一款工具:joinly,当线上会议时,你可以让AI助手帮你搜信息、做会议纪要、甚至实时翻译支持AI会议助手语音或聊天实时与与会者互动,即时响应能处理中断和多人对话支持Go
腾讯的Hunyuan3D-2.1已经放出来了,精度高,比2.0的渲染效果提升了很多在生成纹理3D资产质量和条件遵循能力上,超过了开源、闭源模型2.1的PBR流程通过基于物理的材质模拟,生成具有真实光照
字节放出了款多主体视频生成神器:MAGREF,能在复杂的场景中保持多个主体的连贯性和精确控制生成的视频质量和效果看起来很高,人物、物体、背景都比较自然支持多人互动视频,单人视频,还可以生成人物+物体+
一分钟克隆声音最强开源工具GPT-sovits安装包
和deepfacelab略有不同,这个是用于直播时候进行换脸的软件
6GB显存可玩,最强的开源AI图生视频工具了。
ComfyUI万相2.1作为开源视频生成领域的突破性框架,正重新定义AI创作的可能性。该技术基于先进的扩散模型架构,通过文本描述直接生成动态视频内容,其核心突破在于:多模态理解能力:融合视觉-语言模型
一、技术本质:平民化的创作引擎秋叶版ComfyUI作为中文社区最强AI工作流整合包,通过三项革新降低技术门槛:零配置部署:预装ControlNet/IPAdapter等28个核心插件,解压即用硬件熔断
Meta刚刚放出了最新研究,开源了基于视频训练的世界模型:V-JEPA 2,具备对物理世界的视觉理解与预测能力,并支持零样本机器人规划就是说V-JEPA 2能通过看视频来理解世界是怎么运转的,能预测接
酷,中山大学、美团等的项目,音频驱动的多人对话视频生成工具:MultiTalk,从效果看人物唇形同步的一致性非常高给它多条音频、一张参考图像、以及一段文字提示,它可以生成一段包含多人对话,或唱歌的互动
根据文字提示生成成人视频内容
一款日语学习AI工具:japanese-analyzer,可以进行日语句子深度解析,拆解句法结构、标注词性、呈现发音和释义原声TTS朗读,还原纯正日语发音一键输出词性、假名、罗马音与语法成分,提供精准
能写代码、设计数据库
基于Qwen3构建一个由MCP驱动的语音助手:mcp-voice-agent,能从数据库中查找信息,还能上网搜索最新的内容实时交互,根据问题灵活选择获取信息的方式,如问题比较复杂,它会先尝试从数据库中
一款设计师的Cursor:onlook,设计师可以用拖拽/点击可视化的方式构建前端界面,不用写代码也可开发前端应用可以直接在浏览器里拖拽、调整元素来设计网站界面,实时预览效果,且内置了AI功能,每一步
可以把非结构化文本转为可视化可交互的知识图谱的一款AI工具:ai-knowledge-graph它通过LLM从文本中提取实体和关系,并以交互式知识图谱的形式可视化这些关系知识图谱可以通过缩放、拖动、点
酷,阿里通义团队刚刚放出了一款基于视觉感知RAG框架:VRAG-RL,在Qwen2.5-VL-3B上性能提升了30%VRAG使用强化学习训练模型,使其具备多轮思考和推理能力,来逐步提高VML的理解能力
新出来的一款生物学推理模型:BioReason,首个将 DNA基础模型与LLM深度结合的模型,疾病通路预测(比如判断某个基因变异导致什么疾病)准确率达到了97%变异效应预测准确率达80-88%。其比仅
一款多智能体交易系统:TradingAgents,它模拟真实的交易团队,通过分析、讨论和决策,来决定是否买卖股票它有分析师、研究员、交易员、风险管理员几个智能体,综合财务数据、市场情绪、新闻报道等多个
具备细粒度语音编辑能力的一款AI语音修复模型:PlayDiffusion,修改后的语音听上去可与原语音无缝衔接,对于做语音播报、或者有声读物,这种需要频繁修改语音内容的场景来说比较实用,支持精准修改,
claude-hub 是一款深度集成 Claude Code AI人工智能能力的 GitHub 工作流工具。它将大语言模型的智能引入代码开发全周期,用户只需在 issue 或 PR 中 @机器人,即可
实用型研究人员AI工具:daily-arXiv-ai-enhanced,搞个工具帮你每天盯新论文做总结它会自动每日爬取arXiv论文,并用AI做总结,需要每天跟踪最新研究动态又没时间的用它默认爬取ht
基于FastMCP和nut.js实现的桌面自动化,用AI自动化你电脑上的一切操作:automation-mcp支持鼠标控制、键盘输入、屏幕截图与分析、窗口管理、UI交互等操作,可以基于它实现复杂的自动
欢迎来到FunFun AI,您的AI女友已准备就绪,将悉心关照您的独特需求,实现您内心最深处的渴望。