一分钟克隆声音最强开源工具GPT-sovits安装包
TTS 是一个用于高级文本转语音生成的库,超过 1100 种语言的预训练模型。
能“一步生成”极为逼真的多角色对话语音能直接根据对话文本生成自然、有情感的多说话人语音可用音频条件(prompt)进行控制,实现情感、语调的定制。可通过音频prompt实现声音克隆权重和推理代码完全公
So-vits-SVC4.1人工语音合成文字教程
文本转语音引擎
OpenVoice 是一种多功能的即时语音克隆模型
提供多种AI语音转化
MetaVoice-1B 是一个 1.2B 参数基础模型
文本转语音
Aero-1-Audio,1.5B参数,在一些基准上表现出了与Whisper、Qwen-2-Audio相当甚至更优的性能,尤其是在参数效率方面它是基于Qwen-2.5-1.5B构建的,核心是能处理15