- huayixue
- Oct 08, 2024
世界上排名最靠前的几个文字转音频开源方案
OpenVoice 实现这一能力的关键在于它不需要针对未见过的语言(即不在大规模说话者训练集MSML dataset中的语言)使用这些数据。相反,它只需要一个基础说话者(base speaker),这个基础说话者可以是任何能够流利说该语言的人。基础说话者的数据可以通过现成的模型和数据集轻松获得。
Read MoreOpenVoice 实现这一能力的关键在于它不需要针对未见过的语言(即不在大规模说话者训练集MSML dataset中的语言)使用这些数据。相反,它只需要一个基础说话者(base speaker),这个基础说话者可以是任何能够流利说该语言的人。基础说话者的数据可以通过现成的模型和数据集轻松获得。
Read More