又为大家找到一款AI声音克隆工具,一个Web版声音克隆平台。名为:clone-voice。
可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。这款基于 Web 界面的声音克隆工具,可让你无需繁琐配置即可轻松体验语音转换的乐趣。
项目介绍
clone-voice 是一款基于CoquiAI技术实现的声音克隆工具,它能够根据你的声音样本或其他任何声音样本,生成与样本声音高度相似的新声音。
支持 中、英、日、韩、法、德、意等16种语言,可在线从麦克风录制声音。
为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,尽量不要存在背景噪声。
主要功能
- • 声音克隆:根据声音样本或文字,生成与你声音高度相似的新声音。
- • 语调调整:可以调整语调、语速等参数,使生成的声音更加自然。
- • 个性化定制:可以根据用户需求,定制不同的声音风格,例如男性、女性、儿童等。
- • 多语言支持:支持 16 种语言,包括中文、英文、日语、韩语等。
- • 在线录音:通过麦克风直接录制声音,并以此为样本进行克隆。
- • 易于使用的 Web 界面:无需安装复杂的软件,鼠标点几下即可完成操作。
- • 无硬件门槛:不需要强大的 GPU 配置,即便没有显卡也能正常运行。
技术亮点
基于 Coqui AI 的 TTS 模型
clone-voice 使用领先的 Coqui AI TTS 模型,提供高质量的语音克隆与转换效果。
快速使用
预编译版
作者提供了 Windows 预编译版,下载预编译版本后,双击 app.exe
打开一个web界面,鼠标点点就能用。
本地部署
下载源码包,支持Linux、Mac、Windows等操作系统,需要自行编译安装。
源码版需要在 .env 中 HTTP_PROXY=设置代理,否则无法下载到模型文件。
写在最后
无论是工作需要,还是娱乐创作,clone-voice 都能为你提供强大且便捷的声音克隆和语音转换功能。16 种语言支持、低门槛使用体验。
但是该工具与其他主流开源声音克隆模型相比,还是存在一些不足之处。应付常用场景也足够了。
GitHub 项目地址:https://github.com/jianchang512/clone-voice
原创文章,作者:北单,如若转载,请注明出处:https://www.beidanyezhu.com/a/359.html