多功能即时语音克隆技术——OpenVoice
OpenVoice 是一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音。
OpenVoice 不仅能够模仿参考发言人的音质,还可以精细控制包括情感、口音、语调、停顿和节奏在内的各种语音风格。除此之外,对于那些未在大规模发言人训练集中包含的语言,OpenVoice也可以实现“零样本”(Zero-shot)的跨语言模仿。
论文:网页链接
项目:网页链接 宝玉xp的微博视频
发布时间:
2024-01-02 06:03:27
丘山君见
中文不行,英文效果还可以,中文基本上就是老外说中文的效果
宝玉xp
英文好也不错
宝玉xp
回复 任尔布杰-: 期待早日有中文![[赞]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_zan-44ddc70637.png)
零星玉米花
转发微博
无法证明K198901
豆包直接支持 添加自己的语音包
DJSandy怡
大阳哥--
原来是参考tts做的 “This open-source implementation is based on several open-source projects, TTS, VITS, and VITS2. Thanks for their awesome work!”
大阳哥--
Voice cloning 效果还没有xtts好
薛定谔的鱼2021
按照生成式人工智能的发展趋势,我相信在不远的将来,耳听和眼见都不一定为实了!
飞奔的猪1026
活不得的感觉![[笑cry]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_xiaoku-f2bd11b506.png)
![[笑cry]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_xiaoku-f2bd11b506.png)
不明波动
转发微博
开发者开聊
写程序的老王
我的Notion
鸿者健也
我的Notion #AI#