多功能即时语音克隆技术..._宝玉xp的视频-我爱看围脖

多功能即时语音克隆技术——OpenVoice

OpenVoice 是一种实用性极强的即时仿声技术，只需要使用来自目标发言人的短音频，就可以模仿他们的声音，并以此生成各种语言的语音。

OpenVoice 不仅能够模仿参考发言人的音质，还可以精细控制包括情感、口音、语调、停顿和节奏在内的各种语音风格。除此之外，对于那些未在大规模发言人训练集中包含的语言，OpenVoice也可以实现“零样本”（Zero-shot）的跨语言模仿。

论文：网页链接
项目：网页链接宝玉xp的微博视频

发布时间： 2024-01-02 06:03:27

热门评论

丘山君见

丘山君见

中文不行，英文效果还可以，中文基本上就是老外说中文的效果

宝玉xp

英文好也不错

宝玉xp

回复任尔布杰-: 期待早日有中文

零星玉米花

零星玉米花

转发微博

无法证明K198901

无法证明K198901

豆包直接支持添加自己的语音包

DJSandy怡

DJSandy怡

大阳哥--

大阳哥--

原来是参考tts做的 “This open-source implementation is based on several open-source projects, TTS, VITS, and VITS2. Thanks for their awesome work!”

大阳哥--

大阳哥--

Voice cloning 效果还没有xtts好

薛定谔的鱼2021

薛定谔的鱼2021

按照生成式人工智能的发展趋势，我相信在不远的将来，耳听和眼见都不一定为实了！

飞奔的猪1026

活不得的感觉

不明波动

不明波动

转发微博

开发者开聊

开发者开聊

开发者开聊OpenVoice 是一种实用性极强的即时仿声技术，只需要使用来自目标发言人的短音频，就可以模仿他们的声音，并以此生成各种语言的语音。

写程序的老王

写程序的老王

鸿者健也

鸿者健也

我的Notion #AI#

搜索一下

今日热门