多功能即时语音克隆技术——OpenVoice

OpenVoice 是一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音。

OpenVoice 不仅能够模仿参考发言人的音质,还可以精细控制包括情感、口音、语调、停顿和节奏在内的各种语音风格。除此之外,对于那些未在大规模发言人训练集中包含的语言,OpenVoice也可以实现“零样本”(Zero-shot)的跨语言模仿。

论文:网页链接
项目:网页链接 宝玉xp的微博视频

发布时间: 2024-01-02 06:03:27

热门评论

丘山君见
丘山君见

中文不行,英文效果还可以,中文基本上就是老外说中文的效果

宝玉xp
宝玉xp

英文好也不错

宝玉xp
宝玉xp

回复 任尔布杰-: 期待早日有中文[赞]

零星玉米花
零星玉米花

转发微博

无法证明K198901
无法证明K198901

豆包直接支持 添加自己的语音包

DJSandy怡
DJSandy怡

[威武][威武][威武][威武][威武]

大阳哥--
大阳哥--

原来是参考tts做的 “This open-source implementation is based on several open-source projects, TTS, VITS, and VITS2. Thanks for their awesome work!”

大阳哥--
大阳哥--

Voice cloning 效果还没有xtts好

薛定谔的鱼2021
薛定谔的鱼2021

按照生成式人工智能的发展趋势,我相信在不远的将来,耳听和眼见都不一定为实了!

飞奔的猪1026
飞奔的猪1026

活不得的感觉[笑cry][笑cry]

不明波动
不明波动

转发微博

开发者开聊
开发者开聊

开发者开聊OpenVoice 是一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音。

写程序的老王
写程序的老王

我的Notion

鸿者健也
鸿者健也

我的Notion #AI#

今日热门