电话会议到现在,六点再爬起来去机场,也要代友转达对维克托中文配音演员的评价(大概是最奇葩最技术流的评价)。
昨晚搬砖搬到眼睛成一条缝,突然接到一老友电话,这位大哥是国内人工智能top独角兽厂的创始人和前硅谷屈指可数的AI语音专家,做的事简单说就是研究人类最有吸引力的语音,并让AI学习如何像人类一样逼真地说话。
大哥说双城之战是最近他和他的程序员们固定的娱乐项目,职业病让他对维克托的中文配音产生了一些特别的兴趣,百度名字看到照片儿感觉眼熟,像之前参观我办公室时挂在墙上那位,问问我是不是。
我一条缝的眼睛瞬间就圆了,问为什么感兴趣,大哥原话大概是:知道你听不懂,简单说,从我们搞AI语音的角度,人说话时的感情层次越复杂多变,越难做machine learning。这小伙儿属于,说话时的感情层次挺复杂,情绪信息的饱和度相当高,意外和内心复杂的人格耦合度很高,配出来的效果容易让人印象深刻。但可能因为不是专业配音,和我们目前掌握的一些专业播音、配音的机器学习模型有明显差异,难以模式化,属于目前AI语音技术比较难建模的类型。如果AI学会了这类模型,机器就可以像人一样表达一些需要复杂情绪甚至神经质、偏执狂类的“人”格。我打算让团队研究下这类型的建模和deep learning。另外话说回来,虽然我们只研究人的表达方式,不模仿声音或合成声音,但他的音色也很特殊哈,也很适合Edward Scissorhands这类神经质,或者多重人格。没准儿以后有机会和他合作,你要是来帮我,我带你追星。
我:呦,合着在这儿等我呢,天天想让我去你那儿打杂,行,你们要是有一天能和他合作,你们那个红筹的白日梦我帮你做。对了,你要想让你的机器人儿学内心复杂的“偏执狂”怎么说话,你找一部叫白发的电视剧。那个容齐一定不让你失望。
嘿,哥们儿,祝贺你又凭自己本事“跨圈儿”了,以我意想不到的方式。
罗云熙Leo