语音合成技术模仿明星说话足以乱真 “你好,我是一位非著名相声演员,我的徒弟会唱《五环之歌》。”光看这段词,许多人一下子就能判定,这话应该是相声演员郭德纲说的。那么光听声音你能判断是郭老师本人吗? 昨天,在2018全球有线创新杭州峰会上,科大讯飞展示了语音合成技术。如果不是事先提醒,不少人就把这句话当成了郭德纲本人的配音。除了郭德纲,在一段动画短片里,科大讯飞还模仿了配音演员李立宏的声音,让人仿佛在看《舌尖上的中国》。 本届峰会由中国广播电影电视社会组织联合会技术委员会、美国有线电视实验室(Cable Labs)、华数集团共同发起,由华数集团主办,其中一项任务就是寻找和评选媒体融合的新技术,逐渐把它们带到现实生活里。 永远不会累的“主持人” 对于语音合成技术,经常开车的人都不会陌生。打开高德地图就能听到林志玲嗲嗲的声音,背后的功劳就是语音合成。不过,科大讯飞想要把它用到更多地方,比如代替人类主持。 此前,他们就已和央视新闻展开合作,通过讯飞智声平台合成康辉和欧阳夏丹的声音为用户送上语音祝福,一般用户根本听不出来。在抖音上一度很火的“明星发红包”活动,也是通过讯飞智声平台合成了吴亦凡、何炅、周冬雨等明星的声音,让你在收红包的同时,听明星亲口说出你的名字。 “相比人类主持,人工智能主持形象更丰富,表现更稳定而且不知疲倦。”科大讯飞相关人员表示,如果加上3D人脸捕捉技术,就可以让人工合成的角色坐在屏幕前播报新闻,和人类主持一样有一颦一笑,只不过目前声音的自然度还有待提升。 这样的做法并不是没有先例。备受宅男欢迎的动漫角色“初音未来”,就是用语音合成再加全息投影技术创造出来的虚拟形象,不但发行了专辑而且开起了演唱会。 |