为什么在车里说“我想看星星”,车子的天窗就会打开?
导航软件里出现林志玲的声音,真的是林志玲本人说的吗?
10月12日上午,2017年云栖大会的第二天,一场名为“智能语音交互专场”的论坛,为很多人打开了一扇窗:原来,“云计算”还有这样的神奇能力!
以假乱真的“林志玲”
去年的云栖大会,马云的演讲被飞速翻译成文字,显示在现场的大屏幕上。
事实上,记录这一切的是人工智能,而非速记手。在它的背后,是阿里云智能交互语音团队的努力。
一年后,这套系统更厉害了。“在基于阿里云系统的互联网汽车,经过不断升级,不仅语音识别率大大提高,还增加了很多功能。”阿里巴巴iDST智能交互团队总监鄢志杰说。
比如,现在车主可以和互联网汽车玩“成语接龙”游戏:你说一句成语,汽车接着说下一句。“很多车主告诉我,有了这个游戏,上班路上堵车都不那么枯燥了。”
如果语音识别,是让机器更懂你。那么语音合成,则会让你更懂机器。西北工业大学教授谢强,现场演示了一段用机器模拟林志玲的语音,引发了大家会心的笑声:“真的很像!”
新产品背后的人工智能
手机、家电、汽车……很多人有这样的感觉:身边的智能语音设备越来越多,可以动口不动手了。
生活越来越方便的背后,是云计算和大数据不断深入介入,攻克了过去无法攻克的难关。
现场,正如所佐治亚理工学院教授、著名语音交互科学家李锦辉所说:云计算、人工智能,让一切都变得不同了。他举了一个形象的例子——
过去,识别一段语音,或者模拟一段语音,机器像学生,人类像考官。机器做得好不好,人类给个分数,分数低了,机器回去改进。
如今,由于云计算和大数据技术的介入,强大的分析能力让机器既是学生,又是考官。不断自我判定、自我修正,犹如机器一下子拥有了学习的能力,进步就非常快了。
“通过人工智能,能够把周边的噪音消除,降低不同语种、不同环境对声音的干扰,因而得到更纯净、更准确的声音,是近期技术的一大进步。” 李锦辉告诉现场听众。
|