近日,第二届中国(杭州)国际智能产品博览会暨2020全球人工智能大会在杭州国际博览中心举行。
在一知智能展位前,中国工程院院士潘云鹤驻足了很久。当他听完企业介绍后与同行的杭州市科技局局长赵喜凯说:“这种跨媒体多模态人机交互产品,是支撑未来机器与人多维度、跨媒体交互,建设‘数字中国’的大势所趋。”
一知智能是谁?鲜为人知,毕竟它是家成立仅3年的年轻企业。公司是一家专注于人机交互的人工智能企业,通过领先的NLP(语言处理)技术深度服务企业营销与客服场景。
会议现场,一知智能正式上线跨媒体多模态人机交互中枢平台。简单点说就是,让机器人能眼观六路、耳听八方,不仅能说会道,还能读懂你的唇语,让机器人有“人的温度”。
这正契合了浙江大学人工智能研究所的跨媒体多模态人机交互研究方向,潘云鹤院士认为,“有很大的应用前景和想象空间”。
你以为和你说话的客服是小姐姐吗?NO!那是机器人
潘云鹤院士的判断,源自对技术的理解和对行业的观察。
所谓跨媒体感知到多模态交互,就是要让机器像人一样,拥有眼、耳、口、鼻、手等五感的基本感知。“将语音、视觉、触控等多种传感器模态组合,即可形成跨媒体多模态人机交互的基本形态。”一知智能创始人、执行总裁陈哲乾说。
2017年,在各种人工智能比赛上崭露头角的陈哲乾、李一夫等人,在金沙江资本的邀请下,组团开启了创业之旅,并注册成立了一知智能,寓意“一问便知”。
“多模态交互,能够让人类在不同场景下选择不同的模态组合进行交互,进而从整体上提高人机交互的自然度。此外,不同模态之间还能形成信息互补,丰富机器人的情感和表达。”
据介绍,一知智能跨媒体多模态人机交互的系统框架,包括三个部分:多模态输入模块、认知和决策控制环节、输出模块。多模态输入模块包括麦克风、摄像头、电流信号等,可对人进行声纹、人脸、物体、动作、表情等进行识别,而认知和决策控制模块则通过AI算法对多模态信号进行思考学习,最后再给出决策响应。
基于这些底层技术,浙大·一知人工智能研究中心与微软亚洲研究院机器学习组合作研发了语音识别引擎、语音合成引擎和虚拟形象引擎,已经让机器人能眼观六路、耳听八方,还能说会道,甚至能读懂你的唇语。
“你电话另一端的机器人客服,你可以随意打断、提问,它都可以对答如流,你以为是小姐姐吗?不是,那是机器人。” 陈哲乾说。
人机语音交互应用场景很多,克隆语音给孩子讲故事都OK!
现状是,跨媒体多模态人机交互技术被广泛应用于呼叫行业。比如,中国移动、中国联通、中国电信及各大小银行和大型企业,都在用语音客服。
“一方面是因前置语音导航、语音识别不准等因素,用户体验并不好;另一方面,呼叫行业流动性大、培训成本高,市场需求巨大。”早在2017年,还在浙江大学读博士的陈哲乾,就看准了这一块市场。
有没有一举两得的方法,帮员工减负、帮企业提效降本?机器人替代人工无疑是最好的选择。“机器人没有情绪,不会出现辱骂客户的情况,而且能24小时在线,且能做到智能响应。”
比如,将跨媒体多模态人机交互中枢平台用于电力营销,机器人可根据参数设置智能判断哪些用户欠费,并进行语音提醒:“您好!你是**小区**单元的**吗?您已欠费***元,请及时缴清电费!”
目前,一知智能每月为国家电网拨打80万交费提醒电话,用户覆盖全省11家地市、42个县区。截至2020年9月底,累计催收电费金额超4亿元。
多模态人机语音交互还有很多应用场景。比如,快递司机智能招聘;银行信用卡逾期提醒;公安反电诈;交警扣分提醒;城管停车管理;智能家居及自助终端……
“我们甚至能克隆你的声音,你到我们录音棚来说几句话,机器就会自动学习你的音色,机器人就会模仿你说话了,完全可以模仿你给孩子讲故事,是不是很有趣?”陈哲乾说。
专门处理自然语言,致力于成为新一代数字生产力引领者
“一个人工客服的成本10万块的话,那机器人只需要1万元,这还仅仅是工资成本,还可以节约场地成本和培训成本。”
其实,阿里、百度、科大讯飞等企业,都瞄准了人机语音交互领域,但他们做的都是平台,而一知智能是从底层技术做到具体项目,并拥有自己的核心技术。
“我们的专业就是做自然语言处理的,包括语音识别的准确率和语音理解的准确率,一句话,就是要机器适应人。”陈哲乾解释说,“你跟小爱同学说,‘小爱同学,我要给**打电话’,它能听懂,但你说‘我要给**打电话,小爱同学’,机器就听不懂了,这就是我们要解决的问题。”
为此,一知智能跨媒体多模态人机交互中枢甚至能适应不同的语境。比如,能听懂带口音的普通话,能在嘈杂环境进行对话,甚至能进行多人对话……
目前,一知智能已与阿里、腾讯、华为、京东、百度等建立商务合作关系,并先后入局物流、水务、税务、银行、燃气等众多基建工程,还与顺丰、猎聘、德邦、建设银行、中国银行等几百家头部企业有深度合作,公司销售收入2020年每月增长速度达到30%。
为了让语音交互技术拥有更多可能性,陈哲乾和团队依然在探索如何让机器人语音更真实自然的答案。
在一知智能的墙上,有这样一句话:“致力于成为新一代数字生产力引领者。”这或许就是企业的初心和愿景。