【寻找新质生产力青年】百模大战“潜行者”赵天成
杭州网  发布时间:2024-08-02 09:01   

回国近4年

仿佛又读了个博士

2014年,赵天成如愿考入CMU语言技术研究所,研究基于预训练的端到端的生成式模型,并应用于人机对话系统。在这轮生成式人工智能热潮中,来自CMU的群星正在闪耀。阿里斥巨资入股的月之暗面创始人杨植麟就是其中的代表。

赵天成的导师里,有CMU人机交互中心的Maxine Eskenazi教授,Louis-Philippe Morency教授则于2018年提出多模态,而AI谷歌首席科学家William W Cohen(杨植麟的博士生导师),也给了他诸多指导……

“这种系统性的训练,让我们学会往前看,做5年后才能爆发的技术,而不是在现有技术项目上‘打补丁’。”赵天成用了4年半,便完成了通常需要六七年的博士学业,其间累计发表20多篇顶会论文。

初到CMU时,主导师Maxine Eskenazi和合作导师Alan Black已开发出全球第一个实用人机交互系统Let’s Go,可以实现打电话询问公交车信息和订票的功能。

“之后很多年里,大部分对话类研究基于该系统完成。但它全部靠专家系统模块组合而成,智能上限低,距离真正的应用还有很大距离。”2017年,AlphaGo战胜人类顶尖围棋选手,赵天成意识到,端到端学习有能力改变专家系统拼凑的方式,通过完整的一套学习机制去实现真正的智能体。于是,他们把Let’s Go系统转成了生成式。

2020年,学成后的赵天成在硅谷短暂创业后,选择回国接班。父亲赵凡创办于1994年的联汇科技,是当时国内领先的广电系统解决方案供应商。儿子决定利用所学来全面升级公司,回国的第一天就开始打磨基础模型。2021年,联汇推出首个自研的多模态大模型。

从埋头做技术,到成为联汇科技CEO和首席科学家,对于赵天成来说,这是一个适应和转变新角色的过程。“回国近4年,就好像又读了一个博士,社会大学的博士”。

对话“新青年”

目前研发团队有200人左右

橙柿互动:您在CMU时期研究的生成式对话系统,和现在的ChatGPT等相比,有什么不同?

赵天成:核心原理非常接近,都是自回归模型预训练,最主要区别在规模上。比如,我当时训练的是亿级的RNN(循环神经网络),训练数据可能是几千万个Token(标记),现在可能是百亿级、千亿级Transformer(基于自注意力机制的深度学习模型),几万亿个Token。

橙柿互动:公司目前的核心技术团队,是怎样一个构成?

赵天成:回国前我曾和CMU的同学在硅谷短暂创业,团队也跟着一起回来了,又陆续招聘了一些,像是加州大学、浙大、微软与阿里巴巴等院校和机构的硕博士。目前,浙江大学滨江研究院Om人工智能研究中心差不多有50人,整个研发团队200人左右。

智能体技术

能降低大模型“幻觉”问题

橙柿互动:您和团队的技术研发成果眼下更多是在B端落地,会考虑拓展到C端吗?比方说居家场景,养老就是很大一块市场。

赵天成:孩子有没有按时完成暑假作业,老人有没有准时吃药……AI看懂并解析画面后,都可以提醒主人,充当管家角色。

橙柿互动:大模型存在“幻觉”问题,在输电线路巡检、店铺管理等实际应用场景中,如何避免它“胡说八道”?

赵天成:这也是智能体技术至关重要的主要原因之一。理论上讲,大模型永远无法解决“幻觉”问题,只能使用各种手段将概率降到尽可能低。例如,通过整合外部知识库,或者采用自我校正机制,可以有效减少这种概率。

来源:都市快报  作者:记者 童蔚  编辑:郑海云
返回
杭州网·国家重点新闻网站