【寻找新质生产力青年】百模大战“潜行者”赵天成
杭州网  发布时间:2024-08-02 09:01   

ed6727c3bb856797668d2bb586dcc628_rB4AiWar94SAEEASAAH4c1RQ1rI511.jpg

记者 陈中秋 摄 制图 李前芳

站在人工智能技术爆发的节点,赵天成回想起多年前在卡耐基梅隆大学(CMU)求学时收获的教诲,依然心存感激。导师告诉他,To be a leader, not a follower,做一个勇于尝试的引领者远比在风口追随着他人来得重要。

作为杭州联汇科技的CEO、首席科学家,这个90后“创二代”正在加速将多模态大模型和智能体,推广应用于与你我每个人相关的民生领域。

大模型变成摄像头“大脑” 能帮老板“看店”

联汇科技位于滨江区互联网产业园,这里曾是网易、阿里崛起的摇篮,互联网、物联网技术从这里走入日常生活。

现在轮到了人工智能。

对一家街边小店来说,摄像头除了监控,还有什么作用?联汇科技说,有了多模态智能体的协助,摄像头会告诉老板今天来了多少顾客、什么商品最好卖、哪个角落的商品摆放不合理易造成拥堵……相当于给了摄像头一颗大脑。

所谓的多模态,你可以把它理解为除了文本语言,还有图像、视频、音频等多种模态信息的协同推理;而智能体,指的是能够自主感知环境、思考,并做出决策、行动的系统,也是眼下许多创业公司最看好的AI应用发展方向。

作为一家多模态大模型公司,在7月初举行的2024世界人工智能大会上,联汇科技发布第二代多模态智能体OmAgent;同时,根据应用需求与落地场景的不同,上线空间运营智能体、知识服务智能体两大系列。

除了帮老板“看店”,再以电力行业为例,“中国现有200万公里高压输电线路,二三十万座变电站。过去,输电线路的巡检主要依赖无人机拍摄的图像,然后由人工逐张检查。”赵天成透露,眼下联汇科技正在和各地电力公司、电科院等机构合作,利用多模态的思考能力,提升图像缺陷识别准确率,并生成相应解决方案,自动化完成输电线路的巡检。

用多模态找到可行的商业化路径

产品系列中的Om,在梵文里有宇宙源头之意,智慧的源泉。连同挂在赵天成办公室里的“创生之柱”画像(2015年由哈勃望远镜拍摄,属于鹰状星云的一部分,后者是银河系中孕育最多恒星的区域之一),代表着他和团队对AGI(通用人工智能)的希冀和求索。

“有人说两三年,我觉得乐观了些,5-10年可能看得到。”他说。而多模态,是通往AGI的必经之路。

虽然技术水平有差距,但这两年,国内不少大模型公司和OpenAI面临着同样的压力:一边要拼命奔跑将追赶者甩开,一边又要寻求将技术转化为实际商业价值的路径,在理想和现实中反复拉扯。

赵天成和团队看上去要从容许多。当行业刚开始关注大语言模型,他们已经坚定地选择走多模态的方向,并取得工信部大模型检测的001号证书;去年“百模大战”打响,他们抢先发布自研OmModel多模态大模型的V3版本,以及国内首批大模型驱动的智能体应用。

目前,联汇科技多个智能体应用,通过与运营商、国家电网、广电媒体等企业机构的合作而实现规模化落地,使得他们成为国内为数不多已经找到可行商业化路径的大模型公司。

要比别人先行一步,甚至是两三步的这种思维模式和行动力,在很大程度上得益于赵天成过往的求学经历。

1991年出生的赵天成初中就读于育才,高中考上了杭二中;在加利福尼亚大学洛杉矶分校(UCLA)的本科阶段,双修电子工程+计算机,以全院第一的成绩成为2014级工程学院杰出毕业生;随后在CMU完成硕博连读。

“大四那年参与到实验室的科研工作,当时一起做了一款App,对着它说一句话,它就能通过分析声音频率测算胸腔大小,反推你的身高,当时吸引了全校很多同学试用。”在这个过程中,AI为他打开了一扇全新的大门。

来源:都市快报  作者:记者 童蔚  编辑:郑海云
返回
杭州网·国家重点新闻网站