给机器装上大脑、眼睛和手脚
创业过程中,孙林君接到西湖大学AI科学家蓝振忠博士的电话,对方提到了一家名叫Adept AI Labs的公司。
这是一家位于旧金山、专注于开发通用人工智能(AGI)助手的初创公司,核心成员之一,就是当年发布Transformer框架论文的作者——前谷歌大脑研究员Ashish Vaswani。
当时成立仅一年时间,Adept AI Labs估值便突破10亿美元,成为AI Agent独角兽公司。这家公司的使命是:创建能够像人类一样使用各种电脑软件完成工作的AI智能体。
这个愿景和实在智能不谋而合。只不过两家公司走了不同的路线。Adept AI Labs是在浏览器上装一个插件,所以只能操作基于浏览器的软件。实在智能的Agent可以兼容和操作一切浏览器和服务器、客户端。
刚开始,RPA数字员工最常用的场景是财务对账、订单处理、数据批量导入导出等。孙林君发现其中有一定的局限性。
比如财务最常见的一个场景应用,企业下载资金流水,需要先登录到银行,选中对应日期,查询再进行下载。通过RPA,这套工作可以用机器人自动完成,但背后需要软件工程师先将这一套流程的代码打出来,或者企业内部用拖拉拽的方式在独立的机器人上才能够完成。
换句话说,传统的RPA还是依赖于程序员或者懂程序的人。“对财务、HR这些非技术岗位来说,门槛太高了,把小白逼成了程序员。”孙林君说。
为了让小白也能迅速上手,2019年,孙林君和团队开始尝试RPA+AI融合的方式,即用IPA(智能流程自动化)来突破局限性。
当时大模型还不是很成熟,孙林君提了一个大胆但很确信的梦想:为全世界贡献100万个数字员工。
为此,他们彻底重构了RPA的底层架构。2022年底,ChatGPT大语言模型刚刚横空出世,有着很强AI背
景的实在智能团队迅速推出了智能屏幕语义理解技术ISSUT以及自研垂直“TARS(塔斯)大语言模型”。
简单来说,TARS大模型就相当于“大脑”,ISSUT相当于“眼睛”,IPA则是“手和脚”。也就是说,给机器装上大脑、眼睛和手脚。
“智能体有很强的思维能力和理解能力,在这个基础上给它加上手和脚,相当于加上了行动能力,使得它不仅能思考,并且能够行动。”经过这么一调整,整合了计算机视觉和底层框架之后,实在智能Agent更像一个“人”了。
一群激情的人
一起做一件激情的事
拥有一个实在Agent或者说是数字员工,它能帮你做什么?
在最近的一场发布会上,实在智能合伙人兼核心算法部负责人欧阳小刚揭示了实在Agent的三大核心技术体系:类人级推理能力、无限链接能力、场景适应能力。
假如你是一位HR,想招聘员工,你只要告诉它:请帮我到BOSS直聘筛选两个见习前端工程师。
电脑里的Agent就会自动登录BOSS直聘的职位管理页面,自动识别你要招聘的岗位的要求及筛选条件。在牛人页面里,他会挨个顺序点开,一一查看牛人的简历,然后调用大模型分析是否符合你的要求,如果符合,它会自动向牛人打招呼。以此类推,最终执行完成后,再告诉你执行的结果。整个过程不需要人工参与。
假如你是一名汽车记者,想快速创作一条汽车新闻,可以对它说:帮我写最新的汽车新闻。Agent就会去你指定的源头找到热门汽车新闻,然后根据你的需求进行仿写。
如果觉得文字稿不够,你可以让它帮你快速剪辑一条视频。它会自动连上剪映App,一键成片。再也不怕软件之间不兼容,Agent可以操控你电脑里的所有软件。
如果你是一名财务,想将两个封闭系统的表格合成一张,你可以这样告诉它:请帮我把“有用”财务软件内的财务数据和CRM中的财务报销报表进行合并。它就能分别下载相应表格,统计合成一张。
当然,你也可以用一句话让它买咖啡、订机票、制订旅游计划等。
和很多80后一样,孙林君是看着热血动漫长大的。从读书的时候开始追动漫,一直追到了工作以后。现在只要有时间,偶尔还会刷两集过过瘾。在创办实在智能以后,他把热血动漫文化带进了公司。
孙林君把公司文化定义为“一群激情的人一起做一件激情的事”。
在位于南湖未来科学园的实在智能,处处是动漫元素。除了各种手办,各个会议室用动漫命名。每个员工不管年龄大小,都有一个动漫角色的花名。比如孙林君的花名是《功夫熊猫》里的阿宝,也就是“神龙大侠”功夫熊猫本尊,合伙人兼核心算法部负责人欧阳小刚的花名是《名侦探柯南》里的“新一”。
目前,实在智能有员工300多人,研发人员占比达54%。在实在智能办公室,陈列着80多项已授权发明专利,以及300多项知识产权。从初创公司到成为国家级专精特新“小巨人”企业,只用了六年。
今年,实在智能在日本设立了子公司,AI数字员工已经在日本近百家大公司正式上岗。