渐冻症患者新年的第一张全家福是AI做的 谁在用AI点亮杭州未来
杭州网  发布时间:2024-02-07 08:20   

AI正在为人类弥补缺憾

拍摄一张全家福,是很多中国家庭的重要仪式。不过很多人因为分隔多地、相聚困难,甚至亲人的突然离开,而无法拥有一套精美的全家福照片。

赵崇周的这张全家福,来自阿里云通义千问刚刚上线的新应用“通义照相馆”,其中的全家福模块,可以为所有需要全家福的用户提供免费的生成服务。

用户按照要求上传一定数量的五官清晰的正面照后,AI就会根据人脸特征,为用户制作出一个“数字分身”。用户可以在数百个模板中自由选择,把“数字分身”任意匹配到各种模板中,无限次地免费制作风格多样的全家福照片。

在“通义照相馆”里,配备了国风东方、时光回忆、唐宫夜宴、书香工笔等12套堪比写真馆水准的全家福模板,每套风格都可适配2—8人规模的家庭。

这项应用的背后,是通义实验室研发的多人人像生成技术。

不同于常见的单人人像生成技术,通义实验室使用了multi-id人像生成方法,使得生成效率提升1倍以上。考虑到全家福多人的场景,这个应用结合了表情生成、灯光融合等技术,提升整体图像的质量。

和简单的PS相比,AI生成的全家福更具真实感和氛围感。

“大家理解的PS,就是把人脸放在了另外一个可能是模板的照片上,它会存在一些问题。比如我是一张胖脸或者一张方脸,但是模板它是一张瘦脸,可能会有一些适配的问题。”

通义千问的工程师说,除了适配存在偏差,PS很容易形成假面感。尤其是在全家福的场景里,有爸爸妈妈,或者爷爷奶奶这样不同年龄不同身份的角色,更容易出现脸部和脖子皮肤不一致的情况。

“我们怎么样让这张人脸跟整体的画面融合,是我们这次AI全家福想要帮大家实现的这么一个功能。”

区别于普通的AI照相馆主打年轻女性,AI全家福覆盖的人群小到几岁的小朋友,大到七八十岁的老人。不同的年龄跨度,不同的性别,他们对于美和像的感知也是不一样的。通义千问的工程师们不得不在中间做平衡,保证生成AI全家福的过程中,每一个角色生成的效果都是最好的,每一个人都是满意的。

确诊渐冻症后,赵崇周对数字技术产生了很多想法,除了AI全家福,他还关心更为复杂的数字人技术的进展。他希望未来有机会可以做一个自己的数字人,尤其是像黄仁勋演示的数字人,这样当女儿遇到困难时可以陪在她身边。

赵崇周说,如今科学技术快速发展,只要有拍全家福的意识,无论亲人在哪都有办法实现,可以实拍,也可以用AI合成;可以手机简单拍,可以到写真馆精致地拍,也可以用越来越先进的AI技术直接合成写真照。

“总之,只要有团聚的想法,人们总有办法相聚。一切皆浮云,最重要的是珍惜和家人在一起的日子。”

过一个AI的春节

在龙年的春节里,用手机随手一拍,就能召唤潜伏在身边的小神龙。除了全家福,最新的AI技术解锁了很多拜年的新方式。

视频生成是大模型领域最热门的研究方向之一,谷歌、Meta、Runway等国外科技公司都在积极布局。不过一直以来,人物形象的视频生成面临许多技术挑战,比如人物形象一致、动作流畅可控、时序无瑕疵的人物动作视频。

基于阿里自研算法,及集成的多项创新技术,可以捕捉和保留原图像信息,高度还原人物、表情及服装细节。

今年1月,通义千问App上线全民舞王功能,一张照片就可以生成一段跳“科目三”的视频,迅速出圈。春节前,全民舞王又悄悄上线了新春拜年舞模板:一张照片生成拜年作揖舞,向身边的亲朋好友恭贺新禧;如果家里有萌娃,可以用照片生成一段红包祈福舞,用俏皮的方式向长辈拜年和讨红包。还可以和小龙共舞,与财神共舞,或邀请亲朋好友拼跳……

而新上线的“万物成龙”应用,随手拍一张照片,不管是静物、动物还是人物,都可以生成涵盖不同风格龙的形象图片,比如奶呼呼小瑞龙、多巴胺龙、碧玉云游龙等风格。

来源:都市快报  作者:记者 沈积慧  编辑:吴阳杰
返回
杭州网·国家重点新闻网站