AI殿堂“门童”卡兹克
杭州网  发布时间:2024-07-23 09:34   

对话“新青年”

AI视频生成技术 国内外公司目前能打平手

橙柿互动:怎么看AI生成视频在这一年里的进步?

卡兹克:我们通常将Sora的发布作为一个分水岭。它发布前的1.0时代,AI生成的只是一个4秒动态PPT,大场景的动态,不涉及具体人物的动作。它发布后的2.0时代,一些简单的人物动作可以实现了,比如让一个人跳舞。

可能到了3.0时代,AI更能理解运动中的物理规律,生成的视频可以呈现人与人之间复杂的交互,比如打斗戏。

橙柿互动:这轮多模态大模型的“激战”,国内大厂和创业公司的表现如何?

卡兹克:去年下半年,我们一度以为在AI视频领域,就和AI绘画一样,国内外会存在大差距,很难去追。

今年2月Sora发布,震惊世界,不过至今它还是期货状态,真正展现实力并开放给大家使用的,是快手的可灵。其他一些国产视频模型也在落地,这时大家发现,技术上我们已经可以跟国外打个平手。

比如,现在有个可控性很强的功能叫首尾帧控制,即上传视频首帧和尾帧图片,模型可补全视频中间内容,就是国内公司率先推出的。

远不是一键成片那么简单

橙柿互动:具体到影视行业,AI视频生成技术的应用可以到哪个阶段?

卡兹克:AI大模型的涌现让影像的制作门槛变低了。我一个人“肝”上几天,就能做出一段几分钟的科幻短片,这在传统影视工业里属于不可能完成的任务。

不过,这与大家想象中的“一键生成一个片子”完全不一样。我在复盘《玉覆荆楚》时也提过,当时的剧本、分镜几乎都是人工完成的。在AI出图阶段,一些需要局部重绘的,也是直接掏出了PS、AE等工具,比如当时AI死活不知道什么叫“一幢只开着一盏灯的办公楼”。

至于配音、音效、音乐、剪辑,那次几乎没有用到任何AI流程,在这些领域,现在的AI还达不到80分作品所需的水平。

影视从业者:从焦虑到实践

橙柿互动:你和许多影视从业者有过交流,他们对于AI技术持什么态度?

卡兹克:起初明显可以感觉到大家普遍存在很焦虑的心态,不知道AI技术到底是辅助利器,还是会彻底颠覆行业,改变游戏规则。

但从去年底开始,一些影视从业者陆续将AI当作一个实用的工具,可以整合进影视制作流程,降本增效。

打算做一部科幻题材AI长篇剧集

橙柿互动:能介绍一下你7月17日上线的AI预告片《末日之旅》吗?

卡兹克:这可能是我想做的第一部AI长篇剧集。科幻、克鲁苏、末日题材,始终有着让人无法抗拒的吸引力,不过目前只有“克鲁苏统治者古神意外复苏,引发一场波及全球的浩劫”这样一个大背景,其他还没想过。

跟此前作品相比,特别之处在于它是我花了3个晚上,全程用文生视频完成的,想让大家了解这个功能目前可以达到的能力上限。

培养主动寻求AI解决方式的思维

比买课更重要

橙柿互动:可以推荐几款你觉得国内相对好用的AI工具吗?

卡兹克:日常用得比较多的AI助手是月之暗面的Kimi、抖音的豆包。AI绘画工具方面,快手的可图、商汤的秒画不错;AI声音工具,出门问问的魔音工坊;AI音乐工具,天工SkyMusic;数字人的话,商汤的如影。

都市快报·橙柿互动:作为资深实践者,对于那些刚开始接触AIGC的新手,有没有什么入门的建议?

卡兹克:就我的体会,AI本身不是一个需要入门的东西。根据实际场景,比如工作生活中遇到什么痛点,你就可以尝试上网去搜索借助AI的解决方法。

换个说法吧。过去我们遇到问题,会想着问亲朋好友,去找搜索引擎,那么现在可以多一种选择:看看有没有现成的AI方案可以帮忙解决。

AI变化很快且应用端很庞杂,所以我觉得培养自己主动搜索和寻求AI解决方式的这种意识和能力,可能比买课上培训班,单纯知道几个知识点更为重要。

为了让新质生产力青年的新技术、新想法、新模式能够赋能更多人和行业,共青团杭州市委、都市快报·橙柿互动联合推出“九千光年俱乐部”,致力于打造中国新质生产力青年学习交流平台,联合有能力影响未来的青年们,助推新质生产力发展与青年发展型城市建设。


来源:都市快报  作者:记者 童蔚 文 记者 陈中秋 摄 制图 李前芳  编辑:高婷婷
返回
杭州网·国家重点新闻网站