文章目录[+]
2024 年春晚,伴随着任素汐温暖缱绻的歌声,全国人民在观看了春晚上首支 AI 视频。“透过窗看一幕童话,枕着光芒的云下,晚风轻轻地吹过她的银发,他笑着等她一起慢慢走回家”,音乐里一对随着音乐舞动的男女从青年走向暮年。
2024 年中国中央广播电视总台春节联欢晚会
鲜有人知的是,这样感动人心的节目背后,是一个时限不到一个月,且不容出错的高难度委托。
而 AI 实现了这一看起来“不可能完成的任务”。
生成式人工智能技术的飞跃发展,使人工智能与人的合作达到了前所未有的深度和广度。当我们不再只是抽象地谈论科幻电影中的 AI,那么 AI 早就已经悄悄开始改变着我们工作和生活了。鉴于此,科普中国推出系列对谈,与业内人士聊聊 AIGC 有关的一切。
你是否好奇春晚作品《枕着光的她》的 AI 双人舞是如何实现的?AI 怎样赋能设计师?这段视频的幕后创作者、PPT 设计师阿文在与我们的对谈中分享了他的经验。
他说:第一次用 AI 时,他完全没有想到会有今天的光景——“我基本离不开 AI 了”。
以下是与阿文的对谈整理。
图库版权图片,转载使用可能引发版权纠纷
AI 是怎样成为我工作的一部分的
Q:请阿文先简单介绍您的工作。
阿文:我的本职工作是一名发布会的 PPT 设计师,我在北京有一家专门做 PPT 的设计工作室。另外我还是一名 AI 艺术家。
Q:你是从何时开始关注 AIGC 的?
阿文: 2022 年 4 月我就开始关注 AI 了。因为我经常上微博冲浪,当时 2022 年 4 月一个叫 Disco Diffusion 的工具在微博上流行,我和我身边很多艺术家和好朋友都在使用。
Q:刚开始试用 AIGC 时,你对 AI 绘画的最大能力是怎么设想的?
阿文:第一印象肯定是很震撼的,2022 年的时候谁见过这种敲几个字就能生成图像的工具?所以我非常兴奋,但当时 AI 生成图片的质量还很一般,不够高清,等 DALLE-2 出来之后,我才对这个工具有了完全不一样的看法,觉得“它说不定能用在我们的工作中”,但也完全没有想到会变成现在这个样子——我的日常工作基本离不开 AI 了。至少在静态图像领域,AI 是完全可用的状态。
Q:AI 帮助你做了什么事?
阿文:AI 目前起最大作用的是我工作中一个非常重要的环节——找设计素材。发布会经常会做一些超宽屏的设计,但图库里很少有十几米长的屏幕需要用到非常高清的大尺寸图片素材。以往我们花费大量人工时间去合成大尺寸素材,现在只需要告诉 AI,我想要什么尺寸的素材就可以了。
实际上在我主业做发布会 PPT 的工作流里,AI 目前占比并不高,大概 25%~30%。最近,我开始尝试一些 AI 转绘创作,这里 AI 在整个工作流中占了 80%~90%。
图库版权图片,转载使用可能引发版权纠纷
Q:你的创作思路会因为 AI 的加入而改变吗?
阿文:我好像变懒了。过去一个创作需求来了后,我会先自己想一下,现在我可能会下意识地先敲几个关键词喂给 AI。相当于,我多了一个超强的助手。
Q:从 AI 那里获得的图,还需要人工改图吗?
阿文:一开始我们还需要把 AI 素材导入 PS 里“缝缝补补”,目前基本上能一次到位,我们几乎都不改了。
Q:AI 做 PPT 的工具你尝试过么?
阿文:其实我们专业的 PPT 设计师不太会看得上这种工具生成的效果,也用不到。它更像是上班族应付领导的工作报告模版。
Q:什么时候开始做 AI 转绘?
阿文:年初我和海辛老师接到了一个来自春晚节目组的委托,任素汐唱那首《枕着光的她》时,大屏要用一段双人舞作为背景视频投射在舞台上,想要呈现一对儿男女随着音乐跳舞,从青年到老年的情景。因为制作周期非常短,不到一个月,如果用传统路径做,无论是对两个舞者做动捕扫描还是建模,都需要花费大量时间。当时春晚节目组想到用 AI 的方式看能否在极短的工期内做出“还不错”的效果。最后我们做到了。
Q:具体怎么实现的?
阿文:执行项目过程中,我们遇到了很多挑战。
比如角色稳定性问题。节目的设计是双人舞三个阶段变装,包括结婚、婚后、老年三个阶段。利用 AI 来实现丝滑的变装是重要的需求。双人舞之所以会难做,是因为 AI 会将两个角色之间的特征进行混淆,所以经常会出现性别交换等问题。我们试了很多方法,最后利用 ControlNet tile 模型固定下来人物的特征,解决了这个难题。
再比如瓷器材质的实现。我们在 SDXL 和 Civitai 开源模型和 LoRa 的加持下,很快确定选择了白瓷材质的跳舞小人。但中间遇到了很多问题,就在我们以为得训练 SD1.5 的瓷器 LoRa ,我们发现用一个 “关键词” 就可以解决材质问题。除了关键词以外,我们还发现了一个叫 IP-Adapter 的插件,可以用一张参考图来引导 AI 生成指定材质效果。
另一个难题是换装稳定性测试,我们首先在 PR 里对齐了剪辑,在生成时通过 prompt travel 的方式(不同关键帧描述不同的内容)达到了节目组满意的效果。
图库版权图片,转载使用可能引发版权纠纷
对AI的畅想
Q:现在的 AI 生成图像还有哪些升级空间呢?
阿文:AI 生成图像我觉得已经到头了。
Q:已经到您想象的边界了吗?
阿文:反正你任意把两张图片放在我面前,我可能已经没办法分辨出来哪个是 AI(生成的)哪个是真的人创造的。
AI越发展,我就越分不清,连我们专业领域的设计师都是如此,那对于大众来说,AI 图片的质量已经完全足够了,AI 作画已经 next level 了。其实对于 AI 发展,最高傲的就是我们这个群体,一开始我们大部分人瞧不起 AI 生成的图像。就想“ AI 怎么可能比得上我们亲自设计或画出来的东西?”但越到后面就越会发现 AI 生成质量越来越好,当我们试了一下,简直“欲罢不能”,而且它确实让你的工作量减少,让你效率变高了。然后我就慢慢闭嘴了。
不过非要说的话,需要跟 ChatGPT 这种文字大模型的能力再结合一下,让文生图模型能更好地理解“人话”。
现在我会比较多地做 AI 转绘,做出偏油画风的那种风格。比如说把上海场街景变成梵高里某幅名画里的场景。
Q:AI能替代什么工作,以及什么是不能替代的?
阿文:重复劳动的肯定会被替代。比如你以前的工作每天都在抠图,每做着跟创意毫无关系的工作,那你绝对会被替代。它替代不了的话肯定是一些比较软的能力,比如创意。这样的工种我觉得完全是没办法替代的,而且越到后面越拼的就是你个人的审美,你个人的内容审美或者设计审美,都会影响你最后的图像作品。而目前AI它只能随机带来一些灵感,但是人类它是可以很主观地输出自己的审美,这是不能替代的。
我观察到一个比较有意思的现象,两年前一些外行去挑衅画师,挑衅那些游戏原画,挑衅设计师,说你们马上就要失业了。但是两年后的今天,你会发现 OPENART 社区里前十名的居然大部分是游戏原画师和设计师。AI作画最后爬向了金字塔顶顶尖,站在顶点的还是那群专业的人。
Q:你对AIGC的从业者有哪些建议?
阿文:不要太有被落下的焦虑。这个世界上每天每天都有新技术出现,根据我这大半年的观察,等大家试用完之后捡漏,测试那个效果最好的工具,这样才是一个高效的方式。
Q:你觉得AI能创造新职业吗?
阿文:肯定会有的。但是目前来说,用AI比较多的是传统设计师转岗的。
Q:你觉得AI未来的天花板会是像人一样吗?还是说AI会有另一个发展方向?
阿文:我觉得他会超越人,因为AI光是知识储备就已经远超每一个人类了,甚至它可能是人类知识的总和。关键就回到了AI怎么去利用知识,我觉得AI超越人类可能只是时间问题。
Q:可以推荐大家一些您发现的AIGC有趣玩法吗?
阿文:我用过最好用的AI翻译插件是沉浸式翻译,它能一键把所有外语网页内容变成双语翻译,而且背后是大语言模型,翻译特别精准;还推荐所有编程小白试试cursor,零代码基础也能写网站写应用!另外,我还想分享有一个想深度玩转 AIGC 的朋友一款最应该入门的AI工具:comfyUI,入门之后,所有开源技术都是你的插件。
Q:最后你还有什么想分享的么?
阿文:我很想说,其实中国在 AI 领域的成就非常可怕,十分厉害。全世界范围内,媒体们太过渲染国外大公司的模型能力了,忽略了那些低调却闪闪发光的中国团队。
其实开源社区里,至少在 AI 绘画、AI 视频领域,有 90% 的组件是华人或者中国团队写出来的:LCM、AnimateDiff、instantID、IPadapter、LivePortrait等等等,更别说可灵了。其实外国开源社区是对中国团队是非常敬畏的,但中国团队一直很低调,在国内很少出圈,所以很多人总觉得中国的 AI 技术不行,打不过国外,其实在我看来完全不是!
策划制作
作者丨冻顶乌龙 科普创作者
受访对象丨Simon阿文 AbleSlide 联合创始人,AI艺术家
审核丨于旸 腾讯玄武实验室负责人
策划丨林林
责编丨何通
审校丨徐来 林林