被《抓娃娃》选中、与成龙合作,自学AI的我跨界影视圈 原创
作者:杨淼
自学AI绘画后,我接到了《抓娃娃》导演和成龙电影的邀请。
2024年7月16日之前,肥桃还是一名普普通通的打工人,朝九晚六。
7月16日,一封突如其来的邀请闯入他的生活中,激起层层涟漪。
肥桃没想到,偶然在朋友圈走红的自制AI海报,竟被《抓娃娃》制片人挑中,成了火热院线的宣发物料。
北漂多年的他,已经是一家上千人上市公司的资深设计师。
但依然觉得生活差点乐子,便自学起市面上流行的AI应用。
也因为AI,肥桃从流水线般的生活中抽离出来,半路出家走向另一条道路。
2002年的肥桃学的是建筑学,还未毕业,就拿到了全国各类flash和网页设计奖项。那时候他就暗暗发誓,以后要当一名出色的设计师。
毕业后,为了丰富自己的经历,但凡是跟设计有关的,他全都做。摄影、动画、网站、UI、品宣……用他的话来说就是“一锅大乱炖”。看起来差异很大,实际指向的是一条道路。
这些年来,肥桃大大小小参加了好些知名项目,从奥帆青啤、屌丝男士、煎饼侠到现象级app 美颜相机。
2022年,肥桃迷上了AI,也是Midjourney刚出世,生成式AI大火的那年。
他喜欢通过不断调节指令生成图片的过程。挑图、建模、渲染,构图、动作、光影,有了技术,出图的时间变快了,风格也越来越多样化了。
比如今年五月,肥桃便卡着时间点参加了全球Tripo 3D渲染大赛。
Tripo 3D渲染大赛是中国公司Tripo在海外举办的全球3D渲染大赛。参赛选手六百多人,最后入围的仅40份。
一般来说,用于参赛的图,制作周期少则两三周,多则一俩月。
他硬熬了两个通宵,一个动画用了三天,另一个动画没时间了、就花了五个小时,卡着5月24日的ddl传过去了。
他称自己最大的优势就是AI,国外选手3D建模渲染能力强,但AI模型的控制能力就稍显薄弱。而他能在这么短的时间生成图片并成功入围拿奖基本就是靠的AI。
整个作品是用简单的几何形体通过腾讯开源的ipa模型一步步推导出面部结构和大环境的单图,然后导入到AI和建模软件软件里边来生成三维模型。之后拿几个模型通过深度控制,让AI去想象能生成什么样的画面,最后再利用传统软件blender进行绑定贴图动画渲染。最后,肥桃参赛的两幅作品都获奖了。
AI不仅提升了速率,也赋予了设计作品更多的可能性。
以前的代码是代码,设计是设计,冰冰冷冷的,充满了商业化的气息。用Stable Diffusion制图后,肥桃愈发上瘾,什么都可以成为他的素材。同事、朋友、家人、影视形象、猫猫小狗,没有限制。
出自肥桃手中的图片,充满了强烈的个人色彩。比如,女儿是最漂亮的,眼睛大大的、皮肤白皙,灵动俏皮,这也是肥桃的朋友圈背景封面。而朝夕相处的同事总是咧嘴笑着,眼睛眯成一条缝,滑稽又亲切。
肥桃女儿肥桃同事
神仙姐姐,清冷忧伤,眉宇之间总是凝着淡淡的愁绪。高启强只是随意坐着,上咧的嘴角有着市井小民般的憨厚,眼角的冰冷却不失黑社会大哥特有的笑里藏刀。
在肥桃的小红书账号上,全是跟AI作图相关的笔记。有为抓娃娃电影主演制作的卡通大头、有恶搞老板周鸿祎的诙谐版形象、有stable diffusion的调节教程、有ComfyUI的工作流方案。
被问到是否接受过专业训练时,他摆摆手,笑道,“都是自学的,都在卷,不卷不行。”
“做设计的就需要做到全栈设计师。所谓全栈,就是什么都会,手绘、渲染、建模、平面、3D,样样精通才是最高水准。”
肥桃有好几个AI技术交流群,他说里面有好些大佬,通宵达旦地学。国外一有什么产品更新了,教程出来了,这个群就会炸锅。自己第二天醒来看到消息,就已经落后了几个小时。
“AI迭代是按天算的。一年前的AI作图和现在又不可同日而语。”
短短两年间,Midjourney更新了七个版本,最新版是“细节狂魔”Midjourney V6.1,以更连贯的图像、更逼真的细节稳坐霸位。行业大哥Stable Diffusion也在2024年4月发布了Cos Stable Diffusion XL。最新版SD已经能够基于SDXL进行fine tune,可生成黑白影像。
“算是一种危机意识。”肥桃进军了“学到凌晨”的队伍,他笑着说:“一点之前是不可能睡的,三五点是常态。”至于干什么,就是“玩”技术。
他想在不断迭代的技术中激流勇进,而不是做一条被拍打在岸边的死鱼。
“卷技术”是兴趣使然,但真正让肥桃尝到AI甜头的是一封来自火热院线的电影的邀请。
《抓娃娃》正式上映于7月16日,是由沈腾、马丽主演的家庭喜剧片。电影主要讲了富豪家庭伪装成落魄打工族“穷养”小孩马继业,成长路上发生的啼笑皆非的故事。
自7月13日点映以来,票房便一路飙升,三天内接近五亿。更令人震惊的是,影片上映首日的票房占比高达39.8%,市场占比更是达到72%,在《默杀》《神偷奶爸4》等同期电影中杀出重围,一举夺冠。
截至9月12日,《抓娃娃》票房已经突破了33亿,是名副其实的暑期档票房冠军。
作为喜剧片的忠实爱好者,肥桃去了7月13日的提前点映场次。电影中的梗一个接着一个,肥桃笑得不亦乐乎。回到家后,想起一个又一个让人忍俊不禁的形象,他赶紧打开ComfyUI,生成了一套主演的卡通图像。
先是发在了朋友圈里,被之前做影视品宣的朋友看到转载出去。
然后又被辣目洋子(影片中李嘉琦饰演者)的经纪人看中,直接推荐给了导演。
那是七月中旬,距离他在朋友圈发布这组图不到三天。六度分隔理论让官方也看到了肥桃的作品。
接近八点,平平无奇的一天,肥桃正收拾东西下班。在鱼涌进如沙丁罐头一般的地铁站前,裤袋里的手机叮咚响了一下。
“感觉就像是突然中了五百万彩票,”肥桃做梦也没想到,他出于兴趣制作的AI海报会被导演一眼相中。
本来只是千万影迷中一个小小的粉丝,却因为AI与影视圈结了缘。
他差点把手机摔在地上,哆哆嗦嗦从上衣口袋掏出一包烟。尼古丁让他的心绪慢慢平静。几十秒过后,才拿出手机回复:
导演也免去了客套,开门见山地说:“肥桃!我们都太爱了!”
官方征用肥桃的设计图后,这些AI海报便被挂在了猫眼,同类型创作点赞和浏览排名第一。
每天都有粉丝留言,大部分都是“太可爱了!”“太喜欢了!”
原来,一开始,肥桃给沈腾和马丽饰演的形象都是一样的中年夫妻,细密的皱纹、为小孩操碎的心的眼底的沧桑,如出一辙的花白的头发。粉丝指出后,肥桃又连夜操赶,用作图软件消除了脸上几个褶子,把颜色调得更加柔和了些,这才符合老夫少妻的形象。
马丽前后对比图
因为他知道,AI最难的就是控图。AI的生成能力强、出图快,但不可控性太高,经常有好几版设置出来都不是自己喜欢的样式。
比如接到邀请后为《抓娃娃》电影制作的奶奶大灌篮海报,肥桃怎么都不满意。
80年代的背景图,投篮的角度、姿势,老奶奶的神韵,乃至根据物理学迎风起跳时衣服上的折痕、头发散乱的程度,一样都不能少。
为了完美还原老奶奶的姿势,肥桃专门找了一张篮球运动员投篮的图片,把他的动作复制下来模拟形象。奶奶的衣服也需要不断分层,通过深度控制一步一步修改成他想要的。背景图是单独生成的,用AI修成后再跟原图融合到一起。
人类和AI正处在一种博弈的状态,大模型训练师想办法超越人类,不断优化算法、提升算力。比如我们常常听到的衡量大模型指标的参数-“大模型推理能力已经具备了人类研究生水平”。
而像肥桃一样的人类也想坐稳自己的地位,不断学习如何控制模型,生成自己想要的东西。
至于谁会赢,肥桃说,这就跟AI出图的不稳定性一样,是不可控的。
或许在三个月前还在电影院开怀大笑的他不曾想到,这些还存在在大屏上的人此刻已经躺在了自己的微信列表里。
而邀约肥桃的,并非《抓娃娃》一家。成龙主演的新电影《熊猫计划》也朝他抛出了橄榄枝。
《熊猫计划》里那个胖乎乎的熊猫“呼呼”的AI宣传图就是他亲自设计的。
肥桃说,这之前,他们已经找了几家宣传公司,都做不到想要的效果,于是搭线找到了我。
熊猫的眼睛大,耳朵小,偏幼儿。第三方公司用市面上的模型渲染的形象已经偏向写实,而团队想要的是更加亲民的、萌的形象。
收到消息后,他先用数据训练模型,再调节参数。为了调节AR图像的泛化能力,让熊猫毛呼呼的AI模型在不同的场景、时节都有一样的成图质量和表现力,肥桃前前后后一共修改了五个版本。
肥桃生成的呼呼憨态可掬、恰如其名,胖乎乎、黑白相间、灵动分明。
宣发组的同事看到都说,这一眼就是他们心目中的熊猫呼呼。
一连接到好几个大项目的邀约,肥桃仍保持着一种对于未来的危机感。
他摆了摆手,“技术是不断变更的,而未来是未知的。”
比如他的朋友做的一套模型,其生成的真人图片已经能成功骗过某社交平台的人工审核和机器审核。AI达到了一种以假乱真的效果,把AI生成的真人图和摄影图摆在一起,80%的情况AI都已经难以识别这是否是机器制造,而人工则更是凭感觉瞎蒙,判不出所以然。
肥桃总是提到未知,未来是未知的,出图是未知的,自己是未知的……
他身上有一种奇异的矛盾感,比如他明明是用AI出图的设计师,讲究效率,却又沉迷于手绘,执着细腻。他既痴迷于代码与代码碰撞中涌现出的无限可能性,又沉溺于纸与笔摩梭之刹勾勒的光影。
他说,这是做设计的天性。因为设计始终会回到那些最基本的东西,构图、色彩、比例、空间。但现在的人太浮躁了,老是想走捷径。一周速成stable diffusion、midjourney课程满大街都是,很多人买了,又放到收藏夹吃灰。
“老想着用AI走捷径不可取,沉淀自我、打好基本功才是设计师最后的出路。”
在昆仑山的蝴蝶谷里,张无忌自炼《九阳真经》,历经5年的苦修,终在日出之时,将九阳神功练至大成,成为明教教主。杨过被郭芙砍断一臂,与救下的神雕相伴,自创了黯然销魂掌,历经25年才成为神雕大侠。郭靖自幼跟随江南七怪学武,苦练降龙十八掌,十余年方才领悟掌法的至刚至柔,坐拥武林。
肥桃作品走红的背后,亦是其二十年数十年如一日的积累与沉淀。
肥桃,山东青岛人,80后,毕业于青岛理工大学。为青岛奥帆委、青岛海尔、青岛啤酒等品牌提供设计服务,曾经与大鹏合作为屌丝男士、煎饼侠提供品牌宣传设计,全球tripo3D AI渲染大赛最佳故事、最佳美术奖获得者。
码客人生:您从业之后,半路入行对AI产生了兴趣对吗?
我从业之后,其实也是从事了很多设计行业。虽然是设计行业,但是也是在不断转行。最早的时候我是做动漫的,后来又是做it,然后是做网站,后来是做UI,现在又等于是用AI做一些动效了。其实设计行业里边好多分支我都接触过。相当于是现在有一个词叫全栈设计师。因为就业时间太长了,所以说接触的面比较广。
码客人生:与之前相比,做AI之后,出图速率提升了多少?
现在我们基本上是在用本地的机器来跑,跟配置也有很大的关系。如果你配置好的话,可能一两秒一张图,你配置不好的话,几十秒上百秒都有可能。举一个最典型的例子,就是我们在做节日海报,比如说开机APP这种海报,以前给的时间是两周一张,现在其实一天可能就会让你画一张。如果快的话,如果你在抽卡你处理一下图,有可能跟你自己想象的不一样,你可能要抽卡,但是除去抽卡的时间来说的话,有可能真是几秒就一张了。
码客人生:您觉得AI制图和人类设计师做的图有什么区别?
因为现在是AI初期,目前其实是分两个派别了,一个是请安派,一个是反对派。大家还是在不断讨论这个事,但是随着时间的推移,可能再过多少年之后,大家已经就不会在乎这个是否这样生成了。但是其实我觉得也是无所谓了,无论是人类生成还是AI生成,得以目的为主。最早的时候是这样,我一朋友在阿里巴巴他们最早的时候做了一个项目,这是大概2016年的时候,也是大批量出广告图。他当时最大的感触,虽然说你做的特别好,你可能略胜于AI。但是当AI一分钟出3000张图,你出1张图的话,把这3001张图摆在一起的话,你是无法找到哪一张图是人类人做到,对哪一张都是这样,这个量上已经把你覆盖掉了。
以后最终最终进化的状态肯定还是AI辅助传统的人。因为如果说你要保证它的这种稳定性、统一性的话,还是要有一个大的框架在。这大的框架还是要借助一些传统知识来把它编制起来。如果一个项目特别复杂的情况下,肯定还是要借助人工绘画或者传统行业来做,你就说现在最火爆的黑悟空,他为什么就在现在经济颓势这么强的情况下还能赚着钱,是因为首先来说这帮创作者的基本功会特别强。
我觉得这种从业者来说,将来自己最大的瓶颈或最大的障碍还是说你在AI爆发的年代能够静下心来沉淀自己,如果说你只是在不断的追求流行或者不断追求技术的话,我觉得最终还是会被淘汰。这种SD1.5的模型,它生成的图其实背景和人物细节都会特别多,因为美术上是讲究虚实结合的,包括美术功底和设计功底。这是最基本的东西,如果这些东西都没有,很难在AI爆发的年代存活下来。
0赞 好文章,需要你的鼓励
推荐文章
想象一下,一个人工智能系统不仅能阅读文本或识别图像,还能够同时读、写、看、听和创造。这其实就是多模态人工智能的精髓。这些先进的多模态人工智能系统可以同时处理和整合多种形式的数据,包括文本、图像、音频甚至视频。这就像是赋予了人工智能一整套的感官。
开源软件巨头红帽公司(Red Hat)今天在犹他州盐湖城举行的KubeCon + CloudNativeCon North America 2024大会上宣布,将对Red Hat OpenShift AI平台进行一系列更新,提升其在人工智能开发领域的竞争力。
自2010年成立以来,Moderna一直致力于通过开创信使RNA(简称mRNA)技术重新定义医学体系。Moderna公司的使命,就是发展成为生物技术领域的全球领导者,新冠疫苗的成功研发尤其使其获得了前进的信心。
微软拥有40万个成员的合作伙伴生态系统对于中小型客户(SMC)群体取得成功“至关重要”,2025财年这个群体的总潜在市场规模为6610亿美元。