——”一片向日葵花海在星空下闪烁。”
本来只是在有限的想象力之内挑了梵高的两幅名画加以简单概括,结果AI吞掉这句描述后,居然就吐出了一张张极富冲击力的图像:
图源:阿文 微博
没有参考图像,也并非简单的两幅图像的拼接融合,而是真正基于文字描述,在充分的想象力下,从无到有地进行了绘画创作。
而就在不到一年的时间内,这样的AI画手开始井喷式地出现——
近期在海内外爆火的免费AI作画工具Disco ,输入简单的文字描述就能在线生成图像,其画面之精细,想象力之超绝让不少人直呼“AI比我都浪漫”:
图源:开发者推特
一度登上苹果应用商店的图形与设计排行榜榜首的Wombo,只要下载App,上传图片或输入关键词,再选择平台给予的风格,几秒之后就能生成图片,其超绝的想象力被无数用户玩出了花:
图源:网络
还有通过聊天出画的,用户进入聊天软件,并被邀请到相应的小组中后,就能像是真的与画手隔着网线交流一样,说出自己的需求,而AI也会在群中实时更新的绘画进度:
图源:网络
上个月刚刚推出的Dall-E2,其生成结果的精准度、对人物的识别能力震惊了整个技术圈,甚至都有读者用这一AI出了一整本画集,整整1000张图片:
图源:作者个人主页
更不用说谷歌新鲜出炉的,不管多长,多具体,多不符合现实逻辑的离奇描述词,都可以精准地从文字生成真实准确的图像:
图源:谷歌官网
惊人的技术迭代速度、破圈式的热度、震惊了绘画圈的色彩、构图、想象力和创作力,似乎都在表示,这些AI画手们,正在逐渐在绘画领域中掌握”画语权“。
对此,有人欢欣鼓舞,认为技术的革新将为艺术领域带来全新的思考方式和改变,有人惶惶不安,担忧来势汹汹的AI画手将摧毁一大批中低端绘画岗位,甚至有人怒斥AI将艺术变为了单纯的数据游戏,使得绘画失去了意义和灵魂……
议论连续不断,热度居高不下,AI绘画这一名词开始逐渐出圈,在谷歌的关键词搜索趋势中,AI 的搜索热度自去年下半旬就开始逐渐高涨,到现在已经达到了一个新的高峰:
热议之下,已经有这样的声音出现:
AI绘画,元年已至。
···
且先不论这一发言是否正确,所谓的AI画作,到底是严格按照代码逻辑运行,风格单一的产物,是AI的随机拼接游戏,抑或是真能如人类画手一般依照主题构想画作?
AI们都画了什么,它们又能画多少?
AI画手的第一批体验者们,当时就抱有着这样的疑惑。PPT设计师阿文就是其中之一。
今年4月份时,他偶然看到一个画手朋友在微博展示了一组AI作画的作品,效果惊人,朋友作为专业画手也给予了很高的评价,他便也对这个叫做Disco 的工具起了兴趣。
这是一款基于谷歌的技术框架开发的AI作画工具,部署在谷歌Colab(一个可以通过浏览器编写和执行代码的线上托管平台)上,训练画作所需的算力也由谷歌免费提供,而只需要修改代码中的一个部分的文字描述,就能生成画作:
文字描述拥有画种描述、内容描述、画家描述、参考渲染方式、颜色描述五个维度,用户不用修改代码,而是只要从这几个方面进行调整和修改,就可以生成图像。
不过,鉴于是初玩,阿文只谨慎地修改了默认文本中的两个关键词:A of night(原 ), its light sea(原 sea)by greg and , on .” ” color “,也就是将默认的”一座在惊涛骇浪中闪耀的奇异灯塔”改成了“一片在星空下闪耀的向日葵花海”。
而AI吐出的第一张图片是这样的:
图源:阿文 微博
这是一张超乎了阿文想象的画作,色彩、构图都拥有超绝的美感和想象力。
而Disco 本身可以根据一句描述产出多张不同的图片,于是,阿文在无比期待中,迎来了挂机渲染之后的另外几幅作品:
图源:阿文 微博
简单的文字描述外加一点点天赐般的运气,诞生了数张色彩构图丰富大胆,如同梦境般的画作,最终一举出圈,在微博超过两万人转发,并纷纷表示震惊“给跪”。
也因此,大批用户纷纷涌入,开启了脑洞大开的AI花式作画。
有将参考画师改为吴冠中,直接得到一张水墨画:
图源:网络
还有应用了虚幻引擎风格,生成的仿佛游戏页面一样的画作:
图源:网络
当然,偶尔也会有人喂出了一些有些诡异的图片:
图源:推特Mike
……
在那之后,阿文也试用了另一款叫做的工具,同样是“星空下的向日葵海“的描述,不过这次的生成结果则恰如其分地落在了他的想象力内:
图源:阿文 微博
“就像是一个听话版的Disco 。”阿文笑道。
在尝试多次后,他觉得的想象力是比不上Disco 的,但好处是速度够快,五分钟就能成图,而且不至于像Disco 那样,有抢夺创作主导权的“野心”,是更适合艺术创作者的辅助工具。
还有更多像阿文这样的艺术创作者,走上了探索AI绘画工具的道路,并开始逐步挖掘各自的潜力。
比如主阵地是移动端的Dream,它的整体作画风格更偏向于梦幻柔和:
图源:网络
而诸如DALL·E2、之类的画手,则是在如何更准确地理解文字描述、更好地组合绘画风格,最后生成更精确而言之有物的事物和人物的方向努力。
当然,除了这些从无到有的“高端创作者”,近几年也火过一批更加亲民的AI画手们。
比如在去年一度火爆外网,可以实时地将人像转为漫画模样,也是在线部署,火到要排队几个小时才能玩到:
图源:网络
去年在日推被疯转的AI,简陋的草图一经它手就会变成精致可爱的二次元萌妹:
图源:高坂 推特视频
还有可以任意推断两张人物图像的子世代长相的,不仅几秒就能出图,还可以通过超多参数微调产出人物的长相:
图源:网络
再出圈一点,抖音、微信或QQ中的将人物照片转变为其他风格的AI滤镜,也能被算进AI作画的范畴里。
这样看来,AI画手们作画内容的范围覆盖之广,比起一些人类画手也是不遑多让。
其屡屡出圈的热度,更证明了在普通观众眼中,AI的画作们有着足够的冲击力和观赏价值。
···
接下来,让我们换一个角度来看AI绘画。一张成品画作由什么组成?在现实中是纸张和各种材料制成的笔墨水彩,而储存在电子设备中的一张图像,本质上则是一个像素点矩阵,每个都由 RGB(Red、Green、Blue)三个颜色通道组成。
图源:网络
因此,AI绘画也就相当于一个可以逐渐产生像素,进行图像生成的计算机模型。
模型是人工智能中的一个概念,我们可以将其通俗地理解为一种从输入到输出的函数。
要让这个函数输出我们期待的像素点矩阵,首先需要赋予它很多“参数”,相当于函数中的变量,这些变量涉及绘画中每一笔的位置、形状、颜色,甚至是覆盖关系、笔触组合等多个属性。
有了这样一个拥有庞大“变量”的“函数”,还要再基于海量的已有图像进行训练,也就是找到效果最好,最合适的一组参数的过程。
而这样一个绘画模型所需的参数量和训练数据集非常庞大,不仅如此,也很难让计算机去理解“创作”这种比较抽象的概念。
因此,诞生之初的AI作画,说是依照逻辑执行任务也并无不妥。
关键词: