电脑装配网

AI让你变画师大神,二次元“老婆”唾手可得,上科大这款产品火了

 人阅读 | 作者pangding | 时间:2023-06-09 21:40

近期,以TapTap9.8分高居预约榜第四的“老婆生成器”《WAND》已于12月30日正式发布,这是一款由上海科技大学孵化的叠境数字与影眸科技联合开发、基于上海科技大学 ACM Transactions on Graphics 2021成果实现的产品,它能让所有使用它的,甚至是毫无绘画功底的用户成为“神笔马良”——在简简单单的勾勒轮廓后,一个栩栩如生的二次元妹子现身于眼前。

值得一提的是,该产品早于今年8月份就已上线苹果应用商店,曾一度位居中国 App Store 图形与设计榜下载量榜首,来自日本的3D 艺术家 Hirokazu Yokohara 还在推特上分享过自己上手《WAND》的操作视频。

喜欢二次元的用户想必都会对《WAND》非常感兴趣,同时这款产品不管是在微博还是在推特上都有着众诸多追随者,而早先上海科技大学孵化的影眸科技公司 CTO 张启煊接受第一财经采访中表示,《WAND》项目是一次以用户为主导,以AI为辅助的“元宇宙”成像技术的探索,同样也是开发团队在“二次元风格元宇宙”的初步接触。

动动小手,“老婆”就有

当用户绘制完成后还可以通过变换“风格”选项,轻轻松松的获得多种不同类型的二次元“老婆”,避免玩家多次重复绘制带来的厌倦感,同时不可预知的风格变化还将为《WAND》的出图增添更多的神秘色彩。

同时用户还可以通过风格旁边的两个按钮——拍照和相册,拍照便是选择实时自拍、拍其他人的面部照片,当然用户也可以选择打开相册上传一张现有的照片、图片,在这之后,系统便会由其特有的算法为用户自动生成一张图像以供用户继续编辑与调整

当用户绘制完成后还可以通过变换“风格”选项,轻轻松松的获得多种不同类型的二次元“老婆”,避免玩家多次重复绘制带来的厌倦感,同时不可预知的风格变化还将为《WAND》的出图增添更多的神秘色彩。

虽说动动手指就可以让二次元“老婆”驾临人间,但若是真的想以零基础绘制出倾国倾城的妹子,还需要小心下笔、谨慎作图,不然“驾崩”带来的节目效果绝对不逊于车祸现场,笔者看着上图的恍若“拔智齿”般的成品效果,不禁笑出了声。

此外,看腻了二次元纸片人的用户也想借此深入研究一下三次元人类,《WAND》行吗?当然行了,通过“风格”旁边的“Anime”按钮可以切换到“Realistic”,从而生成对应的三次元形象:不过成品效果带来的震撼或许并不是对此技术的惊呼赞叹,而是首次参见异次元生物的极度恐慌、汗毛倒立…

可以接地气,但请不要接地府,好好的一个“老婆生成器”硬是被玩家们完成了“克苏鲁生成器”,不过玩笑归玩笑,开发团队已经努力完善了它这部分的功能,正所谓“塞翁失马焉知非福”,正是因为这种无法预知事情的发生,令《WAND》这款产品吸引了更多用户、玩家前来“欣赏”尝试,一度引起各大网站的评论热潮。

她们都是打哪来的?

不过无论是“老婆生成器”还是“克苏鲁生成器”,用户笔下的人物绝不会是毫无根据的横空出世,那她们都是打哪来的?

实际上在海外利用 AI 作画或是自动生成角色已不再是新鲜事:早于去年日本游戏开发者大会 CEDEC2020 上,《怪物弹珠》的开发商 Mixi 就展示了自己的 Creative AI 生成游戏中的角色,而这项技术在未来对生产力的提升和对游戏长期开发和运营的意义都获得了 Mixi 方面负责人的肯定;而后于今年3月份,日本的科技公司 Preferred Networks 旗下的 CryPko 团队在官网上发布了由 AI 生成的“立绘级”二次元人物,而从质量上来看已可以和诸多游戏中的人物一分高下了。

说到这里,由伊恩·古德费洛等人于2014年提出的生成对抗网络(GAN,全称:Generative Adversarial Network)这一技术便不得不提,这种被称作 AI 深度学习的技术将“博弈与训练”思维贯穿首尾。

什么,AI 也会学习了?

没错,但详细解释起来略显复杂,笔者这里举例解释:首先要知道 GAN 由一个生成器与一个判别器组成,我们可以理解成在一个饭店,一侧是利用随机食材做饭的厨师(生成器),另一侧则是品尝饭菜的挑剔食客(判别器),厨师的厨艺随着不断地做菜而得以提升,挑剔食客的品鉴能力自然随着厨师技术的提升而水涨船高,至此,在二者的相互成长中,一个相互促进的进步循环便诞生了。

由程序的不断循环重复后,不论是厨师(生成器)还是食客(判别器)此时的水准都已经非常高了,而最终将食客满意的菜品输出向外所得的结果也势必更趋于真实。

要知道 GAN 被广泛应用于人像、图像的生成包括抖音的漫画滤镜、曾大火的“ FaceApp ”等,不过在 GAN 进行深度学习过程中,其不同内容的属性如形状、纹理风格等,往往并不是干净利落的——藕断丝连般粘结在一起,这大大提升了特定属性显式控制的困难程度。

而上科大 ACM Transactions on Graphics 2021 的一篇研究论文中提出一个名为 SofGAN 的图像生成器,其将人像的潜在空间解耦为两个子空间:几何空间与纹理空间,而后通过某种方式令一个生成人像 3D 几何图形,另一个则生成纹理,可见这种方式很好的解决了 GAN 属性的黏连问题。

“《WAND》的设计构想源于上科大计算视觉课题组的最新研究成果。”据开发团队成员,也是上科大信息学院2018级本科生张启煊所述,同时大量的实验证明此方法可以生成具有独立、可控的几何与纹理属性共存的高精人像图像,各种应用都可与其“融洽相处”,如外观一致的面部动画生成等等。《WAND》便是由学生们不断研究、实验后的产物。

用户加持 AI 推出的无限可能

随着 AI 技术的愈发进步,未来众多行业甚至于写作、作曲等创意产业或将迎来大换血,而美术身为典型的创意领域,身为一个包含着创作者个人情感、思想的,极具主观色彩的行业可谓为冰冷的 AI 无法逾越的大山,不过 AI 深度学习技术的出现令“用户为主,AI 为辅”所构筑的未来拥有着了无限的可能性。

何为“用户为主,AI 为辅”?其实《WAND》便是一个很好的例子:作为一类工具型软件,其本身并不会生产内容,不过随着用户在上面的不断耕耘,越来越多丰富有趣的事物将会不断被产出,届时 UGC 模式将会在用户与 AI 不断交互中得以生华,但与此同时,如何把控内容质量、如何利用用户创造价值而非消耗价值、如何以克制态度保持推广的重要性也会被不断放大开来。

当下元宇宙的热潮带来的不单是新空间形态与游戏模式,同样也是针对用户交互方式的一次升级,UGC 或将作为元宇宙中最重要的内容生产者的地位,《WAND》的诞生可看作是一次对元宇宙形象生成技术的探索,我们将依托 UGC 源源不断的获取新的内容为核、利用形象生成技术打造出栩栩如生的动态形象辅助用户更好的呈现自身,在这两步之后还会出现什么新技术、概念来垫起时代前进的阶梯尚未可知,但唯一确定的是,我们正在一步一步,坚定地迈向所有人心中闪耀的那个“绿洲”梦。


文章标签:

本文链接:『转载请注明出处』