万物皆可JOJO:这个GAN直接让马斯克不做人啦 !Demo在线可玩!
来源:量子位
这下真的是万物皆可JOJO化了!
本来就神采飞扬的马斯克,下一刻更是仿佛要直接“我不做人啦!”
世界名画蒙娜丽莎神秘优雅的微笑,似乎也变得JO灼了起来……
再来个同一次元的……团长你在做什么啊团长!
而上面这些效果只要打开网页Demo,点击上传任意本地图片就能实现。
这就一下子引来了大批网友的围观,不仅推特热度800+,在线试玩的抱抱脸(Hugging Face)还排起了队,一张照片最多要等四五分钟。
还不仅JOJO一种风格,还有迪士尼风、英雄联盟风……输入任意一种风格的图像,都可以将这种风格快速应用到新的图片上:
看这楚楚可怜的卡姿兰大眼睛,以及天真无邪的公主笑,我只想说……老马,快收了神通吧!
在线JO化任意人像看了上面的演示,是不是自己也想整一个JO化脸?
我们用开发者提供的Hugging Face和Colab来试一下。
首先是在线网页版的Hugging Face,点击左边框中空白处就能把任意本地照片丢进去:
再点Submit,等个十几秒……站在你面前的不是别人,而是ko no肌肉金轮大司马哒!
这个方法点开链接就能即传即玩。不过虽然简单快捷,但偶尔还是要排队等个几分钟:
所以强烈安利colab版本,向test_input文件夹中导入任意图像,比如我们这里放入一张冰冰,然后点击运行:
再继续运行下面的生成模块:
把我的冰冰女神JOJO化,这也在你的算计之中吗GAN !
而且,colab中还提供了另一种玩法:导入一张任意风格的图片,自己制作一个XX风格生成器。
嗯……这不得整一个提瓦特大陆版的马斯克?
上传一张老马的正经图:
再在style_images文件夹中上传一张原神风格的人像:
(上传偏二次元风格的图像可能会出现“找不到人脸”的情况,需要多试几张图)
然后进行微调,等待几分钟,再点运行:
这个坚毅的眼神,再配上原图里老马的那个远眺抱胸的姿势,感觉下一秒就能来句天动万象了!
通过GAN反转获取近似风格那么,这种方法到底是怎么做到只参考一张图片,就能完美学习其美术风格,再将其运用到其他图像上呢?
我们一起来看看这个叫做JoJoGan的模型。
它主要是通过GAN反转(inversion)来获取近似风格的,主要工作流程分四步:
通过GAN将参考风格图像反转为近似的配对训练数据,得到相应的风格化的代码;
根据风格化代码生成真实的人脸图像,并与参考风格图像相匹配,形成成对的数据作为配对训练集;
基于这些成对的训练数据,对StyleGAN进行微调;
使用微调后的StyleGAN生成新的样本。
开发者表示,这一模型非常关注零监督下的风格细节,并且在不同风格中具有良好的通用性,能够轻松泛化到其他风格的图像上。
从二次元到技术宅开发者Min Jin Chong也是我们的老熟人了,之前曾经搞过二次元老婆生成器:
Min Jin Chong本人本科毕业于美国伊利诺伊大学厄巴纳-香槟分校(UIUC),后继续留校读博,主要研究领域为机器学习、计算机视觉和图像生成。
此前他曾在字节实习过3个月,现在与两位同校学生一起创立了一个叫做Style Space的时尚购物应用,允许用户在虚拟空间中试用和购买产品。
而他的导师David Forsyth则是一位CV领域的大牛,曾与Jean Ponce著有计算机视觉经典教材《Computer Vision:A Modern Approach》:
Hugging Face在线试玩:
https://huggingface.co/spaces/akhaliq/JoJoGAN
colab在线试玩:
https://colab.research.google.com/github/mchong6/JoJoGAN/blob/main/stylize.ipynb#scrollTo=LCLWiXoXwcJb
论文链接:
https://arxiv.org/abs/2112.11641
参考链接:
[1]https://twitter.com/ak92501/status/1473522187491590148
[2]https://github.com/mchong6/JoJoGAN
推荐阅读【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!
仅需12层网络,在ImageNet上准确率达到80.7%!普林斯顿大学最新提出ParNet!
MobileViT: 一种更小,更快,高精度的轻量级Transformer端侧网络架构(附代码实现)
【移动端最强架构】LCNet吊打现有主流轻量型网络(附代码实现)
基于Attention机制的轻量级网络架构以及代码实现
深度学习中的轻量级网络架构总结与代码实现
一文详解Inception家族的前世今生(从InceptionV1-V4、Xception)附全部代码实现
华为2012实验室诺亚方舟实验室招聘视觉感知算法实习生
欢迎大家加入DLer-计算机视觉&Transformer群!
大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。
进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)
??长按识别,邀请您进群!
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线