2023-08-23_一笔勾勒，宫崎骏动漫世界！斯坦福大模型𝘚𝘬𝘦𝘵𝘤𝘩-𝘢-𝘚𝘬𝘦𝘵𝘤𝘩-行业资讯-网站开发软件制作-北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司--北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司-

一笔勾勒，宫崎骏动漫世界！斯坦福大模型𝘚𝘬𝘦𝘵𝘤𝘩-𝘢-𝘚𝘬𝘦𝘵𝘤𝘩 来源：新智元只需随笔一画，高清画作就来了。比如，画一个中世纪城堡，简单画个门，画条路，一座美丽的城堡出现了。带邮箱的霍比特人房子海洋边缘的灯塔（PS：有点像海底星空）来自斯坦福的研究人员提出了????????????-??-????????????，一个能够将草图变成画作的模型。甚至，????????????-??-????????????可将生成的图像，转换成完整的草图，还能为下一步的绘画提供建议。那么，它具体是如何工作的呢？草图，还能再编辑现有的草图控制图像生成方法包括ControlNet、Sketch-Guided Diffusion，以及DiffSketching。虽然现有的草图到图像方法有着很大优势，但它们有一个关键缺陷：被训练来处理完成的草图。然而，典型的草图工作流程是一个迭代的进行中的工作！艺术家逐步添加或删除线条，有时在深入到更精细的细节之前构建基本结构，有时在移动到另一个区域之前专注于图像的一个区域。因此，我们需要在草图绘制过程的阶段，实现草图到图像的功能。在Sketch-a-Sketch中，研究人员引入了一个ControlNet模型，该模型生成以部分草图为条件的图像。有了ControlNet，Sketch-a-Sketch可以： 1）在草图过程的各个阶段生成与草图相对应的图像 2）利用这些图像生成有助于指导艺术过程的建议草图问题：现有方法不适用于部分草图以前的研究是在图像和完成草图的配对数据集上训练的。在尝试根据部分草图生成图像时，这些方法会将草图视为已完成的草图。因此草图其余部分的空白会被视为一个指标，表明图像不应包含通常与输入草图中的笔画相对应的内容。例如，给定房子的前几条线，ControlNet无法在绘制线的区域之外生成重要的细节：在这些草图中，与线条相对应的特征出现在生成的图像中：支撑屋顶的柱子、栏杆的顶部、门廊的底部等。然而，在草图仅包含空白的区域，也存在大量主要的图像特征。训练数据：通过随机删除线条制作部分草图 Photo-Sketch 是现有的最大数据集，其中包含文本描述图像，与部分完成阶段的草图配对的数据集。然而，该数据集存在以下不足： 1）仅限于 1000 张图片的草图； 2）所有图片均为室外场景（缺乏多样性，无法生成一般的文本条件）； 3）通过对现有图片进行描摹来构建（强加了笔画顺序，可能与许多艺术家的画图过程不符）。因此，我们以编程方式构建了自己的数据集，其中包含与部分草图配对的带描述图像。斯坦福研究人员的方法是：1）使用HED将图像转换为光栅化边缘图；2）将边缘图矢量化为笔画集合；3）随机删除部分笔画。通过以任意顺序删除笔画，我们还能以任意顺序绘制的笔画为条件生成图像，从而适应各种草图风格。研究人员使用来自LAION Art的45000张图片构建了配对数据集，并对ControlNet模型进行了训练，以便在图片-草图配对上调节Stable Diffusion 1.5。训练好的模型将文字说明和部分草图作为输入，并输出与可能完成的草图相对应的生成图像。需要注意的是，通过对许多不同完整程度的随机部分草图进行训练，模型学会了将任何完整程度的草图转换成最终图像。这就意味着，模型并不假定你绘制线条的顺序。你可以按照任何顺序绘制线条，????????????-??-????????????仍会根据草图的当前状态生成图像。生成你想要的图像当艺术家不太确定他们想如何绘制图像的一部分时，可以根据绘制的线条生成各种图像完成。比如，不太确定他们想如何绘制杯子的把手，所以????????????-??-????????????生成了3张图像：有了这些生成的图像，Sketch-a-Sketch可以为潜在的绘制线条提供建议。通过在生成的图像上运行HED，来生成现有绘图的潜在补全，然后就可以获得建议线条的图像：风格可控图像说明和底层扩散骨架会对图像可视化和建议线条产生重大影响。与其他文本控制扩散应用一样，????????????-??-????????????可以通过提示来修改生成图像的风格或内容。在下面的图中，可以通过更改一个单词来控制一辆跑车的可视化风格：提示：跑车，逼真提示：跑车，卡通提示：跑车，阴影提示：跑车，生锈之前已经看到过，在一个骨干网（Stable Diffusion 1.5）上训练过的ControlNet在该骨干网的微调版本上仍然有效。这一特性同样适用于部分草图ControlNet模型，使Sketch-a-Sketch能够从针对特定领域进行微调的模型中生成建议。例如，我们可以使用吉卜力扩散生成吉卜力风格的角色：作者介绍 Vishnu Sarukkai Vishnu Sarukkai是斯坦福大学的博士生，导师是Chris Ré和Kayvon Fatahalian。他曾在斯坦福大学获得了计算机学士学位。他的研究兴趣包括机器学习和计算机图形学，最近的研究主要集中在可控扩散模型上。 Christopher Ré 斯坦福人工智能实验室（SAIL）、基础模型研究中心（CRFM）和机器学习小组（生物）的副教授。 Kayvon Fatahalian Kayvon Fatahalian的团队创建了支持高级计算机图形和视频理解应用程序的计算系统（通常是高性能和并行的）。最近的研究工作包括，用于「AI训练」的虚拟环境的高性能模拟。参考资料：https://twitter.com/VSarukkai/status/1691513593358086144推荐阅读西电IEEE Fellow团队出品！最新《Transformer视觉表征学习全面综述》润了！大龄码农从北京到荷兰的躺平生活（文末有福利哟！）如何做好科研？这份《科研阅读、写作与报告》PPT，手把手教你做科研奖金675万！3位科学家，斩获“中国诺贝尔奖”！又一名视觉大牛从大厂离开！阿里达摩院 XR 实验室负责人谭平离职最新 2022「深度学习视觉注意力」研究概述，包括50种注意力机制和方法！【重磅】斯坦福李飞飞《注意力与Transformer》总结，84页ppt开放下载！2021李宏毅老师最新40节机器学习课程！附课件+视频资料欢迎大家加入DLer-计算机视觉技术交流群！大家好，群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享，主要方向有：图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。进群请备注：研究方向+学校/公司+昵称（如图像分类+上交+小明） ??长按识别，邀请您进群！

上一篇：2023-06-09_天涯24年，一场跌宕起伏的衰落史

下一篇：2018-10-09_业界｜英特尔9代酷睿CPU正式发布：制程不变，超线程被砍

TAG标签：

网站开发网络凭借多年的网站建设经验，坚持以“帮助中小企业实现网络营销化”为宗旨，累计为4000多家客户提供品质建站服务，得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线：13245491521 13245491521 ，我们会详细为你一一解答你心中的疑难。项目经理在线

13245491521

与我们取得联系