全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2018-07-02_资源 | T2T:利用StackGAN和ProGAN从文本生成人脸

您的位置:首页 >> 新闻 >> 行业资讯

资源 | T2T:利用StackGAN和ProGAN从文本生成人脸 选自GitHub 机器之心编译 参与:张倩、王淑婷 在现实生活中,我们通常见过一个人后只会留下非常抽象的印象,也许只能用少量话语描述特定特征。而计算机视觉是不是也能仅使用少量的描述性语句就生成对应的人脸图像?本 GitHub 项目使用了最新发布的 Face2Text 数据集,并通过结合 StackGAN 与 ProGAN 从文本生成人脸图像。 项目地址:https://github.com/akanimax/T2F 本项目利用深度学习由文本生成人脸图像,除了结合 StackGAN 和 ProGAN,作者还参考了从文本到图像的研究,并修改为从文本合成人脸。 StackGAN++由树状结构的多个生成器和鉴别器组成;从树的不同分支生成对应于同一场景的多尺度图像。ProGAN 的关键思想是逐步增加生成器和鉴别器的表征能力:从低分辨率开始,我们添加了新的层,随着训练的进行,这些层的细节越来越精细。 论文:StackGAN++: Realistic Image Synthesis with Stacked Generative Adversarial Networks 地址:https://arxiv.org/abs/1710.10916 论文:Progressive Growing of GANs for Improved Quality, Stability, and Variation 地址:https://arxiv.org/abs/1710.10196 数据 Face2Text v1.0 数据集包含来自 LFW(Labelled Faces in the Wild)数据集 400 个随机选择图像的自然语言描述。这些数据已经经过清洗,剔除了不适合、不相关的人像描述。有些文字不仅描述了面部特征,还提供了一些来自图片的隐含信息。例如,其中一张人像的描述这样写道:「图中人物可能为一名罪犯」。由于以上因素及数据集相对较小,我决定使用该数据集来证明架构的概念。最终,我们可以扩展模型,以灌输更大、更多样的数据集。 数据存储地址:data/LFW/Face2Text/face2text_v0.1 样例: 架构: 视频 Demo: 使用 LSTM 网络将文本描述编码为一个汇总向量。使图中所示的汇总向量,即嵌入(psy_t),通过条件增强块(单一线性层)以获得 GAN 本征向量的文本部分(使用变分自动编码器,如重新参数化技术)作为输入。本征向量的第二部分为随机高斯噪声。由此产生的本征向量被馈送到 GAN 的发生器部分,而嵌入被馈送到鉴别器的最后一层用于条件分布匹配。GAN 的训练进展与 ProGAN 论文所述完全一致;即在增加的空间分辨率上逐层进行。使用淡入技术引入新层以避免破坏先前的学习。 运行代码 代码存在 implementation/子目录中。使用 PyTorch 框架实现。因此,若要运行此代码,请先安装 PyTorch version 0.4.0,然后再继续。 代码组织: configs:包含用于训练网络的配置文件(你可以使用任意一个,也可以自己创建)。 data_processing:包含数据处理和加载模块的包 networks:包含网络实现的包 processed_annotations:目录存储运行 process_text_annotations.py 脚本的输出 process_text_annotations.py:处理标题并将输出存储在 processed _ annotations /目录中。(无需运行此脚本;pickle 文件包含在报告中。) train_network.py:运行训练网络的脚本。 示例配置: #Allpathstodifferentrequireddataobjects images_dir:"../data/LFW/lfw" processed_text_file:"processed_annotations/processed_text.pkl" log_dir:"training_runs/11/losses/" sample_dir:"training_runs/11/generated_samples/" save_dir:"training_runs/11/saved_models/" #HyperparametersfortheModel captions_length:100 img_dims: -64 -64 #LSTMhyperparameters embedding_size:128 hidden_size:256 num_layers:3#numberofLSTMcellsintheencodernetwork #ConditioningAugmentationhyperparameters ca_out_size:178 #ProGANhyperparameters depth:5 latent_size:256 learning_rate:0.001 beta_1:0 beta_2:0 eps:0.00000001 drift:0.001 n_critic:1 #Traininghyperparameters: epochs: -160 -80 -40 -20 -10 #%ofepochsforfadinginthenewlayer fade_in_percentage: -85 -85 -85 -85 -85 batch_sizes: -16 -16 -16 -16 -16 num_workers:3 feedback_factor:7#numberoflogsgeneratedperepoch checkpoint_factor:2#savethemodelsafterthesemanyepochs use_matching_aware_discriminator:True#usethematchingawarediscriminator 使用 requirements.txt 安装项目的所有依赖项。 $workon[yourvirtualenvironment] $pipinstall-rrequirements.txt 样本运行: $mkdirtraining_runs $mkdirtraining_runs/generated_samplestraining_runs/lossestraining_runs/saved_models $train_network.py--config=configs/11.comf 本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com 投稿或寻求报道:content@jiqizhixin.com 广告 & 商务合作:bd@jiqizhixin.com

上一篇:2022-11-29_从长远来看读博的收益是巨大的,为什么读博的人却很少? 下一篇:2021-01-09_这个饮料包装,才不是为了治疗颈椎病

TAG标签:

21
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价