全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2018-09-23_资源 | Petuum&CMU开源Texar:一个模块化、多功能、可扩展的文本生成工具包

您的位置:首页 >> 新闻 >> 行业资讯

资源 | Petuum&CMU开源Texar:一个模块化、多功能、可扩展的文本生成工具包 选自Petuum 机器之心编译 参与:张倩、王淑婷 为促成不同文本生成任务的快速搭建以及任务之间的技术共享,由 Petuum 公司和卡耐基梅隆大学 (CMU) 为主要贡献者的通用工具包——Texar 正式开源。该工具包支持广泛的机器学习应用,重点聚焦于文本生成任务,尤其适合从事快速模型原型设计和实验的研究人员及从业者。 文本生成简介 文本生成旨在基于输入数据或机器表示生成自然语言, 包括广泛的自然语言处理(NLP)任务,例如机器翻译、对话系统、文本摘要、文章写作、文本复述及修改、图像加注等。尽管由于深度学习方法的整合,该领域在学术和产业方面都发展迅速,但为了改进技术、真正实现在现实世界的应用,还需要投入巨大的科研力量。 文本生成任务有很多共同的属性及两个中心目标: 生成人类水平的、合乎语法的可读文本。 生成包含所有从输入中推断出的相关信息的文本。例如,在机器翻译中,生成的翻译句子必须与原句表达相同的含义。 为了达到这些目标,几种关键技术的应用越来越广泛,如神经编码-解码器、注意力机制、记忆网络、对抗方法、强化学习、结构化监督,以及优化、数据预处理、结果后处理和评价等。这些技术经常以多种不同的方式结合在一起,解决不同的问题(见图 1)。 图 1:文本生成任务中用到的几种模型架构示例。E:编码器(encoder);D:解码器(decoder);C:分类器(classifier);A:注意力(attention);Prior:先验分布(prior distribution);M:记忆(memory)。 因此需要一个开源平台将这些不同但紧密相关的文本生成应用整合起来,提供核心算法的清晰、一致的实现。这一整合平台将实现不同算法之间共有要素的重复使用;将设计、实现及实验标准化;促进可复现的研究;特别是促成不同文本生成任务之间的技术共享---基于此,为特定任务改进的算法将得以迅速评估并泛化到许多其他任务。 Texar 简介 为此,我们开发了 Texar,一个专注于文本生成任务的开源工具包,使用 TensorFlow 语言。基于模块化、多功能及可扩展的核心设计理念,Texar 提取了文本生成中不同任务和方法的共同模式,并创建了一个高度可重复利用的模块和功能库。 图 2:Texar 的主要模块和功能 多功能性 Texar 包含广泛的模块和功能,用于组成任意的模型架构并实现各种学习算法,如最大似然估计、强化学习、对抗性学习、概率建模等(图 2)。 模块化 Texar 将各种复杂的机器学习模型/算法分解成高度可重复利用的模型架构、损失函数和学习过程模块等。 用户可以像组装积木一样组装 Texar 的模块,轻松直观地构建任意自己想要的模型。模块化的设计使得各模块的插入和替换变得简单,例如,在最大似然学习和强化学习之间切换只需改变几行代码即可。 可扩展性 Texar 可以轻松地与任何用户定制的外部模块集成,并且与 TensorFlow 开源社区完全兼容,包括 TensorFlow 本身的接口、功能和其他资源都能直接与 Texar 一起使用。 可用性 使用 Texar,用户既可以通过简单的 Python/YAML 配置文件来定制已有的模型, 也可以通过 Texar Python API 编程实现任意复杂的模型,达到最大的可定制性。 Texar 提供了自动的变量重用机制(无需担心复杂的 TensorFlow 变量范围)、简单的函数式调用来执行各模块的逻辑功能,而且每个模块都有丰富的配置选项和合理的默认值。 Texar 本身的代码有良好的结构、统一的设计模式、一致的代码风格,可读性强。Texar 也提供了清晰的文档和丰富的教程示例。 Texar 目前已用于支持 Petuum 公司的若干个研究和工程项目。他们希望这一工具包也能帮助社区加速文本生成及其它技术的发展,并欢迎研究人员及从业者的加入社区,进一步丰富这一工具,共同推进文本生成研究及相关应用的进展。 打开以下链接,了解更多关于 Texar 的信息: 网站:https://texar.io GitHub:https://github.com/asyml/texar 示例:https://github.com/asyml/texar/blob/master/examples 文档:https://texar.readthedocs.io/ 博客: https://medium.com/@texar 技术报告:https://arxiv.org/pdf/1809.00794.pdf 原文链接:https://medium.com/@Petuum/introducing-texar-a-modularized-versatile-and-extensible-toolkit-for-text-generation-and-beyond-b4e3289d5205 本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com 投稿或寻求报道:content@jiqizhixin.com 广告 & 商务合作:bd@jiqizhixin.com

上一篇:2024-05-27_AI独角兽集体求卖身,大模型公司洗牌开始了! 下一篇:2024-08-05_咖啡、茶坊、酒馆、烘焙,新茶饮副业起色如何?

TAG标签:

19
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价