全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2019-09-20_新模型学到头秃?gobbli统一模型库帮你快速上手文本分类,内置BERT、fastText等

您的位置:首页 >> 新闻 >> 行业资讯

新模型学到头秃?gobbli统一模型库帮你快速上手文本分类,内置BERT、fastText等 机器之心报道 参与:一鸣、张倩 模型太多往往也是个问题,特别是开发者需要逐个学习每个模型的使用方法。最近,RTI International 公司的数据科学家们开发了一个统一的语言模型库 gobbli。用户可以像使用 Keras 那样直接上手文本分类任务,还有很多知名的语言模型可以选择,如 BERT 等。 近年来,迁移学习在自然语言处理领域取得了很大的进展,许多通用语言任务都可以被新提出的模型解决。然而,各种各样的语言模型层出不穷,它们由不同的团队开发,应用这些模型的开发者需要去学习其应用方法,包括与模型进行交互的方法。 这无疑提高了开发者使用这些优秀模型的成本。很多使用模型的人往往不是专业的开发者,他们可能是学生、研究机构和大学的研究者或企业雇员。如果能有一个统一的库,让用户从一个渠道去使用各种各样的语言模型,这会为他们带来极大的便利,特别是急需用语言模型却无从下手的社会科学研究者和机器学习初学者。 为了解决这一问题,RTI International 公司的数据科学家们开发了一个用于文本分类的语言模型库——gobbli,旨在将自然语言处理和应用领域的最新研究与现实世界的问题和数据关联起来。gobbli 为一般文本分类问题提供了统一接口和一些辅助工具,可以使得迁移学习更加简单,用户可以用简单的代码完成文本分类的任务。 gobbli 有什么用? gobbli 是一个开源 python 库,旨在使利用深度学习进行实验和分析更加容易,可以排除由输入/输出格式、库版本等不同而带来的复杂性。gobbli 试图实现一组通用用例,强调可用性而不是性能。 gobbli 的目标不是为生产环境提供深度学习模型。每个任务通常都需要在后台运行一个 Docker 容器,并在磁盘之间传输大量数据,这将造成很大的开销。此外,gobbli 也不支持细粒度特定模型调参,如定制损失函数。gobbli 希望能够尽快帮助用户完成 80% 的深度学习解决方案,然后他们再决定是否值得去继续投入精力,解决剩下的 20%。 除了为当前最优模型提供统一接口,gobbli 还会提供一些辅助工具,其灵感来自将自然语言处理应用于社会科学和调查研究时常见的问题类型和数据集。 项目地址:https://github.com/RTIInternational/gobbli 使用文档:https://gobbli.readthedocs.io/en/latest/quickstart.html gobbli 怎么用? gobbli 有着类似于 Keras 的代码风格,非常简洁。用户可利用已有的模型快速实验,也可以先用数据进行训练,然后投入到自己的任务中去使用。 此外,gobbli 也支持使用 WordNet 进行数据增强、随机词嵌入等功能,基本上满足了文本分类任务方面的需求。如下为官方文档提供的示例代码: 当用户不需要训练时,只需要导入 gobbli 中的一些包,提供形如列表的数据,就可以开始训练了。甚至标签也不需要换成向量或编号。 fromgobbli.experimentimportClassificationExperiment fromgobbli.modelimportMajorityClassifier X=["Thisispositive.","Thisisnegative.","Thisisbad.","Thisisgood.","Thisisreallybad.","Thisisreallygood.","Thisisprettygood.","Thisisprettybad.",] y=["Good","Bad","Bad","Good","Bad","Good","Good","Bad",] exp=ClassificationExperiment(model_cls=MajorityClassifier,dataset=(X,y)) results=exp.run() gobbli 同时也支持用户进行训练,首先设定训练条件: fromgobbli.ioimportTrainInput train_input=TrainInput( #X_train:Alistofstringstoclassify X_train=["Thisisatrainingdocument.","Thisisanothertrainingdocument."], #y_train:ThetrueclassforeachstringinX_train y_train=["0","1"], #Andlikewiseforvalidation X_valid=["Thisisavalidationsentence.","Thisisanothervalidationsentence."], y_valid=["1","0"], #Numberofdocumentstotrainonatonce train_batch_size=1, #Numberofdocumentstoevaluateatonce valid_batch_size=1, #Numberoftimestoiterateoverthetrainingset num_train_epochs=1) 设置模型: fromgobbli.modelimportMajorityClassifier clf=MajorityClassifier()#Setupclassifierresources--Dockerimage,etc. clf.build() 开始训练: train_output=clf.train*(train_input) 在需要进行推断时: fromgobbli.ioimportPredictInput predict_input=PredictInput( #X:Alistofstringstopredictthetrainedclassesfor X=["Whichclassisthisdocument?"], #Passthesetoflabelsandthetrainedcheckpoint #fromthetrainingoutput labels=train_output.labels, checkpoint=train_output.checkpoint, #Numberofdocumentstopredictatonce predict_batch_size=1) predict_output=clf.predict(predict_input) gobbli 支持哪些模型? gobbli 目前已经支持很多语言模型,如 BERT、fastText 和简单的 transformer,用户可以根据需要调用。 gobbli 怎么安装? 为了使用 gobbli,用户需要安装 Docker,运行 Docker 命令,并安装 Python3.7,然后使用以下命令安装 gobbli 即可: pipinstallgobbli 参考链接:https://www.rti.org/insights/unified-framework-brings-fresh-approach-text-classification https://github.com/RTIInternational/gobbli 本文为机器之心报道,转载请联系本公众号获得授权。 ?------------------------------------------------加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或寻求报道:content@jiqizhixin.com广告 & 商务合作:bd@jiqizhixin.com

上一篇:2021-02-25_维基百科20岁,它是这样给自己庆生的 下一篇:2024-10-09_GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

TAG标签:

18
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价