全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2021-03-14_「转」目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral

您的位置:首页 >> 新闻 >> 行业资讯

目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral 点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 【导读】本文解决了两个挑战:一是在没有明确监督的情况下,将尚未引入的目标识别为“未知”,二是让网络进行N+1式增量学习。 虽然目标检测技术目前已经发展得较为成熟,但如果要真正能实现让计算机像人眼一样进行识别,有项功能一直尚未达成——那就是像人一样能识别现实世界中的所有物体,并且能够逐渐学习认知新的未知物体。来自澳大利亚国立大学和瑞典林雪平?学的学者发现并解决了这个问题。他们提出了一种新颖的方案:Open World Object Detector,简称ORE,即开放世界的目标检测。目前,作者已经将这项技术开源。 ORE主要包含两个任务: Open Set Learning,即在没有明确监督的情况下,将尚未引入的目标识别为“未知”;Incremental Learning,即让网络进行N+1式增量学习,接收相应标签以学习其识别到的未知类别,同时不会忘记之前已经学到的类别。检测效果如下所示: 上图(左)是ORE在学习后产生的结果。由于尚未引入“苹果“、”橘子“这些种类,ORE将其识别并正确标记为“未知“。而上图(右)是学习了新的种类的ORE,它成功的识别了新的目标种类,并将仍未引入的种类标记为“未知”。 在上图中,ORE再次展示了它作为开放世界检测器的真正特征:ORE在经过训练后成功识别左图的未知目标,即在右图中识别了牙刷和书籍等新引入的类别,同时没有忘记如何识别已知的目标。 下面,我们将更详细的介绍这篇论文。 提出背景深度学习加快了目标检测的研究进展,但目前现有方法都在一个强假设下进行:所有要被检测的种类都需要在训练阶段提供。那么当我们放宽这一假设时,就会出现两个具有挑战性的问题: (1)测试图像可能包含未知类的目标,这些未知目标也需要被归类; (2)当被识别为未知类别的标签已经可用时,模型需要进一步学习新的类别。 而与开放世界存在的无数类别相比,在Pascal VOC和MS-COCO等视觉数据集中标注的类数非常少。因此,将未知目标识别为未知类别需要强大的概括性。从下图也可以看出,开放世界的目标检测尚未得到解决。 论文方法开放世界的目标检测首先对“开放世界的目标检测”进行定义。在任何时间,我们都将已知的目标类别集合视为,其中表示正整数集合。 为了更真实的模拟现实世界,作者假设存在一组未知类别。 假定已知目标类别在数据集中被标记,其中和分别表示输入图像和标签。 输入图像集包括个训练图像,每个图像的相关对象标签形成标签集。 每个编码一组带有其类别标签和位置的个对象实例,即, ,其中和分别表示边界框的中心坐标,宽度和高度。 开放世界的目标检测设置考虑了目标检测模型,该模型经过训练可以检测所有先前遇到的对象类。重要的是,模型能识别属于任意已知类的测试实例,并能通过将其分类为未知类来识别新的或不可见的类别实例。未知的实例集将反馈给可以定义个新类别的使用者,并为此提供训练实例。因而逐渐添加个新类别并进行迭代,以生成新模型。 ORE:Open World Object Detecor成功的开放世界目标检测方法应能够在没有明确监督的情况下进行未知实例的识别,并能将识别出的新实例标签提供给模型进行知识升级,同时不会忘记之前的实例,且无需从头开始重新训练。本文提出的ORE便能一并应对这两个挑战。 对于每个已知类,保留原型向量. 。令是由目标检测器中间层对类对象生成的特征向量。我们将对比损失定义如下: 在用上述等式计算聚类损失时,我们将输入特征向量与原型向量进行对比。这需要用未知的地面真实等级标记未知的对象实例,而在已标注的大规模数据集中重新标注每个图像的所有实例显然是不切实际的。作为替代,作者建议自动将图像中的一些对象标记为潜在的未知对象。为此,作者基于RPN(区域候选网络)与类无关的事实,将那些具有较高客观性评分但不与ground-truth对象重叠的propasal标记为潜在的未知对象。 给定潜在空间中的特征及其对应的标签,我们试图学习一个能量函数。使用亥姆霍兹自由能公式将中所有值的能量组合在一起: 其中T是温度参数。在softmax层之后的输出与类特定能量值的吉布斯分布之间存在简单关联: 利用这种对应关系,将分类模型的自由能定义如下: 实验与结果作者提出了一项全面的评估标准来探讨开放世界的目标检测器的性能,包含对未知对象的识别,检测已知类别,以及对未知物提供以标签时逐渐学习新类别。下表显示了开放世界评估标准中的任务组成: 下表展示了ORE在开放世界目标检测中的表现。WI和A-OSE量化评估了ORE如何处理未知类(灰色背景),而mAP衡量了它如何很好地检测已知类(白色背景)。可以看到在所有指标上,ORE都始终优于基于Faster R-CNN的baseline。 同时,作者在三种不同的设置下将ORE与最新的增量式目标检测器进行了比较。如下表所示,ORE在所有设置中都表现十分出色。 论文传递门论文链接: https://arxiv.org/abs/2103.02603 代码: https://github.com/JosephKJ/OWOD 进入公众号,在消息对话框回复【CVPR2021】即可获取CVPR2021最新论文集

上一篇:2024-01-31_伯克利开源高质量大型机器人操控基准,面对复杂自主操控任务不再犯难 下一篇:2021-06-08_「转」OCT-LOFT 15周年主题论坛:用有限的时间,展望无限的未来

TAG标签:

17
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价