ICCV 2021最佳论文Swin Transformer在线分享来了,一作亲自解读这篇超火论文
近日,计算机视觉领域三大顶会之一 ICCV 2021 已经圆满落幕。大会原定于加拿大蒙特利尔举办,因疫情原因改为线上举行,依旧热度不减。
据统计,今年的 ICCCV 共接收了 6236 篇有效论文投稿,其中接收 1617 篇被接收,接收率约为 25.9%。
在不久之前公布的论文奖项中,来自微软亚洲研究院的研究者获得了 ICCV 2021 马尔奖(最佳论文)。
论文地址:https://arxiv.org/pdf/2103.14030.pdf
项目地址:https://github.com/microsoft/Swin-Transformer
这篇论文的作者主要包括中国科学技术大学的刘泽、西安交通大学的林宇桐、微软的曹越和胡瀚等人。该研究提出了一种新的 vision Transformer,即 Swin Transformer,它可以作为计算机视觉的通用骨干。
相比之前的 ViT 模型,Swin Transformer 做出了以下两点改进:其一,引入 CNN 中常用的层次化构建方式构建分层 Transformer;其二,引入局部性(locality)思想,对无重合的窗口区域内进行自注意力计算。
在 Swin Transformer 论文公开没多久之后,微软官方也在 GitHub 上开源了代码和预训练模型,涵盖图像分类、目标检测以及语义分割任务。目前,该项目已收获 5300 星。
10月25日晚7点,机器之心邀请到 ICCV 2021 最佳论文的第一作者、中国科学技术大学的刘泽为我们解读这项研究。
分享主题:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
分享摘要:Swin Transformer 是第一个基于 Transformer 的通用计算机视觉骨干网络。它的核心在于将 Transformer 强大的建模能力和优秀的视觉先验相结合,包括层次性、局部性和平移不变性。Swin Transformer 在物体检测和语义分割等任务中大幅度刷新了此前的纪录,在近半年中被用于广泛的视觉任务并进一步证明了其通用性和有效性,包括视频动作识别、对比学习、图像恢复等。
嘉宾简介:刘泽,中国科大与微软亚研院联合培养博士生,研究方向为深度学习与计算机视觉。本科毕业于中国科大,以全院学分绩第一获得了科大最高荣誉郭沫若奖学金。论文 Swin Transformer 获得了 ICCV2021 的最佳论文奖(马尔奖)。
分享时间:10 月 25 日 19:00-20:00
直播间:点击下方机动组视频号,北京时间10月25日开播,立即预约吧。交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「ICCV」即可加入。
机器之心 · 机动组机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。
点击阅读原文,访问机动组官网,观看往期回顾:
关注机动组服务号,获取每周直播预告。
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线