Mamba与小目标结合!2025年论文新宠儿!
有人说小目标检测不好做了?可不见得,作为目标检测领域的硬骨头,它在2025年依然充满挑战与机遇,妥妥的”学术富矿“(战术后仰)。
虽然传统CNN和Transformer方案已经卷出天际,但Mamba架构的横空出世给这个领域注入了新活力——它的线性复杂度优势和长序列建模能力,简直就是为小目标的"像素级定位"和"上下文依赖"难题量身定制的!
目前最火的创新方向集中在:1)Mamba的视觉空间建模改进(比如双向扫描策略),2)多尺度特征融合的轻量化设计,3)与动态卷积的混合架构,4)针对小目标的序列化数据增强。尤其推荐关注Mamba+扩散模型的跨模态方案,既蹭上大模型热度,又能真正解决小目标检测中的噪声敏感问题,发论文简直双倍快乐(doge)。现在入场正当时,毕竟SSM(状态空间模型)在CV领域的屠榜才刚刚开始!
本文整理了近期36篇顶会顶刊上发表的Mamba与小目标检测的前沿论文,可做参考,大家有需要扫码领取。
扫码添加学长,回复“小目标检测”
免费获取全部论文
01
Mamba嵌套结构的高效红外小目标检测
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small-Target Detection 方法:论文提出了一种名为MiM-ISTD的嵌套Mamba结构,用于高效红外小目标检测(ISTD)。该方法通过外层Mamba块和内层Mamba块分别捕获全局和局部特征,将图像划分为“视觉句子”和“视觉单词”,从而在保持线性复杂度的同时,实现对局部特征的精细建模。
创新点:
设计了Mamba-in-Mamba结构,外层Mamba块处理全局特征,内层Mamba块处理局部特征,显著提升了小目标的检测精度。
通过共享网络计算视觉单词间的关系,以极小的计算开销实现了局部特征的精细化建模。
实验表明,MiM-ISTD在NUAA-SIRST和IRSTD-1k数据集上表现优异,推理速度比现有方法快8倍,GPU内存占用减少62.2%。02
基于Mamba与CNN的多模态遥感目标检测
RemoteDet-Mamba: A Hybrid Mamba-CNN Network for Multi-modal Object Detection in Remote Sensing Images方法:论文提出了一种名为RemoteDet-Mamba的新型多模态无人机遥感目标检测框架。该框架结合了Siamese CNN网络和跨模态融合Mamba(CFM)模块,通过CNN提取多尺度局部特征,并利用Mamba的选择性扫描机制(SS2D)在四个方向上进行全局特征融合,实现了对密集分布小目标的高效检测。
创新点:
设计了CFM模块,基于Mamba的选择性扫描机制,在四个方向上对多模态特征进行全局扫描和融合,显著提升了小目标的区分能力。
结合CNN的局部特征提取能力和Mamba的全局建模优势,在保持线性计算复杂度的同时,实现了高效的多模态特征融合。
在DroneVehicle数据集上的实验表明,RemoteDet-Mamba的mAP达到81.8%,优于现有方法,同时保持了较低的参数量和较高的检测速度(24.01 FPS)。
扫码添加学长,回复“小目标检测”
免费获取全部论文
03
基于Mamba的红外小目标检测
IRMamba: Pixel Difference Mamba with Layer Restoration for Infrared Small Target Detection方法:
创新点:
设计了PDMamba模块,通过像素差分信息增强局部细节表示,同时利用空间分布函数区分目标和背景干扰。提出LRM模块,通过双向梯度下降和交叉近端映射,实现噪声抑制和目标层的精细重建。在多个公开数据集上的实验表明,IRMamba在客观指标和主观评估上均优于现有方法。04
运动与位移信息学习的红外小目标检测
MOCID: Motion Context and Displacement Information Learning for Moving Infrared Small Target Detection 方法:论文提出了一种名为MOCID的新型模型,用于动态红外小目标检测(MIRSTD)。该方法通过傅里叶启发的时空注意力(FISTA)和位移感知Mamba模块(DAM),分别从片段级别和帧级别捕捉运动上下文和位移信息,显著提升了动态目标的检测性能。
创新点:
设计了FISTA模块,通过傅里叶变换和可学习滤波器捕获运动上下文,并动态调整空间特征提取。
提出DAM模块,利用时间插值和差分感知扫描技术,建模帧间位移信息,增强对动态目标的感知能力。
在IRDST和DAUB数据集上的实验表明,MOCID在检测精度和效率上均优于现有方法,实现了速度与精度的平衡。
05
频谱交互Mamba
SMILE: Spatial-Spectral Mamba Interactive Learning for Infrared Small Target Detection方法:论文提出了一种名为SMILE(Spatial-Spectral Mamba Interactive Learning)的网络,用于红外小目标检测(IRSTD)。该方法通过透视变换重构数据,结合Mamba的多方向扫描机制,利用空间Mamba和频谱Mamba协同提取小目标的显著性特征和高频属性。此外,设计了双路径聚合网络(DPA)和混合表示学习模块(HRLM),以高效融合特征并优化局部细节。
创新点:
提出透视变换技术,将异构背景低秩化并突出小目标,使其与Mamba的多方向扫描机制相匹配,从而增强长程依赖捕捉能力。
设计空间-频谱交互SSM模块,通过空间Mamba和频谱Mamba分别提取小目标的显著性和高频特征,提升特征维度。引入DPA网络,通过选择性注意力策略减少模型冗余,同时保持检测性能;HRLM模块则通过多粒度特征融合优化局部特征。
扫码添加学长,回复“小目标检测”
免费获取全部论文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线