Boundary-Guided Camouflaged Object Detection
0186.pdf
GitHub - thograce/BGNet: Boundary-Guided Camouflaged Object Detection
- 论文试图解决什么问题?
伪装物体的边界与背景之间的分界相当模糊并且难以区分, 不引入额外的先验信息很难精准的定位到伪装物体。并且,现有的方法往往无法分割出伪装物体的完整边界。
- 论文中提到的解决方案之关键是什么?
- 作者设计了一个边缘感知模块 (EAM),从高级语义特征以及包含边缘细节的低级特征中提取目标的边缘信息,用于缓解最终结果的边缘模糊问题。
- 作者设计了一个边缘引导特征模块(EFM),将来自 EAM 的边缘线索与每个级别的多级主干特征(f2-f5)集成,使之参与到后续 coarse to fine 的的解码中,从而增强边界表示。
- 作者设计了一个上下文聚合模块 (CAM), 利用多尺度之间的交互逐步聚合多级融合特征,最终得到伪装图。
- 这篇论文到底有什么贡献?
对于 COD 任务,作者提出了一种新的边界引导网络,即 BGNet,该网络挖掘和集成了边界相关的边缘语义,以提高伪装目标检测的性能。作者设计了边缘引导特征模块(EFM)和上下文聚合模块(CAM),以增强边界语义,并探索有价值和强大的特征表示。
- 下一步呢?有什么工作可以继续深入?
基于边缘的方法在定位小型伪装物体时,可能会定位错误。纹理 (TINet,DGNet) 可能比边缘能更好的定位到物体。下图为 TINet(AAAI 2022),DGNet 标注的纹理标签,以及 DGNet 的网络结构:


网络结构

- 作者选取了 ResNet-50 作为 backbone,提取出 5 层特征后,将 f_2 与 f_5 送入到边缘感知模块 (EAM) 中挖掘边缘信息,选择 f_2 与 f_5 是因为既可以利用 f_2 中保留的边缘细节信息,也可以利用 f_5 中的高级语义信息来抑制噪声。随后利用多个边缘引导聚合模块(EFM)将 EAM 模块提取的边缘特征与骨干网络提取的 f_2 -f_5 进行聚合,用于增强特征表示,最后利用多个上下文聚合模块(CAM)由粗到细的细化伪装图,选取最后一个阶段的 CAM 模块的输出作为最终预测结果。由于 f_1 中含有大量的噪声,因此,本文并未使用该层特征。
边缘感知模块 (EAM)
- EAM 模块的主要作用是为了给后续分割提供有价值的边缘先验,是网络能更好的分割伪装目标的边缘轮廓。低层特征中的噪声较多,因此,EAM 模块引入了高级语义特征作为辅助。
- 具体来说,就是先用 1x1 的卷积将 f_2 与 f_5 的通道数分别削减至 64(256->64),256(2048->256),将 f_2 上采样至与 f_5 相同的尺寸之后将两者 cat 起来。通过两个 3x3 的卷积进行融合,最后通过一个 1x1 的卷积和 sigmiod 函数得到边缘的预测图。EAM 是一个比较简单的模块,作者在消融实验中验证了它的有效性。此处边缘损失函数选取的为 dice loss(ECCV, 2020)。
