当前位置:网站首页>自监督论文阅读笔记 TASK-RELATED SELF-SUPERVISED LEARNING FOR REMOTE SENSING IMAGE CHANGE DETECTION
自监督论文阅读笔记 TASK-RELATED SELF-SUPERVISED LEARNING FOR REMOTE SENSING IMAGE CHANGE DETECTION
2022-08-03 05:23:00 【YoooooL_】
摘要:
遥感影像变化检测 广泛应用于 城市变化检测、灾害评估等领域。然而,现有的大多数基于 CNN 的变化检测方法 仍然存在 伪变化抑制不足 和 特征表示不足的问题。在这项工作中,提出了一种 基于 具有平滑机制的任务相关自监督学习变化检测网络(TSLCD)的无监督变化检测方法来消除它。
Contributions:
(1) 引入了任务相关的自监督学习模块,以更有效地提取空间特征。
(2) 应用 hard-sample-mining 损失函数来更加关注难以分类的样本。
(3) 采用 平滑机制 去除部分伪变化和噪声。
在四个遥感变化检测数据集上的实验表明,所提出的 TSLCD 方法实现了最先进的变化检测任务。
Introduction:
变化检测 在人类对遥感图像的解译中 起着重要作用。一方面,变化检测任务可以 及时准确地 检测出土地发生变化的区域。另一方面,它为 土地管理 和 预测变化趋势 提供了依据。其应用领域和研究范围也非常广泛,包括土地覆盖变化检测[1]、森林覆盖检测[2]、湿地变化检测[3]、市区扩张[4]、灾害评估[5]、和海岸线变化[6]。
在过去的几十年中,已经开发了许多技术来 检测 多时相遥感图像的变化。这些方法中的大多数可以分为两类:有监督的和无监督的[7]。在经典的监督方法中,Mou 等人。 [8] 提出了 ReCNN,它被训练以提取联合光谱-空间-时间特征表示。赵等人。 [9] 提出 MeGAN 来探索 用于伪变化抑制 的季节性不变特征。张等人。 [10] 使用遥感图像场景分类数据集 对网络进行预训练,然后利用 迁移学习 和 共享权重网络 生成多尺度特征差异图用于变化检测。这些方法需要先验知识和大量手动标记的样本,否则模型的通用性和鲁棒性会降低 [11,12,13]。
为了解决这个问题,在过去的几十年中已经提出了许多无监督的变化检测方法。萨哈等人。 [14] 提出 DCVA 通过 生成光谱变化向量 来获得差异图像,并通过 基于阈值 或 基于聚类 的方法获得最终的变化图。韩等人。 [15]提出了K-T变换,它基于多维光谱空间中的信息分布结构,对图像进行经验线性正交变换。Do 等。 [16] 使用两个深度网络来提取特征,并利用慢速特征分析来提取不变像素的最不变分量。
然而,上述方法大多有其局限性,其变化检测结果普遍存在大量伪变化,导致误报率较高。一般来说,伪变化是指 由天气和季节变化引起的 阴影变化 和 植被颜色变化。
在这项工作中,提出了一种 具有平滑机制的基于任务相关的自监督学习的变化检测网络(TSLCD),该网络无需任何手动标记的样本即可获得 与任务相关的特征表示 并 去除更多的伪变化。
Contributions:
(1) 为了在不人工标注样本的情况下获得任务相关特征,提出了一种自监督学习模块,生成大量标记的 相似和不相似的成对级样本,这对应于变化检测任务中 不变和变化的成对样本。
(2) 针对难分类样本的挖掘,提出了hard-sample-mining loss函数来改变难分类样本的权重,使网络更加关注难分类样本。
(3)为了 去除一些噪声和伪变化,即 由于天气和季节变化引起的阴影变化和植被颜色变化,提出了 平滑机制 以获得变化检测结果的可靠性。
所提出框架的整体架构如图 1 所示。从逻辑上讲,该方法包括三个主要步骤。
- 首先,训练一个 与任务相关的自监督模块,以在大量正负成对样本中 提取 与变化检测任务一致的 深层特征。
- 其次,基于提出的 硬样本挖掘损失函数,通过 与训练后的自监督网络 共享参数模型来训练 TSLCD。
- 第三,基于 TSLCD 网络生成的变化图,可以利用 平滑机制 来去除一些噪声和伪变化,即由天气和季节变化引起的阴影变化和植被颜色变化。
整个 任务相关的自监督模块 包括两个阶段,成对的样本选择 和 模型训练。为了获得更好的特征表示,通常需要使用监督学习,这需要足够的人工标注样本。然而,手动标记数据是一个耗时且昂贵的过程。因此,这项工作设计了一个任务,它可以从现有图像中生成大量标签,并使用这些标签来学习图像的表示。
为了 使模型得到的特征表示 与 变化检测任务得到的特征表示 一致,它生成了大量相似和不相似的成对样本。
对于变化检测任务,变化的成对样本的相似度值较小,而未变化的成对样本的相似度值较大。为了生成相似和不相似的成对样本,这项工作使用 无监督图像分割算法[17] 对原始图像进行分割,可以描述为:
其中 Xs 是分割图像,k 是类别数。我们认为 类间样本不相似,类内样本相似。因此,采用可靠的采样策略从分割图中选择 ms 对相似的成对样本 和 md 对不同的成对样本,可以描述为:
其中 N 是从 Xs 裁剪的大小为 n × n 的patch。 K是patch N的中心像素。Nij是patch N的第i行第j列像素。CK是中心像素K的类别。CNij是像素Nij的类别。 | · |表示集合{·}中的元素总数,表示patch N中与中心像素具有相同类别的其他样本的数量。方程 2 表示当 | · |除以 n × n 大于 p 时,选择大小为 n × n 的可靠patch N。
为了确保模型可以有效地利用正负成对样本,ms 和 md 的大小保持在同一数量级。主干网络由四个卷积层组成,其中卷积核的大小为 3 × 3。卷积层结合了 Rectified Linear Unit (ReLU)。我们利用 欧几里得距离 来衡量样本的相似性。损失函数描述如下:
其中 d 是 成对样本的特征之间的 欧几里得距离。 m 是 用于 分离相似和不相似的成对样本 的边距。如方程式3中所述,训练任务相关的自监督模块,采用对比损失作为损失函数。
在任务相关的自监督学习阶段,自监督模块 得到的特征表示 更适合变化检测任务。由于设计的任务 与 变化检测任务 的高度一致性,该模块可以 使训练阶段更快收敛,提高变化检测结果。因此,变化检测阶段的主干网络 采用 两个权重共享的预训练自监督网络 来提取输入patch的特征,然后将两个特征 级联到两个全连接层,得到一个二值变化图。
采用 交叉熵损失 作为损失函数来训练模型。由于在训练过程中一些 容易分类的样本 和 难以分类的样本 对损失的贡献是接近的,因此模型 不能有效地利用 难以分类的样本。因此,为了更加关注 难分类样本,本工作考虑 挖掘难分类样本的信息。如方程式4所示,工作引入了 伽马因子 来增加 难分类样本 的权重。通过改变 gamma 的大小,可以 增加难分类样本 对损失的贡献,从而 使网络更加关注难分类样本,并学习到对任务更有帮助的知识。
其中 σ 是 sigmoid 函数,y ∈ Ygt 是patch的标签,∧y ∈ Yrm 是 patch的预测。 γ 是伽马因子。通过 增加 gamma 因子的值,可以增加 hard-classify-sample 对 loss 的贡献。
上面得到的变化图 仍然包含很多 伪变化 和 噪声,指的是由于天气和季节变化引起的阴影变化和植被颜色变化。为了消除这些,已经提出了一种 平滑机制。为了便于模型学习,使用一个patch 的中心像素的标签 来表示整个patch的标签。因此,对于整个patch,每个像素标签的可靠性与像素与中心像素之间的距离呈负相关,采用二维高斯分布建模。
如图 1 所示,随着 与中心像素距离 的增加,patch 中每个像素的标签 可靠性降低。每个像素的标签的可靠性是 通过 对包含该像素的所有patch的可靠性进行累加得到的,描述如下:
其中 Nij 表示第 i 行第 j 列像素,VNij 是像素 Nij 的总可靠性。 dq 是像素 Nij 和第 q 个补丁 Nq 的中心像素之间的距离度量。 rq 是patch Nq 中像素 Nij 的可靠性。 ∧yq 表示第 q 个patch Nq 的预测,~yq 表示预测的类别。 σq 是patch Nq 的方差。最后通过 确定阈值 得到最终的二值变化图。
为了评估估计结果的定量准确性,采用了总体误差(OE,Overall Error)、Kappa系数(Kappa)、漏检(MD)和误报(FA)四个客观评价指标。
在表 1 中,与其他方法相比,所提出的 TSLCD 以最低的 OE 和最高的 Kappa 实现了最好的结果。因为 任务相关的自监督学习模块 可以提取 任务一致的特征,而 平滑机制 可以通过 利用空间邻域信息 来去除一些伪变化。
没有平滑机制 (SM) 的 TSLCD 具有 更好的变化检测能力,SM 对 伪变化 和 噪声 有很大的抑制作用。
此外,FDCNN、VGG16 KM、FCM、MRF等算法 会带来很多误检。该结果表明自监督学习模块可以有效地提取原始图像的特征。由于网络 挖掘硬样本 的能力有限,设计的损失函数 增加了硬样本的权重 以 增加其对损失的贡献,网络可以更好地利用硬样本。最后,利用平滑机制对变化图进行平滑处理以降低噪声。
最后,表 2 证明了本文提出的方法中不同模块的有效性。总之,在四个数据集上的不同实验可以清楚地验证所提出的 TSLCD 具有 更好的变化检测 和 伪变化抑制性能。
Conclusion:
这项工作介绍了一种 基于 TSLCD 的无监督变化检测方法,其中 任务相关的自监督学习网络用于 从遥感图像中 学习更好的特征,利用 硬样本挖掘损失函数 来 更加关注分类的样本。此外,还提出了一种 平滑机制 来减少伪变化和噪声,从而更有效地获得最终的二进制变化图。对来自不同传感器的四个数据集的实验验证了所提出的 TSLCD 方法实现了最先进的性能。
边栏推荐
猜你喜欢
随机推荐
Oracle 密码策略详解
[Rebound shell and privilege escalation]
Let small program development into ` tailwind jit ` era
梯度下降、反向传播
【命令执行与中间件漏洞】
中国食品微生物检测行业深度监测及投资战略规划建议报告2022~2028年
中国生物反应器行业市场投资分析及前景预测报告2022~2028年
中国聚氯乙烯(PVC)土工膜发展动态及投资前景预测报告2022~2028年
【Yarn】yarn常用命令 查看日志和Kill任务
中国人造金刚石行业投资战略规划及发展前景预测报告2022~2028年
理论上的嵌入式跑马灯
【DC-5 Range Penetration】
Sentinel初次使用Demo测试
神经网络基础
pta a.1030的dijkstra+DFS方法
Router-view
enum和enum class的区别
令人愉快的 Nuxt3 教程 (二): 快速轻松地搭建博客
c#,.net 下载文件 设置断点
【HQL】(一)json字符串处理json_tuple和get_json_object