当前位置：网站首页>深度聚类：将深度表示学习和聚类联合优化

深度聚类：将深度表示学习和聚类联合优化

2022-07-07 00:43:00 【这个利弗莫尔不太冷】

参考文献：

简介

经典聚类即数据通过各种表示学习技术以矢量化形式表示为特征。随着数据变得越来越复杂和复杂，浅层（传统）聚类方法已经无法处理高维数据类型。结合深度学习优势的一种直接方法是首先学习深度表示，然后再将其输入浅层聚类方法。但是这有两个缺点：i）表示不是直接学习聚类，这限制了聚类性能； ii) 聚类依赖于复杂而不是线性的实例之间的关系； iii）聚类和表示学习相互依赖，应该相互增强。

为了解决改问题，深度聚类的概念被提出，即联合优化表示学习和聚类。

目的

聚类的主要目的是将实例分组，使相似的样本属于同一个簇，而不相似的样本属于不同的簇。样本集群提供了数据实例的全局表征，这可以显着有利于对整个数据集的进一步分析，例如异常检测，域适应，社区检测和判别表示学习等。

Image Representation Learning.

通过将现代表示学习技术（例如视觉变换器）引入深度聚类而取得了进展。作为最流行的方向之一，图像数据的无监督表示学习将在深度聚类中发挥核心作用并影响其他数据类型。

Text Representation Learning

文本表示学习的早期尝试利用了基于统计的方法，如 TF-IDF 、Word2Vec和 Skip-Gram。后来，一些工作专注于文本表示学习的主题建模和语义距离，以及更多关于无监督场景。最近，像 BERT 和 GPT-3这样的预训练语言模型逐渐在文本表示学习领域占据主导地位。

Video Representation Learning

视频表示学习是一项具有挑战性的任务，它将时空学习、多模型学习和自然语言处理（带视频摘要和字幕）结合到一个地方。早期的方法利用 LSTM Autoencoder 、3D-ResNets 和 3D-U-Net作为特征提取器。

Graph Representation Learning

经典的图表示学习旨在学习节点的低维表示，以便在嵌入空间中保留节点之间的接近度。此外，图级信息在蛋白质分类等任务中也具有巨大潜力，这在图级表示学习中引起了越来越多的关注

上面提到的数据类型特定表示学习可以是用于特征提取的朴素主干或端到端无监督表示学习，这是深度学习中最活跃的研究方向。随着更多类型的数据被收集，深度聚类会随着数据类型特定的表示学习技术而增长。

深度学习方法

多级深度聚类（Multistage Deep Clustering）

多级深度聚类是指两个模块分别优化和顺序连接的方法。一种直接的方法是使用深度无监督表示学习技术首先学习每个数据实例的表示，然后将学习的表示输入经典聚类模型以获得最终的聚类结果。这种数据处理和聚类的分离有助于研究人员进行聚类分析。更具体地说，所有现有的聚类算法都可以服务于任何研究场景。

迭代深度聚类（Iterative Deep Clustering）

迭代深度聚类的主要目的是良好的表示可以使聚类受益，而聚类结果反向为表示学习提供监督。大多数现有的迭代深度聚类管道在两个步骤之间迭代更新

1）在给定当前表示的情况下计算聚类结果；

2）在给定当前聚类结果的情况下更新表示。迭代深度聚类方法受益于表示学习和聚类之间的相互促进。然而，它们也受到迭代过程中的错误传播的影响。不准确的聚类结果可能导致混乱的表示，其中性能受到自标记有效性的限制。此外，这反过来会影响聚类结果，尤其是在训练的早期阶段。因此，现有的迭代聚类方法严重依赖于表示模块的预训练。