当前位置:网站首页>频谱聚类|拉普拉斯矩阵
频谱聚类|拉普拉斯矩阵
2022-07-23 05:38:00 【我是女生,我不做程序媛】
频谱聚类的概念
频谱聚类的本质是利用样本间的相似度,降维后使用聚类算法进行节点聚类。
其中用到的拉普拉斯矩阵的特征值被成为“谱”。
拉普拉斯矩阵
① 样本相似度矩阵S:
我们有n个样本,利用某种相似度度量方法可以获得两两样本之间的相似度。如使用高斯相似度:
S i , j = e x p ( − ∣ ∣ x i − x j ∣ ∣ 2 2 2 σ 2 ) S_{i,j}=exp(-\frac{||x_i-x_j||_2^2}{2\sigma^2}) Si,j=exp(−2σ2∣∣xi−xj∣∣22)
得到样本的相似度矩阵,记为S。
② 邻接矩阵A:
对每个样本点,取其k近邻作为其邻居节点,构造邻接矩阵A。
即如果i是j的k近邻且j是i的k近邻,则 A i , j = S i , j A_{i,j}=S_{i,j} Ai,j=Si,j,否则 A i , j = 0 A_{i,j}=0 Ai,j=0
③ 度矩阵D:
D是一个对角阵,对角元是每个节点的度,其余元素为0.
④ 非标准化的拉普拉斯矩阵:
L=D-A
⑤ 标准化后的拉普拉斯矩阵:
L s y m = D − 1 2 L D − 1 2 L_{sym}=D^{-\frac{1}{2}}LD^{-\frac{1}{2}} Lsym=D−21LD−21
此处 L s y m L_{sym} Lsym有一条重要的性质:拉普拉斯矩阵的0特征值重数k等于其对应的图中的连通分量的个数。
频谱聚类的步骤
输入:样本集D=(𝑥1,𝑥2,…,𝑥𝑛),降维后的维度m, 聚类方法,聚类后的维度y
输出: 簇划分𝐶(𝑐1,𝑐2,…𝑐y).
①~⑤:同上,求出标准化后的拉普拉斯矩阵∈ R n ∗ n R_{n*n} Rn∗n
⑥ 求出 L s y m L_{sym} Lsym的特征值,取最小的m个特征值,求其对应的特征向量,组成一个n*m的矩阵,即降维后的特征矩阵,每行对应一个样本点。
⑦ 对该矩阵进行标准化
⑧ 对标准化后的特征向量矩阵进行聚类(如k-means)
边栏推荐
- 【无标题】
- js中拼接字符串,注意传参,若为字符串,则需要加转义字符
- Déploiement du projet (version abrégée)
- 手风琴效果
- Web server failed to start. Port 8080 was already in use.
- With only 5000 lines of code, AI renders 100 million landscape paintings on v853
- 【达人专栏】还不会用Apache Dolphinscheduler吗,大佬用时一个月写出的最全入门教学【二】
- Activiti工作流使用之新建bpmn文件
- shell/sh/bash的区别和基本操作
- idea中复制一个项目/project
猜你喜欢

大厂面试机器学习算法(0):特征工程 | 数据预处理

Flask blueprint

【系统问题】.NET Framework 3.5 安装错误

SPR:SUPERVISED PERSONALIZED RANKING BASED ON PRIOR KNOWLEDGE FOR RECOMMENDATION

Meyer burger Siemens industrial computer maintenance and machine tool maintenance

Notifier Nordic fire engine power supply maintenance and daily maintenance

With only 5000 lines of code, AI renders 100 million landscape paintings on v853
![[ROS advanced chapter] Lesson 8 syntax explanation of URDF file](/img/ad/038d088d5cd17784d3e2d7291bb750.jpg)
[ROS advanced chapter] Lesson 8 syntax explanation of URDF file

达人专栏 | 还不会用 Apache Dolphinscheduler?大佬用时一个月写出的最全入门教程

Powerbi Getting Started Guide
随机推荐
RPC与thrift入门
【无标题】
Updated again, idea 2022.2 officially released
項目部署(簡版)
9、光线追踪
Keras保存训练过程中的最好模型
字典创建与复制
【Anaconda 环境管理与包管理】
Huck hurco industrial computer maintenance winmax CNC machine tool controller maintenance
3.Flask 中的线程
Gerrit 使用操作手册
Alipay DTS architecture
JDBC learning and simple encapsulation
Flask源码剖析(一)请求入口
vim常用命令总结
【达人专栏】还不会用Apache Dolphinscheduler吗,大佬用时一个月写出的最全入门教学【二】
With only 5000 lines of code, AI renders 100 million landscape paintings on v853
开发必备之Idea使用
Powerbi Getting Started Guide
Cadence (IX) 17.4 rules and spacing settings