当前位置：网站首页>【论文阅读｜深读】RolNE: Improving the Quality of Network Embedding with Structural Role Proximity

【论文阅读｜深读】RolNE: Improving the Quality of Network Embedding with Structural Role Proximity

2022-07-06 18:36:00 【海轰Pro】

前言

Hello！
非常感谢您阅读海轰的文章，倘若文中有错误的地方，欢迎您指出～

自我介绍 ଘ(੭ˊᵕˋ)੭
昵称：海轰
标签：程序猿｜C++选手｜学生
简介：因C语言结识编程，随后转入计算机专业，获得过国家奖学金，有幸在竞赛中拿过一些国奖、省奖…已保研。
学习经验：扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语！

唯有努力

知其然知其所以然！

本文仅记录自己感兴趣的内容

简介

原文链接：https://link.springer.com/chapter/10.1007/978-3-030-62005-9_2

会议：International Conference on Web Information Systems Engineering （ICIS）

年度：2020

Abstract

节点的结构角色是网络结构的基本信息，为理解网络结构提供了更好的视角

大多数网络嵌入学习算法都试图保留节点的邻域信息

然而，这些方法很难识别节点的结构角色贴近度

我们提出了一种新的方法RolNE

该方法通过对节点的度向量进行聚类来学习节点的结构角色贴近度
并使用聚合函数来学习包含邻域信息和结构角色贴近度的节点嵌入

在多个数据集上的实验表明，我们的算法在下游任务上的性能优于其他最先进的基线。

1 Introduction

网络描述了日常生活中复杂的信息。例如

邮件通信构成了人与人之间的社会网络[1]
城市之间的交通构成了交通网络

如何高效地执行大规模网络上的分析任务，如节点分类和聚类[2]，一直是该领域的研究基础和重点

目前的主流方法是利用网络表示学习来学习网络中节点的特征

网络嵌入算法将网络信息转化为低维稠密实数向量，作为下游机器学习算法的输入

目前，网络嵌入学习算法的工作主要集中在保持网络的微观结构，如节点之间的一阶邻近性、二阶邻近性和高阶邻近性

DeepWalk[7]在网络嵌入学习任务中引入了word2vec[13]
更多的工作[8，9，14，15，28]从不同的范围扩展了邻域的定义，并捕捉邻域信息来改进DeepWalk
GraphSAGE[16]是近年来提出的一种重要的网络嵌入学习算法。该算法主要学习从节点的局部邻域中提取特征信息，然后学习节点的嵌入

然而，网络中的结构信息不仅有微观结构[3]，还包含介观结构，如结构角色接近

结构角色贴近度描述了网络中具有相似角色的节点之间的相似性，例如链的边缘、星的中心以及两个社区之间的桥梁[3]

特别是在电子邮件网络和传输网络中，节点结构角色对于刻画节点具有重要意义
例如，在由电子邮件连接组成的社交网络中，两个部门的秘书在网络中相距较远，确实具有相似的结构角色

与捕捉节点邻域信息的一阶邻近度、二阶邻近度和高阶邻近度不同，结构角色邻近度试图捕捉具有相同结构角色的节点之间的相似性

如图1所示，节点a和b相距很远，但它们具有相似的结构角色

在这里插入图片描述

直观上，我们认为角色相似的节点应该具有相似的嵌入

但如果两个节点在网络中相距较远而没有共同的邻居，基于邻域信息的嵌入学习不能捕捉到节点的结构角色相似性
如果网络中节点的分类更依赖于结构角色接近度，则捕获结构角色接近度的嵌入将执行得更好

现有的保持结构角色相似度的网络嵌入学习算法通常需要人工标注拓扑特征[17]，进行复杂的特征工程

然后计算节点间的相似度得分来获得节点间的结构相似度[10]

当这些算法定义与本地网络邻域中不同拓扑对应的节点的结构角色时

例如链上的节点、离散空间中的星形中心，它们需要预先定义这样的离散角色，这需要领域专家和对网络结构的人工检查

我们设计了一种新的算法RolNE，该算法

使用一种简单的启发式方法来发现节点的结构角色
然后通过一个聚合函数来联合学习节点的结构角色邻近性和节点的邻域信息，以提高节点嵌入的质量

我们总结了我们研究的两个主要贡献：

首先，我们使用启发式方法来寻找具有相似结构角色的节点，这些节点不需要手动标注网络中的拓扑特征或计算两个节点之间的相似度。
其次，我们的方法有效地利用邻居信息和结构角色贴近度来学习节点嵌入。与以往只捕捉节点邻域特征或只保持节点结构等价的方法相比，提高了网络嵌入的质量。学习到的节点嵌入既包含节点结构角色的相似度，又包含节点连接的顺序信息。