当前位置:网站首页>【GCN-RS】Towards Representation Alignment and Uniformity in Collaborative Filtering (KDD‘22)
【GCN-RS】Towards Representation Alignment and Uniformity in Collaborative Filtering (KDD‘22)
2022-07-25 11:11:00 【chad_lee】
Towards Representation Alignment and Uniformity in Collaborative Filtering (KDD’22)
主要研究协同过滤方法中的表征。现有的研究主要集中在设计更强大的encoder以学习更好的表征。而缺乏对 CF 中表征的期望属性进行研究,这对于理解现有 CF 方法的基本原理和设计新的学习目标很重要。本文定义Alignment和Uniformity两个指标来衡量表征的质量。
- 理论上揭示了 BPR 损失与这两个属性(对齐和均匀性)之间的联系。
- 从Alignment和Uniformity的角度对经典的CF方法学习过程进行分析,更好的Alignment或Uniformity都有助于提高推荐性能
- 根据分析结果提出了一个直接优化这两个指标的学习目标 DirectAU
Alignment和Uniformity
在CF中,用编码器 f ( ) f() f()将用户和物品映射到低维表征 f ( u ) , f ( i ) ∈ R d f(u), f(i) \in \mathbb{R}^{\mathrm{d}} f(u),f(i)∈Rd。比如矩阵分解模型就是一个embedding表(LightGCN就在此基础上利用了邻域信息)。
表征的质量和两个关键属性高度相关:Alignment和Uniformity。给定数据分布 p d a t a ( ⋅ ) p_{d a t a}(\cdot) pdata(⋅)和正样本对的分布 p p o s ( ⋅ , ⋅ ) p_{p o s}(\cdot, \cdot) ppos(⋅,⋅),Alignment的定义为正样本对的标准化embedding之间的距离的期望,用 f ~ ( ) \tilde{f}() f~()表示L2标准化的表征:
l align ≜ E ( x , x + ) ∼ p pos ∥ f ( x ) − f ( x + ~ ) ∥ 2 l_{\text {align }} \triangleq \underset{\left(x, x^{+}\right) \sim p_{\text {pos }}}{\mathbb{E}}\left\|f(x)-f\left(\tilde{x^{+}}\right)\right\|^{2} lalign ≜(x,x+)∼ppos E∥∥f(x)−f(x+~)∥∥2
Uniformity定义为成对高斯函数的均值的对数:
l uniform ≜ log E x , y ∼ p data e − 2 ∥ f ( x ) − f ( y ~ ) ∥ 2 l_{\text {uniform }} \triangleq \log \underset{x, y \sim p_{\text {data }}}{\mathbb{E}} e^{-2\|f(x)-f(\tilde{y})\|^{2}} luniform ≜logx,y∼pdata Ee−2∥f(x)−f(y~)∥2
这两个指标和表征学习的目标非常一致:正样本应该彼此靠近,而随机样本应该尽可能均匀分布在超球面上。
作者先理论分析,Perfect Alignment 是指encoder f 把所有样本都编码到同一个表征: f ( u ) = f ( ~ i ) f(u)=\tilde{f(} i) f(u)=f(~i) a.s. over ( u , i ) ∼ p pos (u, i) \sim p_{\text {pos }} (u,i)∼ppos ;Perfect Uniformity 是指encoder f将所有样本的表征均匀的分布在一个超球体上。
理论证明
作者把BPR loss化简,证明如果存在Perfect Alignment和Perfect Uniformity的encoder,是BPR loss的下界:
公式(4)满足的条件是当且仅当 f 是perfectly aligned;公式(5)满足的条件是当且仅当 f 是perfectly uniform的 。因此, L B P R L_{BPR} LBPR 大于等于一个独立于 f 的常数,当且仅当 f是 perfectly aligned and uniform时等号成立。
实验分析
为了验证BPR以及其他loss在优化的过程中会优化对齐兴和均匀性,作者在不同的方法上进行了实验,随着训练过程进行,对齐和均匀性会得到相应的优化和改善。这也说明 CF 中的用户和商品表征的质量依赖这两个属性。实现更好的对齐或均匀性都有助于提高推荐性能,同时优化它们可能是有益的。

随机初始化后,Uniformity很好,Alignment很差,前期学习过程主要是优化Alignment,后期的性能提升主要来自于Uniformity。这也比较好理解,正样本相近是好实现的,但是在样本分布均匀的基础上实现正样本相近是需要花费effort的。
DirectAU

分析完发现Alignment和Uniformity对于用户和物品表征的质量至关重要,于是设计了一个新的学习目标,直接优化这两个属性:
l align = E ( u , i ) ∼ p pos ∥ f ( ( ~ u ) − f ( ~ i ) ∥ 2 l uniform = log E u , u ′ ∼ p user e − 2 ∥ f ( u ) ~ − f ( u ′ ~ ) ∥ 2 / 2 + log i , i ′ ∼ p item E e − 2 ∥ f ( i ) − f ( i ′ ) ∥ 2 / 2. L DirectAU = l align + γ l uniform \begin{aligned} &l_{\text {align }}=\underset{(u, i) \sim p_{\text {pos }}}{\mathbb{E}} \| f(\tilde{(} u)-f \tilde{(} i) \|^{2}\\ &l_{\text {uniform }}=\log \underset{u, u^{\prime} \sim p_{\text {user }}}{\mathbb{E}} e^{-2\left\|f \tilde{(u)}-f\left(\tilde{u^{\prime}}\right)\right\|^{2}} / 2+ \log _{i, i^{\prime} \sim p_{\text {item }}}^{\mathbb{E}} e^{-2\left\|f(i)-f\left(i^{\prime}\right)\right\|^{2}} / 2 .\\ &\mathcal{L}_{\text {DirectAU }}=l_{\text {align }}+\gamma l_{\text {uniform }} \end{aligned} lalign =(u,i)∼ppos E∥f((~u)−f(~i)∥2luniform =logu,u′∼puser Ee−2∥f(u)~−f(u′~)∥2/2+logi,i′∼pitem Ee−2∥f(i)−f(i′)∥2/2.LDirectAU =lalign +γluniform
这里有个好处是不需要负采样构造负样本,只需要正样本优化 l a l i g n l_{align} lalign,然后batch样本优化 l u n i f o r m l_{uniform} luniform,in-batch的样本是是user和user计算,item和item计算。
实验结果

只用MF作为encoder效果就很好,如果用LightGCN作为encoder,提升也比较大:
这个loss可以让embedding的Uniformity维持在随机初始化的状态,即均匀分布的状态。
边栏推荐
- Risks in software testing phase
- Various controls ==pyqt5
- Maskgae: masked graph modeling meets graph autoencoders
- Differences in usage between tostring() and new string()
- Web APIs (get element event basic operation element)
- [MySQL learning 08]
- JS data types and mutual conversion
- 30套中国风PPT/创意PPT模板
- LeetCode 50. Pow(x,n)
- 【云驻共创】AI在数学界有哪些作用?未来对数学界会有哪些颠覆性影响?
猜你喜欢

Risks in software testing phase

Power BI----这几个技能让报表更具“逼格“

Miidock Brief

Zero-Shot Image Retrieval(零样本跨模态检索)

油猴脚本链接

Multi-Label Image Classification(多标签图像分类)

Varest blueprint settings JSON

Differences in usage between tostring() and new string()

【GCN多模态RS】《Pre-training Representations of Multi-modal Multi-query E-commerce Search》 KDD 2022

PHP curl post x-www-form-urlencoded
随机推荐
Review in the middle of 2022 | understand the latest progress of pre training model
JS data types and mutual conversion
LeetCode 50. Pow(x,n)
Zero-Shot Image Retrieval(零样本跨模态检索)
基于TCP/IP在同一局域网下的数据传输
小程序image 无法显示base64 图片 解决办法 有效
W5500上传温湿度到oneNET平台
W5500通过上位机控制实现调节LED灯带的亮度
JVM performance tuning methods
php curl post Length Required 错误设置header头
已解决 Files‘ name is invalid or does not exist (1205)
PHP curl post length required error setting header header
Hardware peripherals =maixpy3
异构图神经网络用于推荐系统问题(ACKRec,HFGN)
11. Reading rumors spread with deep learning
W5500多节点连接
return 和 finally的执行顺序 ?各位大佬请看过来,
OSPF综合实验
Web APIs (get element event basic operation element)
[cloud co creation] what is the role of AI in mathematics? What will be the disruptive impact on the mathematical world in the future?