当前位置:网站首页>DeepWalk模型的简介与优缺点
DeepWalk模型的简介与优缺点
2020-11-06 01:22:00 【IT界的小小小学生】
1、DeepWalk
[DeepWalk] DeepWalk- Online Learning of Social Representations (SBU 2014)
word2vec是基于序列进行embedding;但是,实际上实体之间的关系越来越复杂化、网络化。这个时候sequence embedding------>graph embedding。
图的定义:
G=(V,E),Evv

两大块内容:
1、构建序列;------->随机游走,截断随机游走
2、word2vec训练;------>Skip-gram
2.模型特点:
文章开创性的提出了随机游走 + skipGram的形式对节点进行表达,后续大量工业界对emb的应用都是参照这种形式进行的。
deepWalk的核心思想就是分为两步:
(1)通过关系网络图构建随机游走序列;
(2)把生成的序列通过skip-Gram的形式记性表示,将每个节点都能够表示在同一个空间中。文章对于算法效果的评定主要是通过对于几个网站的用户进行多标签分类的任务。
实验结果显示,提升效果比较明显,同时在训练数据比较少的情况下本算法也能够有较好的表现。
优势:
数据量比较稀疏的时候依然能够有很好的表现
支持大规模在线执行预测
能够实现并行化操作
应用到的算法和公式都是基于语言模型的。
文章提出了如果能够直接得到训练序列,也不一定需要进行随机游走这个过程。
3.参考文献:
simrank:https://www.cnblogs.com/pinard/p/6362647.html
https://zhuanlan.zhihu.com/p/45167021
https://www.cnblogs.com/pinard/p/7243513.html
原论文:http://www.perozzi.net/publications/14_kdd_deepwalk.pdf
论文翻译:https://www.jianshu.com/p/5adcc3d94159
应用参考文献:https://yq.aliyun.com/articles/716011
版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/100975727
边栏推荐
- [C#] (原創)一步一步教你自定義控制元件——04,ProgressBar(進度條)
- 使用Asponse.Words處理Word模板
- Elasticsearch database | elasticsearch-7.5.0 application construction
- Network programming NiO: Bio and NiO
- 用Keras LSTM构建编码器-解码器模型
- Use of vuepress
- 小白量化投资交易入门课(python入门金融分析)
- After brushing leetcode's linked list topic, I found a secret!
- 阿里云Q2营收破纪录背后,云的打开方式正在重塑
- 自然语言处理之命名实体识别-tanfordcorenlp-NER(一)
猜你喜欢
随机推荐
如果前端不使用SPA又能怎样?- Hacker News
hadoop 命令总结
被老程式設計師壓榨怎麼辦?我不想辭職
Computer TCP / IP interview 10 even asked, how many can you withstand?
Leetcode's ransom letter
Use of vuepress
使用NLP和ML来提取和构造Web数据
Troubleshooting and summary of JVM Metaspace memory overflow
Details of dapr implementing distributed stateful service
【Flutter 實戰】pubspec.yaml 配置檔案詳解
小白量化投资交易入门课(python入门金融分析)
“颜值经济”的野望:华熙生物净利率六连降,收购案遭上交所问询
JetCache埋点的骚操作,不服不行啊
人工智能学什么课程?它将替代人类工作?
給萌新HTML5 入門指南(二)
【新閣教育】窮學上位機系列——搭建STEP7模擬環境
In depth understanding of the construction of Intelligent Recommendation System
容联完成1.25亿美元F轮融资
The practice of the architecture of Internet public opinion system
C++和C++程序员快要被市场淘汰了




