当前位置:网站首页>DeepWalk模型的简介与优缺点
DeepWalk模型的简介与优缺点
2020-11-06 01:22:00 【IT界的小小小学生】
1、DeepWalk
[DeepWalk] DeepWalk- Online Learning of Social Representations (SBU 2014)
word2vec是基于序列进行embedding;但是,实际上实体之间的关系越来越复杂化、网络化。这个时候sequence embedding------>graph embedding。
图的定义:
G=(V,E),Evv
两大块内容:
1、构建序列;------->随机游走,截断随机游走
2、word2vec训练;------>Skip-gram
2.模型特点:
文章开创性的提出了随机游走 + skipGram的形式对节点进行表达,后续大量工业界对emb的应用都是参照这种形式进行的。
deepWalk的核心思想就是分为两步:
(1)通过关系网络图构建随机游走序列;
(2)把生成的序列通过skip-Gram的形式记性表示,将每个节点都能够表示在同一个空间中。文章对于算法效果的评定主要是通过对于几个网站的用户进行多标签分类的任务。
实验结果显示,提升效果比较明显,同时在训练数据比较少的情况下本算法也能够有较好的表现。
优势:
数据量比较稀疏的时候依然能够有很好的表现
支持大规模在线执行预测
能够实现并行化操作
应用到的算法和公式都是基于语言模型的。
文章提出了如果能够直接得到训练序列,也不一定需要进行随机游走这个过程。
3.参考文献:
simrank:https://www.cnblogs.com/pinard/p/6362647.html
https://zhuanlan.zhihu.com/p/45167021
https://www.cnblogs.com/pinard/p/7243513.html
原论文:http://www.perozzi.net/publications/14_kdd_deepwalk.pdf
论文翻译:https://www.jianshu.com/p/5adcc3d94159
应用参考文献:https://yq.aliyun.com/articles/716011

版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/100975727
边栏推荐
- 安装Anaconda3 后,怎样使用 Python 2.7?
- 遞迴思想的巧妙理解
- Gradient understanding decline
- Dapr實現分散式有狀態服務的細節
- Kitty中的动态线程池支持Nacos,Apollo多配置中心了
- CCR炒币机器人:“比特币”数字货币的大佬,你不得不了解的知识
- 有关PDF417条码码制的结构介绍
- 7.2.2 compressing static resources through gzipresourceresolver
- Didi elasticsearch cluster cross version upgrade and platform reconfiguration
- 大数据应用的重要性体现在方方面面
猜你喜欢
分布式ID生成服务,真的有必要搞一个
Grouping operation aligned with specified datum
Computer TCP / IP interview 10 even asked, how many can you withstand?
事半功倍:在没有机柜的情况下实现自动化
用Keras LSTM构建编码器-解码器模型
中国提出的AI方法影响越来越大,天大等从大量文献中挖掘AI发展规律
(1) ASP.NET Introduction to core3.1 Ocelot
恕我直言,我也是才知道ElasticSearch条件更新是这么玩的
词嵌入教程
C++和C++程序员快要被市场淘汰了
随机推荐
7.2.2 compressing static resources through gzipresourceresolver
你的财务报告该换个高级的套路了——财务分析驾驶舱
《Google軟體測試之道》 第一章google軟體測試介紹
Kitty中的动态线程池支持Nacos,Apollo多配置中心了
Don't go! Here is a note: picture and text to explain AQS, let's have a look at the source code of AQS (long text)
多机器人行情共享解决方案
直播预告 | 微服务架构学习系列直播第三期
如何将数据变成资产?吸引数据科学家
htmlcss
快快使用ModelArts,零基础小白也能玩转AI!
從小公司進入大廠,我都做對了哪些事?
Cos start source code and creator
mac 下常用快捷键,mac启动ftp
分布式ID生成服务,真的有必要搞一个
深度揭祕垃圾回收底層,這次讓你徹底弄懂她
基於MVC的RESTFul風格API實戰
JetCache埋点的骚操作,不服不行啊
Jmeter——ForEach Controller&Loop Controller
容联完成1.25亿美元F轮融资
Every day we say we need to do performance optimization. What are we optimizing?