当前位置:网站首页>卡尔加里大学|基于强化学习的推荐系统综述
卡尔加里大学|基于强化学习的推荐系统综述
2022-06-22 18:32:00 【智源社区】
【标题】Reinforcement Learning based Recommender Systems: A Survey
【作者团队】M. Mehdi Afsar, Trafford Crump, Behrouz Far
【发表日期】2022.6.15
【论文链接】https://dl.acm.org/doi/pdf/10.1145/3543846
【推荐理由】推荐系统 (RS) 已成为日常生活中不可分割的一部分。传统上,推荐问题被认为是分类或预测问题,但现在人们普遍认为,将其表述为顺序决策问题可以更好地反映用户-系统交互。因此,它可以表述为马尔可夫决策过程(MDP)并通过强化学习(RL)算法来解决。与传统的推荐方法(包括协同过滤和基于内容的过滤)不同,RL 能够处理顺序的、动态的用户系统交互,并考虑到长期的用户参与。本文介绍了基于强化学习的推荐系统 (RLRS) 的研究。首先认识到并说明 RLRS 通常可以分为基于 RL 和 DRL 的方法。然后,提出了一个包含四个部分的 RLRS 框架,即状态表示、策略优化、奖励制定和环境建设,并相应地综述 RLRS 算法。本文使用各种图表突出新兴主题并描绘重要趋势。最后,讨论了未来可以解决的重要方面和挑战。
边栏推荐
- The array objects are filled in one by one according to the ID (fill Arr1 into arr2)
- calendar控件编程
- 51万奖池邀你参战!第二届阿里云ECS CloudBuild开发者大赛来袭
- 将一维数据(序列)转化为二维数据(图像)的方法汇总GAFS, MTF, Recurrence plot,STFT
- 2.什么是机械设计?
- About Random Forest
- 使用 qrcodejs2 生成二维码详细API和参数
- 修改隐含参数造成SQL性能下降案例之二
- Recommend an anatomy website
- 二叉排序树的查找、插入和删除
猜你喜欢

Creator mode summary

Openpnp debugging ------ 0816 Feida Tui 0402 taping

510000 prize pool invites you to join the war! The second Alibaba cloud ECS cloudbuild developer competition is coming
![K个一组翻转链表[链表拆解/翻转/拼装]](/img/70/fb783172fa65763f031e6bd945cbd9.png)
K个一组翻转链表[链表拆解/翻转/拼装]

如何用银灿IS903主控DIY自己的U盘?(练习BGA焊接的好项目)

1.3----- simple setting of 3D slicing software

Chapter I 100 hot questions (1-5)

Weizhi technology appeared in the Western Digital Expo, and the space-time AI technology was highly recognized
![[nfs failed to mount problem] mount nfs: access denied by server while mounting localhost:/data/dev/mysql](/img/15/cbb95ec823cdde5fb8f032dc45cfc7.png)
[nfs failed to mount problem] mount nfs: access denied by server while mounting localhost:/data/dev/mysql

实验4 NoSQL和关系数据库的操作比较
随机推荐
lua--迭代器、模块、元表
误用append案例一则
[nfs failed to mount problem] mount nfs: access denied by server while mounting localhost:/data/dev/mysql
图的存储结构(邻接矩阵)
Activereports report practical application tutorial (19) -- multi data source binding
How to judge whether text is an array in the slot
0.0 - Solidworks如何才能卸载干净?
堆排序(原理加代码)
K个一组翻转链表[链表拆解/翻转/拼装]
Online generation of placeholder pictures
.Net 5.0 通过IdentityServer4实现单点登录之oidc认证部分源码解析
YARN笔记
Xintang nuc980 usage record: basic description of development environment preparation and compilation configuration
从11小时到25秒--还有优化空间吗?
3D打印机耗材受潮
Agent model of structured model
c# winform 嵌入flash
Focal and global knowledge distillation for detectors
About Random Forest
Canvas picture frame