当前位置：网站首页>3、多智能体强化学习

3、多智能体强化学习

2022-07-07 23:21:00 【C--G】

基本概念

Settings

在这里插入图片描述

Fully Cooperative Setting
Fully Competitive Setting
Mixed Cooperative & Competitive
Self-Interested Setting

基本术语

State，Action，State Transition
Rewards
Returns
Policy Network
Uncertainty in the Return
State-Value Function

Convergence

Single-Agent Policy Learning
Multi-Agent Policy Learning
Difficulty of MARL
Single-Agent Policy Gradient for MARL

Architectures

在这里插入图片描述

Fully Decentralized

Execution
Actor-Critic Method

Fully Centralized

在这里插入图片描述

Method
Shortcoming：Slow during Execution

Centralized Training with Decentralized Execution

在这里插入图片描述

Parameter Sharing

在这里插入图片描述

版权声明
本文为[C--G]所创，转载请带上原文链接，感谢
https://blog.csdn.net/weixin_50973728/article/details/125661807

边栏推荐

猜你喜欢

随机推荐