当前位置：网站首页>5、離散控制與連續控制

5、離散控制與連續控制

2022-07-08 01:19:00 【C--G】

Discrete VS Continuous Control

Discrete
在這裏插入圖片描述
Continuous

DQN一個動作一個維度，不能用於連續控制

Policy Network一個動作一個維度，不能用於連續控制

非要用DQN做連續控制，就要將連續空間離散化

Better Approaches to Continuous Control

Deterministic policy network

在這裏插入圖片描述

updating Value Network by TD

在這裏插入圖片描述

Updating Policy Network by DPG

在這裏插入圖片描述

improvement:Using Target Networks

在這裏插入圖片描述

提昇方法

Stochastic Policy for Continuous Control

在這裏插入圖片描述

Policy Network

Univariate Normal Distribution
在這裏插入圖片描述
Multivariate Normal Distribution

Function Approximation

Training Policy Network

在這裏插入圖片描述

Auxiliary Network

在這裏插入圖片描述

Policy Gradient Methods

在這裏插入圖片描述

版权声明
本文为[C--G]所创，转载请带上原文链接，感谢
https://yzsam.com/2022/189/202207072320355505.html

边栏推荐

猜你喜欢

随机推荐