当前位置:网站首页>5. Contrôle discret et contrôle continu

5. Contrôle discret et contrôle continu

2022-07-08 01:20:00 C - - G

Discrete VS Continuous Control

Discrete
Insérer la description de l'image ici
Continuous
Insérer la description de l'image ici
DQNUne action, une dimension,Ne peut pas être utilisé pour le contrôle continu
Insérer la description de l'image ici
Policy NetworkUne action, une dimension,Ne peut pas être utilisé pour le contrôle continu
Insérer la description de l'image ici
Je dois utiliserDQNContrôle continu,Il s'agit de discrétiser l'espace continu
Insérer la description de l'image ici
Insérer la description de l'image ici
Better Approaches to Continuous Control
Insérer la description de l'image ici

Deterministic policy network

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

updating Value Network by TD

Insérer la description de l'image ici

Updating Policy Network by DPG

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

improvement:Using Target Networks

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Méthode de levage
Insérer la description de l'image ici
Insérer la description de l'image ici

Stochastic Policy for Continuous Control

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

Policy Network

Univariate Normal Distribution
Insérer la description de l'image ici
Multivariate Normal Distribution
Insérer la description de l'image ici
Function Approximation
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

Training Policy Network

Insérer la description de l'image ici

Auxiliary Network

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

Policy Gradient Methods

Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici
Insérer la description de l'image ici

原网站

版权声明
本文为[C - - G]所创,转载请带上原文链接,感谢
https://yzsam.com/2022/189/202207072320355505.html