当前位置:网站首页>marathon-envs项目环境配置(强化学习模仿参考动作)
marathon-envs项目环境配置(强化学习模仿参考动作)
2022-07-06 08:29:00 【daoboker】
运行这个项目(Unity引擎)的原因主要还是想可以在不同物理引擎中去模仿参考动作。在这之前已经运行过Deepmimic(Bullet引擎),Deepmimic的参考动作是四元数的格式,可以通过BvhToDeepMimic换自己的参考动作(.bvh),当然参考动作(.bvh)可以通过frankmocap等项目生成的smpl数据集格式转化过来。
1.主项目:
1.1 配置python环境
pip install mlagents==0.14.1
1.2 配置Unity环境
Unity版本2020.1.2f1
1.3 training
官方训练文档
如果要自己在unity里训练而不是调用它的.X86_64的话,在conda终端输入以下命令再在Unity里点出scene场景按button按钮即可,--run-id可以自己随意设置:
mlagents-learn config/marathon_envs_config.yaml --train --run-id=hopper001
换成自己的参考动作进行训练:
在Unity里点击Assets/MarathonEnvs/Environments/MarathonManBackflipEnv-v0.prefab,再点击上方框里的AnimatorBase002下的Animator,把Animations文件夹下的controller文件拖到右边框里的Controller里。然后要不build好导出.X86_64,要不就是选择scenes修改train_environments的数量(赛道的数量)在Unity软件里进行训练。
下一步: 添加自己的参考动作.fbx和对应的.controller进行训练,并且研究一下强化学习。

2.版本0.5:
2.1 配置python环境
对应0.5版本,下载好之后创建python3.6不能3.7的环境,本地安装代码目录下的mlagents==0.5.0,然后缺什么装什么。或者先去用官方命令装pip install mlagents==1.10.0 mlagents_envs==0.10.0,然后再去替换主包mlagents(个人没试过不知道可不可行):
conda create -n marathon python=3.6
cd ml-agents
python setup.py install
2.2 配置unity环境(上面代码里的Unity SDK包)
unity API接口要和 python API 接口对应,这也正是为什么要本地安装mlagents package的原因
unty版本(2018.2.14.f)要从导入unity SDK时看,ubuntu系统的话从unity hub里下载对应的版本即可,点击网站即可跳转unity hub下载。
2.3 training
这部分照手册里来就可以,点出scene场景,配置内部还是外部externel权重后,在conda里运行下列代码后回unity里即可开始训练。
mlagents-learn config/marathon_envs_config.yaml --train --run-id=hopper001
2.4 附录(0.5版本python环境)
Package Version
-------------------- -------------------
absl-py 1.1.0
argon2-cffi 21.3.0
argon2-cffi-bindings 21.2.0
astor 0.8.1
async-generator 1.10
attrs 21.4.0
backcall 0.2.0
bleach 1.5.0
certifi 2016.9.26
cffi 1.15.0
cycler 0.11.0
dataclasses 0.8
decorator 5.1.1
defusedxml 0.7.1
docopt 0.6.2
entrypoints 0.4
gast 0.5.3
grpcio 1.11.1
html5lib 0.9999999
importlib-metadata 4.8.3
iniconfig 1.1.1
ipykernel 5.5.6
ipython 7.16.3
ipython-genutils 0.2.0
ipywidgets 7.7.0
jedi 0.17.2
Jinja2 3.0.3
jsonschema 4.0.0
jupyter 1.0.0
jupyter-client 7.1.2
jupyter-console 6.4.3
jupyter-core 4.9.2
jupyterlab-pygments 0.1.2
jupyterlab-widgets 1.1.0
kiwisolver 1.3.1
Markdown 3.3.7
MarkupSafe 2.0.1
matplotlib 3.0.0
mistune 0.8.4
mlagents 0.5.0
nbclient 0.5.9
nbconvert 6.0.7
nbformat 5.1.3
nest-asyncio 1.5.5
notebook 6.4.10
numpy 1.13.3
packaging 21.3
pandocfilters 1.5.0
parso 0.7.1
pexpect 4.8.0
pickleshare 0.7.5
Pillow 8.4.0
pip 21.2.4
pluggy 1.0.0
prometheus-client 0.14.1
prompt-toolkit 3.0.29
protobuf 3.6.1
ptyprocess 0.7.0
py 1.11.0
pycparser 2.21
Pygments 2.12.0
pyparsing 3.0.9
pyrsistent 0.18.0
pytest 7.1.2
python-dateutil 2.8.2
PyYAML 5.4.1
pyzmq 23.1.0
qtconsole 5.2.2
QtPy 2.0.1
Send2Trash 1.8.0
setuptools 49.6.0.post20210108
six 1.16.0
tensorboard 1.7.0
tensorflow 1.7.0
termcolor 1.1.0
terminado 0.13.0
testpath 0.6.0
tomli 1.2.3
tornado 6.1
traitlets 4.3.3
typing_extensions 4.1.1
wcwidth 0.2.5
Werkzeug 2.0.3
wheel 0.37.1
widgetsnbextension 3.6.0
zipp 3.6.0
3. 后续问题
1.不知道程序内部是怎么调用参考动作训练集的,想自己去换掉参考动作文件(.fbx)并且修改配置参数进行强化学习训练。
2.作者的项目结构过于庞大,想要深入了解有点困难而且版本过多,每个版本里面的代码都不一样,就如最新的github版本里的代码,里面专门有一个animation文件夹放参考动作生成的权重也是.nn,而老版本是里面有各种动作的场景,参考动作不知道放哪里去了而且生成的权重后缀是.bytes。
边栏推荐
- China high purity silver nitrate Market Research and investment strategy report (2022 Edition)
- Chrome浏览器的crash问题
- egg. JS directory structure
- synchronized 解决共享带来的问题
- Restore backup data on S3 compatible storage with br
- China Light conveyor belt in-depth research and investment strategy report (2022 Edition)
- 从 SQL 文件迁移数据到 TiDB
- The resources of underground pipe holes are tight, and the air blowing micro cable is not fragrant?
- [secretly kill little partner pytorch20 days -day01- example of structured data modeling process]
- 【Nvidia开发板】常见问题集 (不定时更新)
猜你喜欢
![[MySQL] database stored procedure and storage function clearance tutorial (full version)](/img/27/e775e03b77c7195216bc50c5cbefb4.png)
[MySQL] database stored procedure and storage function clearance tutorial (full version)

sublime text没关闭其他运行就使用CTRL+b运行另外的程序问题

pcd转ply后在meshlab无法打开,提示 Error details: Unespected eof

2. File operation - write

sublime text中conda环境中plt.show无法弹出显示图片的问题

Pointer advanced --- pointer array, array pointer

电脑清理,删除的系统文件

CISP-PTE实操练习讲解

Unified ordering background interface product description Chinese garbled
![[research materials] 2022 China yuancosmos white paper - Download attached](/img/b4/422dff0510bbe67f3578202d6e80b7.jpg)
[research materials] 2022 China yuancosmos white paper - Download attached
随机推荐
[research materials] 2022 China yuancosmos white paper - Download attached
游戏解包的危害及资源加密的重要性
Analysis of pointer and array written test questions
ESP系列引脚說明圖匯總
Migrate data from a tidb cluster to another tidb cluster
3. File operation 3-with
torch建立的网络模型使用torchviz显示
[MySQL] log
Mobile Test Engineer occupation yyds dry goods inventory
化不掉的钟薛高,逃不出网红产品的生命周期
[cloud native topic -45]:kubesphere cloud Governance - Introduction and overall architecture of enterprise container platform based on kubernetes
Huawei cloud OBS file upload and download tool class
The ECU of 21 Audi q5l 45tfsi brushes is upgraded to master special adjustment, and the horsepower is safely and stably increased to 305 horsepower
LDAP application (4) Jenkins access
logback1.3. X configuration details and Practice
Fibonacci sequence
Colorlog combined with logging to print colored logs
Cisp-pte practice explanation
堆排序详解
【MySQL】锁
