当前位置:网站首页>香港理工大学|数据高效的强化学习和网络流量动态的自适应最优周界控制
香港理工大学|数据高效的强化学习和网络流量动态的自适应最优周界控制
2022-07-03 16:25:00 【智源社区】
【标题】Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics
【作者团队】C. Chen, Y.P. Huang, W.H.K. Lam, T.L. Pan, S.C. Hsu, A. Sumalee, R.X. Zhong
【发表日期】2022.6.28
【论文链接】https://www.sciencedirect.com/sdfe/reader/pii/S0968090X22001929/pdf
【推荐理由】现有的数据驱动和反馈流量控制策略没有考虑实时数据测量的异构性。此外,传统的交通控制强化学习(RL)方法由于缺乏数据效率,通常收敛缓慢。而且传统的最优周界控制方案需要准确了解系统动力学,因此它们容易受到内生不确定性的影响。本文提出了一种基于整体强化学习 (IRL) 的方法来学习宏观交通动态,以实现自适应最优周界控制。本文主要贡献:(a)开发了具有离散增益更新的连续时间控制,以适应离散时间传感器数据。(b) 为了降低采样复杂度并更有效地使用可用数据,将经验重放 (ER) 技术引入 IRL 算法。(c) 所提出的方法以“无模型”的方式放宽了对模型校准的要求,通过数据驱动的 RL 算法实现了对建模不确定性的鲁棒性并提高了实时性能。(d) 基于 IRL 的算法的收敛性和受控交通动态的稳定性得到理论证明。最优控制律被参数化,然后通过神经网络 (NN) 进行逼近,从而降低了计算复杂度。
边栏推荐
- Golang decorator mode and its use in NSQ
- Mysql 单表字段重复数据取最新一条sql语句
- NSQ source code installation and operation process
- 1287. Elements that appear more than 25% in an ordered array
- LeetCode1491. Average value of wages after removing the minimum wage and the maximum wage
- Record a jar package conflict resolution process
- Asemi rectifier bridge umb10f parameters, umb10f specifications, umb10f package
- Qt插件之自定义插件构建和使用
- 远程文件包含实操
- 探索Cassandra的去中心化分布式架构
猜你喜欢

8个酷炫可视化图表,快速写出老板爱看的可视化分析报告

Getting started with Message Oriented Middleware

Explore Netease's large-scale automated testing solutions see here see here

How to thicken the brush in the graphical interface

探索Cassandra的去中心化分布式架构

面试官:JVM如何分配和回收堆外内存
![App mobile terminal test [3] ADB command](/img/f1/4bff6e66b77d0f867bf7237019e982.png)
App mobile terminal test [3] ADB command

2022 love analysis · panoramic report of digital manufacturers of state-owned enterprises

Myopia: take off or match glasses? These problems must be understood clearly first

线程池执行定时任务
随机推荐
Mb10m-asemi rectifier bridge mb10m
【Proteus仿真】8×8LED点阵屏仿电梯数字滚动显示
pyinstaller不是内部或外部命令,也不是可运行的程序 或批处理文件
Colab works with Google cloud disk
TCP拥塞控制详解 | 3. 设计空间
Thinking about telecommuting under the background of normalization of epidemic | community essay solicitation
The mixlab editing team is recruiting teammates~~
无心剑中译泰戈尔《漂鸟集(1~10)》
架构实战营 - 第 6 期 毕业总结
1287. Elements that appear more than 25% in an ordered array
Unreal_DataTable 实现Id自增与设置RowName
PyTorch 1.12发布,正式支持苹果M1芯片GPU加速,修复众多Bug
用通达信炒股开户安全吗?
NSQ源码安装运行过程
Slam learning notes - build a complete gazebo multi machine simulation slam from scratch (II)
"Everyday Mathematics" serial 56: February 25
Record a jar package conflict resolution process
8个酷炫可视化图表,快速写出老板爱看的可视化分析报告
Stm32f103c8t6 firmware library lighting
Qt插件之自定义插件构建和使用