当前位置:网站首页>香港理工大学|数据高效的强化学习和网络流量动态的自适应最优周界控制
香港理工大学|数据高效的强化学习和网络流量动态的自适应最优周界控制
2022-07-03 16:25:00 【智源社区】
【标题】Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics
【作者团队】C. Chen, Y.P. Huang, W.H.K. Lam, T.L. Pan, S.C. Hsu, A. Sumalee, R.X. Zhong
【发表日期】2022.6.28
【论文链接】https://www.sciencedirect.com/sdfe/reader/pii/S0968090X22001929/pdf
【推荐理由】现有的数据驱动和反馈流量控制策略没有考虑实时数据测量的异构性。此外,传统的交通控制强化学习(RL)方法由于缺乏数据效率,通常收敛缓慢。而且传统的最优周界控制方案需要准确了解系统动力学,因此它们容易受到内生不确定性的影响。本文提出了一种基于整体强化学习 (IRL) 的方法来学习宏观交通动态,以实现自适应最优周界控制。本文主要贡献:(a)开发了具有离散增益更新的连续时间控制,以适应离散时间传感器数据。(b) 为了降低采样复杂度并更有效地使用可用数据,将经验重放 (ER) 技术引入 IRL 算法。(c) 所提出的方法以“无模型”的方式放宽了对模型校准的要求,通过数据驱动的 RL 算法实现了对建模不确定性的鲁棒性并提高了实时性能。(d) 基于 IRL 的算法的收敛性和受控交通动态的稳定性得到理论证明。最优控制律被参数化,然后通过神经网络 (NN) 进行逼近,从而降低了计算复杂度。
边栏推荐
- 斑马识别成狗,AI犯错的原因被斯坦福找到了
- pycharm错Error updating package list: connect timed out
- 用同花顺炒股开户安全吗?
- 手机注册股票开户安全吗 开户需要钱吗
- Mongodb installation and basic operation
- Cocos Creator 2.x 自动打包(构建 + 编译)
- PHP CI(CodeIgniter)log级别设置
- Pychart error updating package list: connect timed out
- Famous blackmail software stops operation and releases decryption keys. Most hospital IOT devices have security vulnerabilities | global network security hotspot on February 14
- Explore Cassandra's decentralized distributed architecture
猜你喜欢
QT串口ui设计和解决显示中文乱码
NSQ源码安装运行过程
Interviewer: how does the JVM allocate and recycle off heap memory
消息队列消息丢失和消息重复发送的处理策略
Asemi rectifier bridge umb10f parameters, umb10f specifications, umb10f package
8个酷炫可视化图表,快速写出老板爱看的可视化分析报告
[solved] access denied for user 'root' @ 'localhost' (using password: yes)
Détails du contrôle de la congestion TCP | 3. Espace de conception
Slam learning notes - build a complete gazebo multi machine simulation slam from scratch (I)
TCP congestion control details | 3 design space
随机推荐
Construction practice camp - graduation summary of phase 6
相同切入点的抽取
8 tips for effective performance evaluation
Develop team OKR in the way of "crowdfunding"
远程文件包含实操
From the 18th line to the first line, the new story of the network security industry
无心剑中译泰戈尔《漂鸟集(1~10)》
[combinatorics] combinatorial identities (review of eight combinatorial identities | product of combinatorial identities 1 | proof | use scenario | general method for finding combinatorial numbers)
为抵制 7-Zip,列出 “三宗罪” ?网友:“第3个才是重点吧?”
远程办公之大家一同实现合作编辑资料和开发文档 | 社区征文
Uploads labs range (with source code analysis) (under update)
于文文、胡夏等明星带你玩转派对 皮皮APP点燃你的夏日
How to initialize views when loading through storyboards- How is view initialized when loaded via a storyboard?
[combinatorics] non descending path problem (outline of non descending path problem | basic model of non descending path problem | non descending path problem expansion model 1 non origin starting poi
记一次jar包冲突解决过程
手机注册股票开户安全吗 开户需要钱吗
Golang 匿名函数使用
How to set up SVN server on this machine
[proteus simulation] 8 × 8LED dot matrix screen imitates elevator digital scrolling display
Visual SLAM algorithms: a survey from 2010 to 2016