大讲堂 | 强化学习的鲁棒性问题

11次阅读

广西路桥集团10年转型升级之道:修一条路,架一座桥,搞一套信息化

信息化高速路不再是一句口号。

语音播放文章内容

由深声科技提供技术支持

您的浏览器不支持 audio 元素。

分享主题

鲁棒强化学习

 

分享背景

强化学习算法依赖大量采样的特性决定了需要首先在仿真环境中训练智能体策略再迁移到现实系统中。因此当仿真环境和现实系统出现不匹配时,策略的鲁棒性是影响强化学习算法能否实用的关键因素。本次公开课中,讲者将介绍华为伦敦研究所决策与推理团队在鲁棒强化学习方面的相关工作。


分享嘉宾

任航,伦敦帝国理工学院博士,任职于华为诺亚方舟实验室伦敦

ToB不再是少数人的生意,谁可把握住机会? | AI最佳掘金案例榜

国内ToB市场新一轮爆发的浪潮中,哪些企业可以把握住机会?

分享提纲

  • 华为伦敦研究所决策与推理团队介绍

  • 强化学习的相关背景知识与强化学习的鲁棒性问题

  • Wasserstein Robust Reinforcement Learning 论文解读

 

分享时间

(北京时间 )  10月 10 日(星期四)  20:00

风情信息风情信息(公众号:风情信息)风情信息

审视全球十大AI事件,AI治理如何做到趋利避害

旷视成立AI治理研究院,盘点“2019全球10大AI治理大事件”,引发各界热议。

正文完
 
admin
版权声明:本站原创文章,由 admin 2021-04-27发表,共计519字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。