887700葡京线路检测-主頁欢迎您

首页|8455新葡萄娱乐场网站|师资队伍|学科建设|本科教育|研究生教育|学生工作|党群工作|科研工作|对外合作
站内搜索:
 
  首页
 887700葡京办理优惠大厅 
 学院动态 
 左滚文章 
 
  学院动态    
学术报告:机器学习之强化学习原理概述
2021年11月17日   审核人:   (阅读次数:)

学术报告:机器学习之强化学习原理概述

报告人:张继文(高级工程师,东软集团)

报告时间:20201117日(周三)13:30

报告地点:公共教学楼E101

报告摘要:强化学习(Reinforcement Learning),属于一种机器学习架构,它是通过让智能体(Agent)不断地对所处环境(Environment)进行探索和开发并根据反馈的回报(Reward)进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4:1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来,不论在科研界还是工业界,强化学习发挥重要的作用。本报告简介强化学习的数学原理,以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下,将介绍DQN和Actor-Critic等深度强化学习算法。

主讲人简介: 张继文,1984年06月,博士生导师,国家青年特聘专家,国家优秀青年基金获得者完成国家自然科学青年项目一项。以第一作者或通讯作者在《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文10篇。


关闭窗口
沈阳工业大学 | 沈阳工业大学学报 | 软件产业校企联盟 | 宅客学院 | 解放号 | 麦塔平台 | 奖学金设置

沈阳工业大学887700葡京线路检测  地址:沈阳市铁西区兴顺街南十三路1号
电话:024-25695596  邮编:110023