2025年1月24日
星期五
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
沈栋
作品数:
1
被引量:21
H指数:1
供职机构:
中国科学院自动化研究所
更多>>
发文基金:
教育部“新世纪优秀人才支持计划”
霍英东青年教师基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
王凯
复杂系统智能管理与控制国家重点...
徐昕
国防科学技术大学机电工程与自动...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
动态系统
1篇
自适应控制
1篇
近似动态规划
1篇
MARKOV...
机构
1篇
国防科学技术...
1篇
中国科学院自...
1篇
亚利桑那大学
作者
1篇
徐昕
1篇
沈栋
1篇
王凯
传媒
1篇
自动化学报
年份
1篇
2012
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望
被引量:21
2012年
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。
徐昕
沈栋
高岩青
王凯
关键词:
MARKOV决策过程
近似动态规划
自适应控制
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张