您的位置: 专家智库 > >

宋超峰

作品数:2 被引量:2H指数:1
供职机构:天津大学电气与自动化工程学院更多>>
发文基金:国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 1篇调度
  • 1篇动态调度
  • 1篇动态系统
  • 1篇学习算法
  • 1篇强化学习算法
  • 1篇离散事件动态
  • 1篇离散事件动态...
  • 1篇函数
  • 1篇函数逼近
  • 1篇R学习
  • 1篇LEARNI...

机构

  • 2篇天津大学

作者

  • 2篇宋超峰
  • 1篇孙正雅
  • 1篇宗群

传媒

  • 1篇系统仿真学报

年份

  • 1篇2007
  • 1篇2006
2 条 记 录,以下是 1-2
排序方式:
基于平均报酬强化学习的电梯群组调度研究被引量:1
2007年
针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题特点的基础上,利用径向基函数神经网络解决行为值函数的存储与泛化问题,并结合电梯群组虚拟仿真环境进行验证。通过与两种典型的电梯群组调度算法进行比较,展示了平均报酬强化学习算法在处理具有吸收目标状态的大规模随机序贯决策问题的有效性及可行性。
宗群孙正雅宋超峰
关键词:离散事件动态系统
基于平均型强化学习算法的动态调度方法的研究
论文主要研究了基于平均型强化学习算法的动态调度方法。 实际的动态调度问题往往呈现出很大的复杂性:动态调度是一类信息不完全的调度,在环境不确定和扰动因素的影响下,需要不断的改变调度策略,是调度策略优化的过程;动态...
宋超峰
关键词:动态调度R学习函数逼近
文献传递
共1页<1>
聚类工具0