刘博
- 作品数:2 被引量:1H指数:1
- 供职机构:中国矿业大学信息与电气工程学院更多>>
- 发文基金:中国博士后科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于径向基统计网络的数据流分析模型
- 2010年
- 在传统径向基函数网络的基础上,提出一种用于数据流分析的径向基统计网络,采用复合多维高斯函数来拟合输入空间中不同区域的概率密度.基于数理统计方法的径向基统计网络学习算法的时间和空间复杂度,均与输入变量维数和隐层节点个数的乘积成线性关系,而与数据流规模无关,能够满足数据流分析的实时性要求.仿真结果表明,径向基统计网络能够有效解决数据流的回归和分类问题.
- 程玉虎刘博王雪松
- 关键词:数据流高斯函数
- 异质Agent间的知识迁移强化学习被引量:1
- 2010年
- 针对现有知识迁移方法仅适用于同质强化学习Agent的问题,提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法。该算法的主要思想是通过新旧Agent共同学习过的任务,利用神经网络离线学习两Agent间的Q值函数映射关系,利用构造的Q值函数映射器把旧Agent学过而新Agent没有学过的任务的Q值映射到新Agent上,从而可以减少新Agent的学习尝试次数,提高学习速度。10×10格子世界仿真结果验证了所提知识迁移Q学习算法的有效性。
- 刘博雷汝海
- 关键词:知识迁移Q值