湖南省自然科学基金(07JJ3122)
- 作品数:2 被引量:3H指数:1
- 相关作者:吴军徐昕李兆斌连传强刘春明更多>>
- 相关机构:国防科学技术大学更多>>
- 发文基金:霍英东青年教师基金湖南省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于XML的分布式虚拟运行环境建模与实现
- 当前很多网络计算环境尚缺乏为多种应用提供隔离、定制的运行环境的能力,给网络计算环境的广泛应用带来障碍.而虚拟机技术的飞速发展,使得根据用户需求,按需构建隔离、定制的分布式虚拟运行环境成为可能.基于XML schema技术...
- 李东升黄峰王小海
- 关键词:虚拟机
- 文献传递
- 增强学习算法的性能测试与对比分析被引量:2
- 2010年
- 研究了几类典型增强学习算法的性能评估问题,包括Q-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代(KLSPI)算法等,重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究。分别利用值函数非平滑的组合优化问题——旅行商问题(TSP)和值函数平滑的Mountain-Car运动控制问题,对不同增强学习算法的性能进行了测试和比较分析。分析了三种算法针对不同类型问题的各自特点,通过实验对比,验证了近似策略迭代算法,特别是KLSPI算法在解决值函数平滑的序贯决策问题时性能更优。通过分析实验结果表明,MDP值函数的平滑程度是影响近似策略迭代算法性能表现的重要因素。
- 李兆斌徐昕吴军连传强
- 关键词:值函数
- 面向分布协同控制研究的仿真环境设计与实现被引量:1
- 2009年
- 针对分布式系统,尤其是多机器人系统中协同控制问题的研究需要,提出了一种具有分层嵌套结构的多Agent仿真环境设计方案,以克服现有仿真环境存在的兼容性差和算法移植困难的问题。设计方案在系统总体结构中引入了层次多Agent的设计思想;在子系统中采用Acromovi结构框架设计;在个体Agent中采用了混合型的内部结构设计。具体应用于多机器人仿真环境设计中,通过不同的实验配置方案,逐步实现多机器人系统的虚拟仿真和半实物仿真。最终的多机器人编队控制实验表明了设计方案的有效性。
- 吴军徐昕宋金泽刘春明贺汉根
- 关键词:多智能体多机器人半实物仿真