张伟
- 作品数:8 被引量:61H指数:4
- 供职机构:北京工业大学电子信息与控制工程学院更多>>
- 发文基金:北京市自然科学基金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术环境科学与工程更多>>
- 基于ASPL模型的多智能体强化学习在RoboCup中的应用
- 多智能体系统是分布式人工智能系统的一个特殊类型。在多智能体系统中,动作的重复选择将导致Agent之间的协调性变差,同时传统的强化学习会造成很大的计算消耗。因此,本文以基本的强化学习为基础,应用多智能体强化学习方法,同时引...
- 张家旺韩光胜张伟
- 关键词:多智能体机器人足球
- 文献传递
- 溶解氧浓度的直接自适应动态神经网络控制方法被引量:31
- 2015年
- 针对污水处理过程溶解氧浓度的控制问题,提出一种直接自适应动态神经网络控制方法(direct adaptive dynamic neural network control,DADNNC).构建的控制系统主要包括神经网络控制器和补偿控制器.神经网络控制器由自组织模糊神经网络实现系统状态与控制量之间的映射;提出一种基于规则无用率的结构修剪算法,并给出结构调整后网络收敛的理论证明.同时,为保证系统稳定,设计补偿控制器减小网络逼近误差,参数调整由Layapunov理论给出.国际基准仿真平台上的实验表明,与固定结构神经网络控制器、PID和模型预测控制等已有控制方法相比,DADNNC方法具有更高的控制精度和更强的适应能力.
- 张伟张伟乔俊飞
- 关键词:溶解氧污水处理过程
- Q学习算法在RoboCup带球中的应用被引量:4
- 2005年
- 机器人世界杯足球锦标赛(RoboCup)是全球影响力最大的机器人足球比赛之一,而仿真组比赛是其重要的组成部分。鉴于带球技术在仿真组比赛中的重要性,我们将Q学习算法应用于带球技术训练中,使智能体本身具有学习和适应能力,能够自己从环境中获取知识。本文描述了应用Q学习算法在特定场景中进行1vs.1带球技术训练的方法和实验过程,并将训练方法应用于实际球队的训练之中进行了验证。
- 张家旺韩光胜张伟
- 关键词:带球
- 基于性能协调的溶解氧复合控制方法被引量:4
- 2014年
- 针对常规比例积分微分(proportion-integral-derivative,PID)控制存在精度不高,在线自适应差的缺点,提出了一种在线PID-TS模糊神经网络复合控制方法.该方法利用TS模糊神经网络的自学习能力提高溶解氧的控制精度,并通过构造的性能协调因子在线调整两者权重.将提出的控制方法应用于国际基准仿真平台.结果表明:所提方法能有效控制污水中的溶解氧参数,与常规PID和BP(back-propagation)神经网络控制器相比,该方法具有更优的动态性能.
- 张伟张伟乔俊飞
- 关键词:溶解氧复合控制
- 多智能体强化学习在机器人足球比赛中的应用
- 多智能体系统是分布式人工智能系统的一个特殊类型.以基本的强化学习为基础,提出特殊状态下多智能体强化学习方法,把比赛场地划分不同的区域,依据球所在区域进行不同的动作选择,从而减少状态动作空间.将此方法应用于机器人足球比赛中...
- 张伟李建更张家旺
- 关键词:多智能体系统机器人足球比赛
- 文献传递
- 神经网络的污水处理过程多目标优化控制方法被引量:8
- 2016年
- 针对污水处理过程能耗过高问题,提出一种基于神经网络的动态多目标优化控制方法。该方法对污水处理过程中的曝气能耗和泵送能耗同时优化,通过NSGA-II进化算法实现溶解氧浓度和硝态氮浓度设定值的动态寻优,由PID控制实现底层跟踪。采用神经网络在线建模方法构造污水处理过程多目标优化模型,解决了优化变量与性能指标间没有精确数学描述的问题。基于国际基准仿真平台BSM1的实验表明,与PID控制、单目标优化控制方法相比,多目标优化控制在保证出水水质达标的前提下可以获得更优的节能效果。
- 张伟张伟
- 关键词:多目标优化神经网络能量消耗污水处理
- 全文增补中
- 多智能体强化学习在机器人足球比赛中的应用
- 多智能体系统是分布式人工智能系统的一个特殊类型.以基本的强化学习为基础,提出特殊状态下多智能体强化学习方法,把比赛场地划分不同的区域,依据球所在区域进行不同的动作选择,从而减少状态动作空间.将此方法应用于机器人足球比赛中...
- 张伟李建更张家旺
- 关键词:多智能体系统机器人足球比赛
- 文献传递
- C5.0算法在RoboCup传球训练中的应用研究被引量:14
- 2006年
- 针对于RoboCup比赛中出现的传球精度不够准确的问题,通过对决策树学习方法的探讨,该文提出了一种用于Robo-Cup仿真球队中Agent学习传球技能的一种决策树方法。将C5.0即ID3的改进算法应用到Agent传球能力的训练中,它使得Agent能够根据场上的具体情况,把球成功传给队友。Agent在得到球的控制权之后,首先确定传球成功率最大的球员,然后并不直接执行传球的动作,而是调整Agent自身的准备动作以达到传球的最佳状态,最后进行传球的行为。仿真结果表明,该方法有效地提高了Agent的传球能力。
- 张家旺韩光胜张伟
- 关键词:决策树传球