韩伟
- 作品数:55 被引量:194H指数:8
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划江苏省“青蓝工程”基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电子电信更多>>
- 基于模糊强化学习的电子市场动态定价
- 本文以电子市场智能定价问题为研究背景,提出了基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该...
- 韩伟
- 关键词:电子市场模糊推理
- 基于情节序列训练的电子市场智能定价算法被引量:3
- 2007年
- 以B2B电子市场中卖方agent的智能定价问题为应用背景,在库诺特短视调整基础上,应用Q学习算法,提出了基于情节序列训练的学习方法,将纯粹以结果为反馈的强化学习方法和以推理为目标的慎思过程结合起来,提高了算法的在线学习性能。仿真实验验证了算法的有效性,为推向实际应用奠定了基础。
- 韩伟
- 关键词:智能AGENT电子市场
- 电子市场排污权交易的多智能体协商方法
- 2011年
- 为了平衡经济发展和污染治理之间的矛盾,将地理位置相对集中的排污企业建立专业电子市场用于排污权的交易。在控制排污总量的前提下,通过合理安排生产来最大化排污企业的收益。基于市场交互机制,给出了一个多智能体协商框架。每个智能体代表一家企业参与协商,在不暴露企业商业信息前提下,在当前污染物价格下通过规划方法计算污染物需求量。市场端接收每种污染物需求量并计算每种污染物价格,然后作为公共信息加以发布。仿真实验表明,相对于按比例单独缩减排污量,协商结果使得污染企业的个体收益都有所提高,从而增大了社会收益。
- 韩伟宋柱芹
- 关键词:多智能体系统电子市场
- 带贯通约束的不规则排样分阶构造算法被引量:2
- 2012年
- 针对玻璃排样问题,首次研究带贯通性约束的不规则凸多边形的Bin Packing问题.提出一种针对图形组合进行优化的分阶构造算法.该算法能够隐式实现贯通约束,并利用各阶种群之间清晰的组合关系,将多个多边形的形态优化问题转化为一个结构化的多步决策问题,提高了原片利用率.为了控制新组合图形的形状,构造过程引入变动的形状权重,并给出散列函数来控制形状权重的变化.分别用中英双方玻璃厂订单数据进行测试,显示本文算法比二步法等方法平均利用率有较大提高.
- 韩伟马福民
- 关键词:动态规划
- 基于黑板模型的多智能体合作学习被引量:11
- 2007年
- Q学习算法要求智能体无限遍历每个状态-动作转换,因此在涉及状态-动作空间非常大的应用问题时,导致收敛速度非常慢。借助多智能体的合作学习,智能体之间基于黑板模型的方法通过开关函数相互协调合作,可以更快地定位那些有效的状态-动作转换,避免了无效的更新,从而以较小的学习代价加快了Q表的收敛速度。
- 韩伟韩忠愿
- 关键词:多智能体系统黑板模型
- 基于模糊约束规划的自动协商被引量:2
- 2008年
- 给出了一个基于模糊约束规划模型的自动协商系统。建立了模糊约束规划模型并利用模糊模拟、神经网络和遗传算法给出了求解Pareto最优解的混合智能算法;协商过程中卖方智能体根据神经网络拟合的效用函数并运行混合智能体算法得到当前协商步的Pareto最优解,避免了对大型商品数据库的反复搜索,为系统推向实际应用奠定了基础;协商模型仿真实验表明了协商系统返回的解与实际调查得到的用户偏好相一致。
- 韩伟
- 关键词:自动协商智能体
- 基于公共知识的电子市场定价算法被引量:2
- 2005年
- 研究了电子市场定价博弈中公共知识的作用,通过简单地改变市场需求函数和市场分配函数,使卖方Agent获得了多Agent作用下的不断改变着的环境知识,而不再是关于市场需求的个体知识。仿真实验表明,通过获得关于市场需求的公共知识,卖方Agent可以协调彼此的价格行为,在合作还是竞争问题上表现出更长远的群体智能行为,从而提高了市场配置资源的有效性。
- 韩伟王云王成道白治江
- 关键词:智能AGENT电子市场博弈论
- 网格中基于本体的服务和知识发现服务被引量:6
- 2005年
- 管理和利用由网格应用和网格操作所产生的海量数据,以及对网格资源和网格服务的智能使用是新一代网格的两个主要特征。为此,新一代网格应当具有被称为网格智能的知识发现和知识管理的功能。本体和元数据是实现网格智能的两个基本要素。此外,语义建模是网格支持高层服务和动态服务发现与组成的必要条件。本文对这些新兴服务进行了描述,并在知识网格上实现了一个基于本体的知识发现服务。
- 白治江韩伟王成道
- 关键词:知识发现网格应用网格服务网格资源语义建模知识网格
- 基于智能代理体协商的城市污染治理被引量:1
- 2004年
- 采用基于agent协商的方法,讨论了大城市污染治理方案.对于完全信息环境,给出了求解治理方案的启发式搜索算法;对于不完全信息环境,引入了基于市场机制的求解算法.
- 林华韩伟
- 关键词:协商多AGENT系统博弈论污染治理
- 基于模糊推理的多智能体强化学习被引量:1
- 2011年
- 以电子市场智能定价问题为研究背景,提出基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该方法有效融合应用背景的领域知识,充分利用样本信息并降低学习空间维数,从而增强在线学习性能。在电子市场定价的对比实验中,智能体无论在合作还是在竞争的问题上都表现出较为长远的智能行为,提高了平均定价收益。
- 韩伟鲁霜
- 关键词:模糊推理电子市场