您的位置: 专家智库 > >

秦家虎

作品数:8 被引量:4H指数:2
供职机构:中国科学技术大学信息科学技术学院自动化系更多>>
发文基金:国家自然科学基金霍英东青年教师基金中央高校基本科研业务费专项资金更多>>
相关领域:理学自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 2篇学位论文

领域

  • 6篇理学
  • 3篇自动化与计算...

主题

  • 3篇英文
  • 2篇智能体
  • 2篇球面
  • 2篇多智能
  • 2篇多智能体
  • 1篇学习范式
  • 1篇学习算法
  • 1篇一致性
  • 1篇异步
  • 1篇异步网络
  • 1篇因果推理
  • 1篇执行器
  • 1篇智能体系统
  • 1篇认知图
  • 1篇软计算
  • 1篇三维流形
  • 1篇纽结
  • 1篇主题模型
  • 1篇最优控制
  • 1篇网络

机构

  • 4篇中国科学技术...
  • 3篇哈尔滨工业大...
  • 1篇北京大学
  • 1篇电子科技大学
  • 1篇哈尔滨商业大...
  • 1篇北京交通大学
  • 1篇黑龙江大学

作者

  • 8篇秦家虎
  • 1篇王龙
  • 1篇邵晋梁
  • 1篇雷逢春
  • 1篇王树忠
  • 1篇马麒超
  • 1篇张英俊

传媒

  • 2篇黑龙江大学自...
  • 2篇自动化学报
  • 1篇系统科学与数...
  • 1篇中国科学:信...

年份

  • 1篇2024
  • 1篇2022
  • 1篇2021
  • 1篇2014
  • 1篇2012
  • 1篇2007
  • 1篇2006
  • 1篇2005
8 条 记 录,以下是 1-8
排序方式:
线性二次二人Stackelberg博弈均衡点求解:一种Q学习方法
2022年
近年来,Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
李曼秦家虎王龙
关键词:最优控制Q学习
空间图有纽结的正则投射(英文)
2007年
Taniyam在文[5]中构造了一个平面图有Tn的正则投射,其中平面图是由正五边形所构造的。推广了Taniyam的结果,证明了由任意奇数边(≥5)正多边形所构造的平面图都会有一个有Tn的正则投射,另外,对于这些平面图,还构造了一种新的有Tn的正则投射。
秦家虎王树忠
图拉普拉斯矩阵引出的对角稳定矩阵的讨论(英文)
2014年
如果有向图G含有生成树,并且M由G的闭强连通分支外节点构成拓扑所对应的L的一个子矩阵,其中L是图G的拉普拉斯矩阵,那么矩阵M是对角稳定的.在多智能体系统协同一致算法的设计中,常常需要寻找正定对角矩阵E,使得-EM-M^TE<0.结合前期研究成果,文章旨在给出一种新的分布式算法来构造矩阵E,该算法只需要关于多智能体系统网络拓扑图G的局部结构信息.
马麒超秦家虎邵晋梁
基于扩散方法的分布式随机变分推断算法被引量:2
2021年
分布式网络上的聚类、估计或推断具有广泛的应用,因此引起了许多关注.针对已有的分布式变分贝叶斯(Variational Bayesian,VB)算法效率低,可扩展性差的问题,本文借用扩散方法提出了一种新的分布式随机变分推断(Stochastic variational inference,SVI)算法,其中我们选择自然梯度法进行参数本地更新并选择对称双随机矩阵作为节点间参数融合的系数矩阵.此外,我们还为所提出的分布式SVI算法提出了一种对异步网络的适应机制.最后,我们在伯努利混合模型(Bernoulli mixture model,BMM)和隐含狄利克雷分布(Latent Dirichlet allocation,LDA)模型上测试所提出的分布式SVI算法的可行性,实验结果显示其在许多方面的性能优于集中式SVI算法.
付维明秦家虎朱英达
关键词:分布式算法异步网络主题模型
一类二阶多智能体系统一致性问题研究
近年来,多智能体网络系统的协同控制吸引了来自工程与科学等不同领域研究者的广泛关注,主要归因于多智能体系统控制在诸如分布式传感网络、无人驾驶飞行器协作控制、队形控制、通信网络拥塞控制、flocking以及swarming模...
秦家虎
关键词:多智能体协同控制
文献传递
关于3-球面中图的抽象平面性(英文)
2006年
令Γ是S3中的一个抽象平面图,Γ′是在图Γ上加上有限条边后所得到的图.主要考虑图Γ′的抽象平面性,并且给出了Γ′是抽象平面图的一个充要条件,另外还从平坦嵌入的角度对平面图做了一些讨论.
秦家虎雷逢春
模糊认知图学习算法及应用综述被引量:2
2024年
模糊认知图(Fuzzy cognitive map, FCM)是建立在认知图和模糊集理论上的一类代表性的软计算理论,兼具神经网络和模糊决策两者的优势,已成功地应用于复杂系统建模和时间序列分析等众多领域.学习权重矩阵是基于模糊认知图建模的首要任务,是模糊认知图研究领域的焦点.针对这一核心问题,首先,全面综述模糊认知图的基本理论框架,系统地总结近年来模糊认知图的拓展模型.其次,归纳、总结和分析模糊认知图学习算法的最新研究进展,对学习算法进行重新定义和划分,深度阐述各类学习算法的时间复杂度和优缺点.然后,对比分析各类学习算法在不同科学领域的应用特点以及现有的模糊认知图建模软件工具.最后,讨论学习算法未来潜在的研究方向和发展趋势.
刘晓倩张英俊秦家虎秦家虎梁伟玲李宗溪
关键词:模糊认知图学习范式因果推理软计算复杂系统建模
3-球面中图的抽象平面性
早在1930年,Kuratowski定理<'[11]>给出了这样一个判定图的抽象平面性的结论:一个图如果是抽象平面的当且仅当它不包含同构于K<,5>或者K<,3,3>的一个子重分的子图.M.Scharlemann和A.T...
秦家虎
关键词:三维流形
文献传递
共1页<1>
聚类工具0