陈智斌 作品数:23 被引量:49 H指数:4 供职机构: 昆明理工大学理学院 更多>> 发文基金: 国家自然科学基金 云南省自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 电子电信 更多>>
强化学习求解组合最优化问题的研究综述 被引量:14 2022年 组合最优化问题(COP)的求解方法已经渗透到人工智能、运筹学等众多领域。随着数据规模的不断增大、问题更新速度的变快,运用传统方法求解COP问题在速度、精度、泛化能力等方面受到很大冲击。近年来,强化学习(RL)在无人驾驶、工业自动化等领域的广泛应用,显示出强大的决策力和学习能力,故而诸多研究者尝试使用RL求解COP问题,为求解此类问题提供了一种全新的方法。首先简要梳理常见的COP问题及其RL的基本原理;其次阐述RL求解COP问题的难点,分析RL应用于组合最优化(CO)领域的优势,对RL与COP问题结合的原理进行研究;然后总结近年来采用RL求解COP问题的理论方法和应用研究,对各类代表性研究所解决COP问题的关键要点、算法逻辑、优化效果进行对比分析,以突出RL模型的优越性,并对不同方法的局限性及其使用场景进行归纳总结;最后提出了四个RL求解COP问题的潜在研究方向。 王扬 陈智斌 吴兆蕊 高远全变差噪声消除问题的半光滑牛顿法 被引量:10 2017年 为了达到全变差噪声消除的图像去噪目的,将去噪问题转换为优化问题。采用了结合广义最小残差法的半光滑牛顿法来解决相关优化问题,求解非对称线性方程组,进行了理论分析和实验验证,取得了将该方法与其它方法应用于1维信号、2维图像去噪实验的大量可行数据。结果表明,结合广义最小残差法的半光滑牛顿法的收敛速度比结合预处理共轭梯度法的半光滑牛顿法和交替方向乘子法更快,而且能够有效地消除噪声。 王满 文有为 陈智斌关键词:图像处理 全变差 深度混合型邻域搜索模型求解CVRP问题 2023年 邻域搜索算法的关键是邻域结构的选择,但每次迭代搜索的时间较长,缺少在解空间内自主搜索的能力.利用深度强化学习(DRL)模型对邻域搜索算法进行改进,设计了一个新的深度混合型邻域搜索(DHNS)模型来求解带容量的车辆路径问题(CVRP).首先,利用贪婪算法为DRL模型提供初始解;其次,采用指针网络以及Transformer混合编码,利用不同网络的优势,深层次地提取节点特征信息;最后,将修复算子的修复过程转至DHNS模型,自动完成邻域搜索修复解的过程,扩大解空间的自主搜索能力.同时,针对混合编码中复杂传输机制以及解码输出误导性信息的问题,进一步在编码和解码过程中添加AOA(Attention on Attention)机制.AOA负责筛选有价值的信息,过滤不相关或误导性信息,有效刻画了注意力结果和查询之间的相关性,并对节点间的关系进行建模.实验结果表明,DHNS模型在100规模CVRP的优化效果上,优于现有DRL模型和部分传统算法.采用CVRPlib数据集中的算例对该算法的效能进行验证,结果表明,采用DHNS模型能够极大地提升路径问题的优化效能. 杨笑笑 陈智斌关键词:混合模型 二阶广义总变分JPEG2000核磁共振图像解码算法 2021年 针对低比特JPEG2000核磁共振图像中的压缩痕迹问题,提出一种二阶广义总变分JPEG2000解码后处理方法。通过消除总变分图像分段连续的假设,得到一个二阶广义总变分JPEG2000解码模型,利用原对偶算法求解所提出的解码模型得到一个迭代解码算法,对两幅核磁共振图像进行实验仿真。在SNR值、视觉效果等方面进行比较,二阶广义总变分解码效果优于传统总变分解码图像。 肖孝军 陈智斌关键词:JPEG2000 核磁共振图像 基于总变分JPEG2000核磁共振图像解码算法 被引量:1 2021年 针对低比特JPEG2000图像因压缩过程中产生的压缩痕迹问题,提出一种总变分JPEG2000解码算法。首先通过分析JPEG2000压缩的量化噪声近似地服从高斯分布,得到一个总变分ROF解码模型。其次利用原对偶算法求解所提出的ROF模型得到一个最优化解码迭代方案。最后对两幅核磁共振图像进行实验仿真,通过与高斯滤波、中值滤波方法在SNR值、视觉效果等方面进行比较,验证了本文方法去除压缩痕迹方面的有效性。 肖孝军 陈智斌关键词:JPEG2000 总变分 核磁共振图像 一种求解CVRP的动态图转换模型 被引量:1 2023年 带容量的车辆路径问题是组合最优化问题中的经典问题,多年以来一直被反复研究。最近,Transformer已经成为解决车辆路径问题的主流深度学习架构。然而,由于一个实例在模型不同构造步骤中会发生改变,相应的节点特征也需要更新,传统位置编码方法不适用于提取动态优化问题的位置信息。因此,现有方法在提高学习效率方面效果较差。以最小化路径长度为目标,提出一种动态图转换模型(DGTM)和动态位置编码(DPE)方法,并使用一种双重损失REINFORCE算法训练DGTM模型。此外,强化学习、图神经网络和Transformer架构相结合,提高了模型的训练效率,增强了神经网络对带约束路径问题信息的表征能力。实验结果表明,DGTM模型在此问题上的优化效果超越了目前基于深度强化学习的方法和部分传统算法,整体性能优于专业求解器的,且具有较好的泛化性能,为求解图上组合最优化问题提供了一种有效方法。 王扬 陈智斌基于交替迭代的均匀噪声消除算法 2018年 均匀噪声消除在数学上可以表示为一个带有无穷范数L∞约束的最小化问题,但无穷范数的不可微性会造成数值处理困难。为此,利用交替迭代算法求解该问题。引入一个凸示范性函数,根据变量分离的原则将原问题转化为2个具有解析解的最小化子问题。在此基础上,分别对不同的子问题进行求解,从而得到交替迭代公式。实验结果表明,对于一维逆热传导问题和二维逆源问题,交替迭代算法在精度和时间方面都有较好的性能提升效果。 刘欣 陈智斌 文有为基于总变分彩色图像恢复问题的有效算法 被引量:3 2017年 为改进彩色图像的恢复效果,针对数字图像在获取和传输过程中产生的图像退化问题,提出一种改进的总变分正则化模型.首先在最大后验估计的框架下,将彩色图像退化问题转化为总变分最小化问题;然后选择L1范数作为总变分模型的正则项;最后引入对偶变量,将上述问题转化为极大极小问题,利用一阶原对偶算法结合分块矩阵求逆的算法处理上述极大极小问题.实验结果表明,与交替迭代算法相比较,该算法对彩色图像进行去噪和去模糊的能力更优,实验验证了该算法的有效性和优越性. 张春鹏 文有为 陈智斌关键词:总变分 深度强化学习结合图注意力模型求解TSP问题 被引量:4 2022年 旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法. 王扬 陈智斌 杨笑笑 吴兆蕊关键词:旅行商问题 顶点覆盖约束下的同类机排序算法研究 2022年 给定m台同类机和n个工件,其中第j台机器的速度为sj,第i个工件的加工时间为pi并且在第j台机器上的负载为pi sj.构造一个顶点赋权无向图G=(V,E;w),其中图G的n个顶点代表这n个工件,顶点权重代表相应工件的加工时间.本文研究顶点覆盖约束下的同类机排序问题.该问题是两个组合最优化问题的组合问题,其目标为首先确定图G的一个顶点覆盖,即图的一个顶点子集,使得图中每一条边都至少存在一个顶点属于该子集;然后把这个子集所代表的相应工件集放到m台同类机上加工,使得最大完工时间最小.该问题是NPhard的.本文基于分层算法和LSPT算法设计一个(2+(m−1)·8m/Σ_(j=1^(m)8j))-近似算法,当所有机器的速度都相差不大时,该算法的近似效果较好. 嵇雯蕙 陈智斌关键词:顶点覆盖 同类机 排序