中央高校基本科研业务费专项资金(2012ZM0083)
- 作品数:2 被引量:5H指数:2
- 相关作者:黄翰李英胡廉民郝志峰张宇山更多>>
- 相关机构:华南理工大学乐山师范学院广东工业大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 二元进化策略的全局收敛与早熟收敛被引量:2
- 2014年
- 离散状态马尔科夫链理论已经广泛应用于进化算法的收敛性和时间复杂度分析中,而连续状态马尔科夫过程理论由于需要用到比较高深的数学工具,应用还不多.引入连续状态马尔科夫过程理论,以测度论为工具,借助公理化的条件数学期望理论推导出关键的转移概率的计算公式,分析了以(1+1)ES为代表的连续型进化算法的收敛性,从理论上证明若采用常变异算子,包括正态分布、柯西分布在内的一大类常用变异分布可使(1+1)ES依概率收敛到全局最优解的ε-邻域;构造了一个带适应值平台的函数,从理论上证明某些自适应变异算子即使以正态分布、柯西分布为变异分布也会导致(1+1)ES陷入早熟收敛.通过仿真实验验证了理论分析.结果表明自适应调整机制并非总是有效的.
- 张宇山郝志峰黄翰
- 关键词:进化算法进化策略收敛性
- 基于分层结构保留的增量网络爬虫算法被引量:3
- 2013年
- 为了提高目前爬虫算法抓取结果的有效性,提出了一种旨在获取有效信息的改进网络爬虫算法,主要设计了信息的分层结构保留策略和URL过滤模式。在改进算法中,网络资源定位符被分层存储,在保留信息全部拓扑关系的基础上,将交错复杂的URL网络系统从一个图结构变为一个层次分明的树结构。在执行结构模式下,实现了增量爬虫算法。仿真实验以实际网站的BBS为测试数据,结果表明,改进算法比现有网络爬虫算法在爬行速度、下载效率与信息有效性等方面有较大的优势。因此,分层结构策略与URL过滤模式可以在增加少量计算时间的前提下极大提高爬虫抓取页面的有效性。
- 胡廉民张泽斌徐威迪黄翰李英
- 关键词:网络爬虫