肖建鹏
- 作品数:6 被引量:12H指数:3
- 供职机构:解放军信息工程大学电子技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主动学习的Web信息抽取
- 本文针对现有Web信息抽取方法的不足,提出一种基于支持向量机的主动学习的Web信息抽取方法。首先将HTML文档解析成DOM树,再以DOM树中的信息片断作为基本单元将其所具有的四类特征向量化,最后通过基于支持向量机的主动学...
- 谭鹏许张来顺肖建鹏
- 关键词:WEB网页信息抽取支持向量机
- 基于SVM的Web信息抽取技术研究
- 随着Internet的迅猛发展,Web已然变成全球化的信息中心,如何快速、准确的从中获取所需信息显得越来越迫切。Web信息抽取技术就是在这样的情况下应运而生的。Web信息抽取技术不但可以从网络中获取用户所需信息,而且还可...
- 肖建鹏
- 关键词:WEB信息抽取直推式支持向量机XML
- 文献传递
- 直推式支持向量机在Web信息抽取中的应用研究被引量:6
- 2009年
- 直推式支持向量机是一种直接从已知样本出发对特定的未知样本进行识别的分类技术。在分析直推式支持向量机分类原理的基础上,提出一种基于直推式支持向量机的Web信息抽取方法,直接从分类的角度抽取Web信息。只需要提供少量标记样本就可以实现对大量未标注样本的分类标注,从而以分类的方式完成Web数据抽取任务。实验结果表明,使用这种方法进行Web信息抽取是有效性。
- 肖建鹏张来顺任星
- 关键词:WEB信息抽取直推式支持向量机
- 一种基于拦截器的J2EE容忍入侵框架的研究与设计
- 2008年
- 本文给出了一种基于拦截器的容忍入侵框架的设计,该框架设计包括容侵服务提供者设计和容忍入侵服务管理者的设计,目的是将服务提供与服务管理分离,实现了容忍入侵服务的可集成性、可扩展性。
- 彭亮张来顺肖建鹏白鑫
- 关键词:J2EE容忍入侵拦截器类加载器
- 基于后缀树的Web论坛信息抽取被引量:3
- 2008年
- 针对现有网上论坛信息抽取的不足,提出一种基于后缀树的论坛信息抽取方法。将标准化后的HTML文档转换为后缀树,查找出其中的重复模式并产生分装器,将分装器转换为NFA(非确定型有穷自动机)达到抽取论坛信息的目的。该方法运用构造后缀树的技术来抽取论坛信息,较好地解决了现有的抽取方法准确性较差、通用性不强的问题。实验结果表明,该方法具有较高的准确性和实用性。
- 肖建鹏张来顺任星宋晓光
- 关键词:信息抽取后缀树
- 基于增量学习的直推式支持向量机算法被引量:3
- 2008年
- 针对直推式支持向量机在进行大数据量分类时出现精度低、学习速度慢和回溯式学习多的问题,提出了一种基于增量学习的直推式支持向量机分类算法,将增量学习引入直推式支持向量机,使其在训练过程中仅保留有用样本而抛弃无用样本,从而减少学习时间,提高分类速度。实验结果表明,该算法具有较快的分类速度和较高的分类精度。
- 肖建鹏张来顺任星
- 关键词:支持向量机直推式学习