王允
- 作品数:4 被引量:33H指数:3
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 网络舆情态势分析模式研究被引量:17
- 2010年
- 利用军事领域中的战场态势分析与威胁估计思想研究了网络舆情态势分析与预警的基本原理;构建了适合计算机实现的网络舆情态势分析模式,并给出了相应的模式提取技术。实验结果表明,本文构建的网络舆情态势分析模式能够有效地表征和获取网络舆情态势,有助于更深层的分析网络舆情演变的规律,从而采用合适的引导措施。
- 李弼程林琛周杰王允
- 关键词:网络舆情预警
- 一种Web论坛信息抽取系统
- 本发明公开了一种Web论坛信息抽取系统,该系统包括如下模块:网页采集模块,用于根据用户指定的论坛站点和相应的版块自动下载论坛网页;网页解析模块,用于对网页内容进行清洗,形成网页的文档对象模型(DOM)以便信息抽取算法的实...
- 李弼程王允林琛郭志刚阎红灿
- 文献传递
- 网络舆情数据获取与话题分析技术研究
- 网络舆情数据获取与话题分析是网络舆情态势分析与预警中的关键技术,已成为智能信息处理领域的研究热点。该技术从互联网上自动获取大量舆情数据,从中检测出网络舆情话题并借助数据立方体模型对其进行多角度、深层次的挖掘分析,客观地反...
- 王允
- 关键词:网络舆情网络爬虫WEB信息抽取层次聚类数据立方体
- 文献传递
- 基于网页布局相似度的Web论坛数据抽取被引量:10
- 2010年
- Web论坛中蕴含着丰富的信息资源,充分利用这些信息资源依赖于论坛数据抽取技术。该文解决了从Web论坛抽取什么数据和如何抽取的问题,提出了一种基于网页布局相似度的Web论坛数据抽取方法,有效弥补了目前方法的自动化程度低,或准确率低的不足。该方法充分利用Web论坛网页布局结构上的特点,采用分级处理的方式,先识别出主题信息块、再利用待抽取数据的统计规律在主题信息块中完成抽取,整个过程不需要任何人工干预。实验结果表明,新方法对不同的BBS站点有很好的通用性,且具有较高的准确率和召回率。
- 王允李弼程林琛
- 关键词:计算机应用中文信息处理WEB论坛数据抽取相似度