搜索到827篇“ WEB数据抽取“的相关文章
基于模板与视觉特征的Web数据抽取技术研究
随着Web数据库的不断增长,通过查询接口访问获得以HTML页面形式动态呈现的Web资源逐渐成为信息获取的主要手段,有效获取并集成分布在Web上的各数据库资源具有重要的现实意义与广阔的应用前景。本文以Web数据库资源获取与...
吴克介
关键词:WEB数据抽取语义数据融合
文献传递
面向开源社区的Web数据抽取方法研究
2017年
由协同开发社区和知识分享社区所组成的开源社区中汇集海量的开源数据资源。如何从数量众多,页面结构各异的开源社区中准确、高效地获取这些数据是对开源数据资源进行全面分析,深度关联的前提。阐述面向开源社区的Web数据抽取方法研究过程,实现对开源社区中Web数据的精确抽取
张方尹刚王涛余跃
关键词:开源社区WEB数据抽取
面向开源社区的Web数据抽取技术研究
互联网技术的飞速发展加快了计算机软件产业变革的进程,开源运动在世界范围内如火如荼的进行着。从开发者,到业界相关组织乃至全球知名的IT巨头,纷纷加入到这场开源运动中来,成为开源软件的忠实拥趸。开源意味着软件开发过程从封闭走...
张方
关键词:开源社区WEB数据抽取正则表达式XPATH
基于混合属性的Deep Web数据抽取算法
由于Web查询接口的限制,用户很难获取隐藏Web数据库的所有数据。基于隐藏Web数据库中的混合属性构造查询分解空间,采用深度优先遍历,提出一种将基于分类属性的改进启发式切片覆盖算法与基于数值属性的多维动态划分算法相结合的...
尚霞李贵韩子扬李征宇孙平
文献传递
基于领域模式的Web数据抽取与集成系统研究与实现
2016年
提供面向领域的信息增值服务是Web数据挖掘的目标之一,面向领域的Web数据抽取与集成是提供领域信息增值服务的基础,也是Web数据挖掘领域的一个主要研究方向,结合领域需求,本文提出一种面向领域的Web数据抽取与集成架构,在给出Web数据模型与Web数据模式、领域数据模型和领域数据模式等相关概念基础上,提出Web数据模式与领域数据模式的映射方法和数据层次上的集成方法,用于解决集成过程中的模式层次和数据层次的冲突问题,并讨论了web数据抽取和领域增值服务的实现方法。结合实际需求开发了房地产信息平台及综合应用系统,验证了模型和算法的有效性。
李贵耿传杰韩子扬李征宇
基于云计算面向网络舆情的Deep Web数据抽取关键技术研究被引量:1
2016年
就当前舆情信息数据的海量性和数据源展现的不可预见性,对Html页面进行降噪、子树构建,通过相似度计算和舆情简易本题库的引入完成数据块识别和数据记录集抽取,最后以Hadoop平台为实验环境,对抽取出的算法进行实验,实验表明该算法在舆情数据挖掘中,对抽取规则的自动提取具有一定的参考价值。
陈巧丁卫泽施佺
关键词:数据抽取HADOOP舆情
自适应Web数据抽取技术研究
自20世纪90年代以来Internet技术得到了高速和深入发展,互联网上的信息资源呈现爆炸式增长,当今的互联网已成为一个巨大而开放的知识库。但是Web页面中的信息格式复杂多样,除了正文之外还包含导航栏、广告链接、相关阅读...
陈晓雷
关键词:视觉特征正文抽取数据抽取
文献传递
Web数据抽取技术的研究和探讨被引量:1
2015年
随着电子商务的迅猛发展,网络购物受到了大多数人的青睐,怎么样才能从众多的购物网站中找到自己需要的产品,是数据抽取技术的焦点。由于Web数据具有半结构化的特征,使得数据抽取技术更加复杂。如何发展Web数据抽取技术要充分利用网络资源,发挥Web数据抽取潜力。
仇岗杨琴
关键词:WEB数据抽取XPATH信息抽取
基于视觉信息和树匹配的Deep Web数据抽取问题的研究
随着网络技术的快速发展和普及,Web已经成为一个巨大的信息源集合,拥有着海量信息。Deep Web是由Web中可在线访问的数据库构成,具有信息量大、结构化程度高、领域覆盖全面等特点,Deep Web对以分析挖掘为目标的应...
凡思武
关键词:树匹配
文献传递
基于视觉信息和树匹配的Deep Web数据抽取问题研究
随着网络技术的快速发展和普及,Web已经成为一个巨大的信息源集合,拥有着海量信息。Deep Web是由Web中可在线访问的数据库构成,具有信息量大、结构化程度高、领域覆盖全面等特点,Deep Web对以分析挖掘为目标的应...
凡思武
关键词:网络数据视觉信息
文献传递

相关作者

李贵
作品数:65被引量:68H指数:4
供职机构:沈阳建筑大学信息与控制工程学院
研究主题:WEB WEB数据抽取 推荐系统 数据抽取 结构化数据
韩子扬
作品数:62被引量:60H指数:4
供职机构:沈阳建筑大学
研究主题:推荐系统 WEB DEEP_WEB 数据抽取 WEB数据抽取
李征宇
作品数:84被引量:73H指数:4
供职机构:沈阳建筑大学
研究主题:推荐系统 WEB DEEP_WEB 数据抽取 数据转换
蔡益清
作品数:3被引量:0H指数:0
供职机构:山东大学
研究主题:WEB数据抽取 抽取方法 抽取 本地数据库 结构化数据
彭朝晖
作品数:48被引量:115H指数:7
供职机构:山东大学
研究主题:视频 数据库查询 关系数据库 WEB信息抽取 抽取