您的位置: 专家智库 > >

王一洲

作品数:11 被引量:0H指数:0
供职机构:福州大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇专利
  • 1篇学位论文

领域

  • 6篇自动化与计算...

主题

  • 6篇网页
  • 5篇包装器
  • 4篇自动生成
  • 4篇结构化数据
  • 2篇代码
  • 2篇导航
  • 2篇导航栏
  • 2篇信息发布
  • 2篇信息提取
  • 2篇信息提取方法
  • 2篇有向图
  • 2篇源数据
  • 2篇上传
  • 2篇数据集
  • 2篇数据接口
  • 2篇数据提取
  • 2篇自动生成方法
  • 2篇网页代码
  • 2篇网页结构
  • 2篇网页聚类

机构

  • 11篇福州大学

作者

  • 11篇王一洲
  • 10篇陈星
  • 3篇戴远飞
  • 2篇林志恒
  • 1篇郭文忠
  • 1篇林晓红

年份

  • 1篇2021
  • 1篇2020
  • 2篇2019
  • 2篇2018
  • 4篇2017
  • 1篇2016
11 条 记 录,以下是 1-10
排序方式:
面向BS架构的数据接口生成方法
本发明涉及一种面向BS架构的数据接口生成方法。该方法由三个部分组成:源数据处理,模型到图的转化,API封装;其中,源数据处理是从用户上传的HTTP请求集合中提取出关键信息,建立HTTP请求模型,并对集合进行分类;数据到有...
陈星林志恒王一洲
文献传递
一种基于网页聚类的正文信息提取方法
本发明涉及一种基于网页聚类的正文信息提取方法,将网站级别与网页级别相结合,通过网站级别的网页聚类来实现平滑网页之间的差距,再利用网页分块和节点的密度特征来确定该类网页正文的位置,并提取相应的抽取规则。本发明可以有效的提高...
陈星王一洲戴远飞
文献传递
面向BS架构的数据接口生成方法
本发明涉及一种面向BS架构的数据接口生成方法。该方法由三个部分组成:源数据处理,模型到图的转化,API封装;其中,源数据处理是从用户上传的HTTP请求集合中提取出关键信息,建立HTTP请求模型,并对集合进行分类;数据到有...
陈星林志恒王一洲
面向信息发布类网站的移动版自动生成的方法
本发明涉及一种面向信息发布类网站的移动版自动生成的方法,其包括以下步骤:利用爬虫技术,根据用户指定转化网站的入口地址,爬取该网站中的所有网页;对爬取网站中的所有网页进行分析,针对每一个网页提取导航栏中的数据和网页中的主要...
陈星王一洲戴远飞
网页结构化数据的信息提取方法
本发明公开了一种网页结构化数据的信息提取方法,首先对网页代码进行预处理,去除噪音信息,根据网页布局标签作为节点,通过布局标签的嵌套关系和层次关系,构造其DOM树,并存入List,通过判断分支是否相同对DOM树进行剪枝,形...
陈星张佳俊王一洲
网页数据的自动化抽取技术
随着Web技术的迅猛发展,使得Web网页成为信息发布的主要载体也是人们获取信息的主要渠道之一,大量的数据以Web网页形式存储在互联网上,因为HTML编码风格各异,使得人们无法直接从Web网页中抽取出结构化数据,造成了资源...
王一洲
关键词:WEB数据抽取网页聚类节点密度包装器
文献传递
面向多租户的SaaS舆情监控系统及方法
本发明涉及一种面向多租户的SaaS舆情监控系统及方法,包括数据采集与存储模块、基于并行处理框架的数据分析模块;所述数据采集与存储模块是在Nutch开源框架的基础上,对指定的包括新闻、博客、论坛在内的网站进行实时监控,发现...
郭文忠林晓红陈星兰兴土王一洲
文献传递
基于DOM树抽象的包装器自动生成方法
本发明涉及一种基于DOM树抽象的包装器自动生成方法。包装器生成阶段:用户输入网页集合,得到DOM树集合;而后,对DOM树进行合并,遍历DOM树对相同标签的子节点进行合并,并且针对每个节点进行路径特征标注,最终将DOM树集...
陈星张佳俊王一洲
面向信息发布类网站的移动版自动生成的方法
本发明涉及一种面向信息发布类网站的移动版自动生成的方法,其包括以下步骤:利用爬虫技术,根据用户指定转化网站的入口地址,爬取该网站中的所有网页;对爬取网站中的所有网页进行分析,针对每一个网页提取导航栏中的数据和网页中的主要...
陈星王一洲戴远飞
文献传递
网页结构化数据的信息提取方法
本发明公开了一种网页结构化数据的信息提取方法,首先对网页代码进行预处理,去除噪音信息,根据网页布局标签作为节点,通过布局标签的嵌套关系和层次关系,构造其DOM树,并存入List,通过判断分支是否相同对DOM树进行剪枝,形...
陈星张佳俊王一洲
文献传递
共2页<12>
聚类工具0