您的位置: 专家智库 > >

陈西安

作品数:3 被引量:3H指数:1
供职机构:电子科技大学更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇专利
  • 1篇学位论文

领域

  • 2篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇新闻
  • 3篇网页
  • 3篇标签
  • 2篇新闻网
  • 2篇新闻网页
  • 2篇源码
  • 2篇网页源码
  • 2篇网页正文
  • 2篇文本
  • 2篇文本抽取
  • 2篇抽取
  • 1篇新闻文本
  • 1篇智能WEB
  • 1篇模版
  • 1篇WEB网
  • 1篇WEB网页

机构

  • 3篇电子科技大学

作者

  • 3篇陈西安
  • 2篇鲁才
  • 2篇于富财
  • 2篇袁进
  • 2篇汪辉
  • 2篇申洲

年份

  • 1篇2019
  • 1篇2017
  • 1篇2016
3 条 记 录,以下是 1-3
排序方式:
基于文本标签特征挖掘的网页正文提取方法
本发明公开了一种基于文本标签特征挖掘的网页正文提取方法,包括以下步骤:S1、进行网页标签预处理及Html标签修复;S2、Html标签特征选择及提取;S3、标签特征聚类挖掘及正文簇选择;S4、正文簇内标签经验性调整;S5、...
于富财文友枥陈西安袁进吴轶铭申洲汪辉鲁才
文献传递
智能Web新闻文本采集方法研究
Web技术的革新使其逐渐成为网络内容生产和消费的平台,互联网上充斥着无数以网页形式存在的信息源,随着搜索引擎、网络监控和新闻推送等应用和研究工作的深入发展,使得互联网新闻文本采集成为国内外相关人士研究的热点。Web页面中...
陈西安
关键词:WEB网页
基于文本标签特征挖掘的网页正文提取方法
本发明公开了一种基于文本标签特征挖掘的网页正文提取方法,包括以下步骤:S1、进行网页标签预处理及Html标签修复;S2、Html标签特征选择及提取;S3、标签特征聚类挖掘及正文簇选择;S4、正文簇内标签经验性调整;S5、...
于富财文友枥陈西安袁进吴轶铭申洲汪辉鲁才
共1页<1>
聚类工具0