您的位置: 专家智库 > >

国家科技支撑计划(2006BAH02A29)

作品数:2 被引量:15H指数:2
相关作者:陈竹敏陈军赵嫣马军雷景生更多>>
相关机构:山东大学更多>>
发文基金:国家科技支撑计划山东省博士后创新项目高等学校骨干教师资助计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇网页
  • 1篇信息检索
  • 1篇页面
  • 1篇页面分块
  • 1篇主题
  • 1篇网页分块
  • 1篇网页分析
  • 1篇网页净化
  • 1篇网页内容
  • 1篇文档
  • 1篇文档结构
  • 1篇相似度
  • 1篇相似度计算
  • 1篇分块
  • 1篇DSS

机构

  • 3篇山东大学

作者

  • 3篇陈竹敏
  • 2篇马军
  • 1篇雷景生
  • 1篇赵嫣
  • 1篇李连霞
  • 1篇陈军

传媒

  • 1篇模式识别与人...
  • 1篇山东大学学报...
  • 1篇第三届和谐人...

年份

  • 3篇2007
2 条 记 录,以下是 1-3
排序方式:
基于多特征的网页内容提取研究
网页内容提取对Web中的Hub型网页和主题型网页有不同的含义。对前者是找到该网页中非噪音内容的主要链接;对后者是发现描述网页主题内容的文本以及相关链接。网页内容提取的质量将直接影响到信息检索的查全率和查准率,以及对网页分...
李连霞马军陈竹敏
关键词:网页净化网页分析
文献传递
基于部分-整体匹配的文档结构相似度计算被引量:2
2007年
传统的计算数字文档之间的结构相似度(DSS)的方法是基于树的编辑距离或 Fourier 变换.本文提出利用查询问题的结构化描述树 Q 与文档元数据描述树 T 之间的部分-整体匹配求解 DSS.给出用字符串表示有向标记树的方法,并把上述树之间的相似度计算转化为对应 Q 和 T 的字符串表示之间的匹配计算,从而导出高效的DSS 算法.实验表明,对给定的结构化查询,本文算法在查全率和查准率上优于树编辑距离算法.
马军陈竹敏赵嫣雷景生
关键词:信息检索
基于网页分块的Shark-Search算法被引量:13
2007年
Shark-Search算法是一个经典的主题爬取算法.针对该算法在爬取噪音链接较多的Web页面时性能并不理想的问题,提出了基于网页分块的Shark-Search算法,该算法从页面、块、链接的多种粒度来更加有效的进行链接的选择与过滤.实验证明,改进的Shark-Search算法比传统的Shark-Search算法在查准率和信息量总和上有了质的提高.
陈军陈竹敏
关键词:页面分块
共1页<1>
聚类工具0