您的位置: 专家智库 > >

张京阳

作品数:1 被引量:2H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇转载
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型

机构

  • 1篇北京理工大学
  • 1篇中国科学院
  • 1篇首都师范大学

作者

  • 1篇刘金刚
  • 1篇张华平
  • 1篇张京阳

传媒

  • 1篇计算机应用

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
基于聚团词的大规模文本转载识别算法被引量:2
2010年
文本转载识别是指从大规模文本库中检测出内容相同或相近的文档集合,在热门话题检测、搜索引擎结果凝练、学术文章抄袭识别等诸多应用上,存在普遍的需求。为适应网络文本转载形式的日趋多样化,并进一步提升实用系统效率,对各种文本特征及比较算法进行了研究分析,提出了基于聚团词的大规模文本转载识别算法,即:依据词语的分布属性,识别并提取高得分聚团词用于表征文本,之后通过对文本集进行扩展线性比较与多维比较两次操作,最终筛选出转载识别结果。对比实验表明:该算法在准确率、召回率与效率上有较高的综合性能。
张京阳张华平刘金刚
关键词:向量空间模型
共1页<1>
聚类工具0