您的位置: 专家智库 > >

李艳梅

作品数:4 被引量:112H指数:2
供职机构:华北电力大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 3篇文本相似度
  • 3篇相似度
  • 2篇文本相似度计...
  • 2篇相似度计算
  • 2篇VSM
  • 1篇登录
  • 1篇多文档
  • 1篇多文档文摘
  • 1篇信息处理
  • 1篇语义WEB
  • 1篇中文
  • 1篇中文文本
  • 1篇中文文本聚类
  • 1篇未登录词
  • 1篇未登录词识别
  • 1篇文本
  • 1篇文本聚类
  • 1篇文档
  • 1篇文摘
  • 1篇向量

机构

  • 3篇华北电力大学
  • 1篇北京大学

作者

  • 3篇李艳梅
  • 2篇郭庆琳
  • 1篇唐琦

传媒

  • 1篇计算机应用研...
  • 1篇华北电力大学...

年份

  • 1篇2009
  • 1篇2008
  • 1篇2007
4 条 记 录,以下是 1-3
排序方式:
基于VSM的文本相似度计算的研究被引量:110
2008年
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。
郭庆琳李艳梅唐琦
关键词:文本相似度向量空间模型
基于VSM的文本相似度计算的研究
文本相似度的计算作为其它文本信息处理的基础和关键,其计算准确率和效率直接影响其它文本信息处理的结果。本文提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,另一方...
李艳梅郭庆琳唐琦
关键词:文本相似度语义WEB信息处理
文献传递
基于文本相似度的中文文本聚类的研究
文本聚类是文本挖掘和信息检索领域的重要研究课题,而中文自动分词、特征选择和相似度计算等是中文文本聚类研究的关键技术。本文详细综述了文本聚类技术的相关研究;研究了中文未登录词识别和歧义消解;研究和分析比较了常用的特征选择方...
李艳梅
关键词:文本聚类未登录词识别文本相似度多文档文摘
文献传递网络资源链接
共1页<1>
聚类工具0