您的位置: 专家智库 > >

杨林

作品数:3 被引量:33H指数:3
供职机构:安徽工业大学计算机学院更多>>
发文基金:国家自然科学基金安徽省高校省级自然科学研究项目更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 2篇文化科学
  • 1篇自动化与计算...

主题

  • 3篇相似度
  • 3篇词语相似度
  • 2篇知网
  • 2篇关键词提取
  • 1篇语义距离
  • 1篇文本
  • 1篇文本检索
  • 1篇新词
  • 1篇新词语
  • 1篇基于文本
  • 1篇关键词
  • 1篇TF-IDF
  • 1篇TFIDF算...
  • 1篇词语
  • 1篇词语权重

机构

  • 3篇安徽工业大学

作者

  • 3篇杨林
  • 2篇王小林
  • 2篇王东

传媒

  • 1篇情报科学
  • 1篇计算机科学与...

年份

  • 1篇2015
  • 2篇2013
3 条 记 录,以下是 1-3
排序方式:
基于文本的关键词提取方法研究与实现
由于数据信息的膨胀,文本检索经常涉及海量文档。除学术论文包含关键词外,大量的文档没有关键词。面对海量文档的检索,如果没有关键词,几乎无法处理这类检索问题。因此,要进行海量文档的信息检索,必须首先解决对文档进行准确高效的关...
杨林
关键词:文本检索关键词提取词语相似度词语权重TFIDF算法
文献传递
改进的TF-IDF关键词提取方法被引量:18
2013年
在TF-IDF算法基础上,提出新的基于词频统计的关键词提取方法。利用段落标注技术,对处于不同位置的词语给予不同的位置权重,对分词结果中词频较高的同词性词语进行词语相似度计算,合并相似度较高的词语,通过词语逆频率TF-IWF算法,按权值排序得到关键词。这种改进算法解决了传统中文关键词提取方法中对相似度高的词的不重视而导致关键词提取精度不高的问题。实验结果表明,改进的算法结果在准确率和召回率上较原有的TF-IDF算法上都得到较好的提升,使得提取的关键词集合能较好体现文本内容。
王小林杨林王东镇丽华
关键词:知网词语相似度TF-IDF关键词提取
基于知网的新词语相似度算法研究被引量:11
2015年
基于"知网"提出了一种新的词语相似度计算方法。在概念层次上,引入义原类相似度的概念及计算规则,结合词语概念中主要义原类限制次要义原类和变系数法对各义原类加权计算,求得概念相似度;在词语层次上,引入词性相似度的概念,取不同词性的最大值作为词语相似度。实验结果表明,与已有方法相比,该方法有效提高了词语相似度的精确度和计算效率。
王小林杨林王东
关键词:知网词语相似度语义距离
共1页<1>
聚类工具0