您的位置: 专家智库 > >

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇中文
  • 2篇中文分词
  • 2篇分词
  • 2篇NUTCH
  • 2篇UTC
  • 2篇LUCENE
  • 2篇H-
  • 1篇页面
  • 1篇链接
  • 1篇链接结构
  • 1篇PAGERA...
  • 1篇HITS
  • 1篇ICTCLA...
  • 1篇N

机构

  • 3篇中国人民解放...
  • 2篇北京航空航天...

作者

  • 3篇寇应展
  • 3篇蔡小艳
  • 2篇郑伟
  • 2篇沈巍
  • 1篇杨杰
  • 1篇赵新杰

传媒

  • 2篇军械工程学院...
  • 1篇科学技术与工...

年份

  • 3篇2008
3 条 记 录,以下是 1-3
排序方式:
Nutch-0.9中JE中文分词的实现被引量:7
2008年
Nutch是一个开放源代码的Web搜索引擎,基于开源搜索框架Lucene,扩展性较好。Nutch是针对英文开发的,对中文只进行单字切分。通过分析Nutch的语言分析器结构,结合基于词库的正向最大匹配分词算法的JE分词,实现了Nutch的中文分词。
蔡小艳寇应展沈巍郑伟
关键词:NUTCHLUCENE中文分词
汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现被引量:7
2008年
分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。
蔡小艳寇应展沈巍郑伟
关键词:NUTCHLUCENEICTCLAS中文分词
基于页面关联比重的PageRank排序算法的改进被引量:2
2008年
对比分析了基于链接分析的搜索引擎排序算法PageRank和HITS,针对原有PageRank算法采用的平分页面自身PageRank值的策略,提出了按基于关键词集的网页关联比重分配PageRank值的改进算法。该改进算法根据用户搜索的关键词,按照超链接的网页关联比重为超链接赋予权重,增强了已有算法的有效性。
蔡小艳寇应展杨杰赵新杰
关键词:PAGERANKHITS链接结构
共1页<1>
聚类工具0