您的位置: 专家智库 > >

郭程

作品数:4 被引量:1H指数:1
供职机构:沈阳航空航天大学更多>>
发文基金:国家重点基础研究发展计划国家科技支撑计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 2篇潜在主题
  • 2篇主题
  • 2篇主题挖掘
  • 2篇查询
  • 2篇查询意图
  • 1篇多样性
  • 1篇信息检索
  • 1篇语言
  • 1篇网络
  • 1篇锚文本
  • 1篇模式抽取
  • 1篇跨语言
  • 1篇互信息
  • 1篇基于网络
  • 1篇WIKIPE...
  • 1篇抽取

机构

  • 4篇沈阳航空航天...

作者

  • 4篇郭程
  • 2篇张桂平
  • 2篇白宇
  • 1篇蔡东风
  • 1篇冯鹏展

传媒

  • 2篇中文信息学报
  • 1篇沈阳航空航天...

年份

  • 2篇2016
  • 1篇2014
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
Wikipedia跨语言链接发现中的锚文本译项选择
2016年
Wikipedia跨语言链接发现主要研究从源语言Wikipedia文章中自动识别与主题相关的锚文本,并为锚文本推荐一组相关的目标语言链接。该研究涉及三个关键问题:锚文本识别、锚文本翻译和目标链接发现。在锚文本翻译中,一个锚文本可能存在多个目标译项,如果其译项选择有误,将会直接影响目标链接发现中的链接推荐的准确性。为此,该文提出了一种基于上下文的锚文本译项选择方法,使用基于逐点互信息投票的方式确定锚文本的译项。对中英文Wikipedia中的人名、术语以及缩略语的译项选择进行测试,实验表明该方法取得了较好的效果。
郑剑夕白宇郭程张桂平
关键词:WIKIPEDIA锚文本
一种无指导的子主题挖掘方法被引量:1
2016年
为了解决用户查询经常存在表意模糊或歧义性等问题,明确用户的查询意图,该文提出了一种无指导的子主题挖掘方法。该方法首先在检索结果文档集中利用ATF×PDF模型挖掘候选主题词;其次,为保证子主题的多样性,该文基于HowNet语义相似度方法对候选主题词进行了层次聚类分析,进而得到潜在主题;最后,利用LCS算法生成多样性子主题。实验结果显示,系统平均D#-nDCG@10达到0.573,结果说明该方法在明确查询主题表意方面取得了较好效果。
郭程白宇郑剑夕蔡东风
关键词:查询意图潜在主题
面向多样性检索的子主题挖掘技术的研究
信息时代的快速发展使得互联网数据呈现“井喷式”增长。作为信息检索在互联网中最成功的应用,搜索引擎已经成为用户查找信息的不可或缺的工具。然而,由于对效率,并发等系统性能的考虑,目前搜索引擎还是基于关键词的检索方式。此外用户...
郭程
关键词:信息检索查询意图多样性潜在主题
文献传递
一种基于网络的竞争企业名录自动更新方法
2013年
为解决情报采集过程中竞争企业名录的更新问题,提出了一种基于网络的竞争企业名录自动更新方法。该方法首先利用产品名称从企业索引中检索出相关的企业名列表,采用LCS(Longest Common Substring)算法抽取企业名模式,以"产品名+企业名模式"的形式重构查询。然后,使用搜索引擎进行网页搜索,再利用贝叶斯分类算法对搜索的网页过滤,将过滤后的企业信息更新到企业名录中。实验结果显示,系统P@10、P@20、P@30分别为73.4%,68.4%,65.2%,MAP@10、MAP@20、MAP@30分别达到66.2%,58.9%,52.5%,结果说明该方法可以有效的实现竞争企业名录的自动更新。
冯鹏展郭程郑剑夕张桂平
关键词:模式抽取
共1页<1>
聚类工具0