您的位置: 专家智库 > >

国家自然科学基金(60803086)

作品数:13 被引量:133H指数:5
相关作者:杜永萍何明黄亮张江涛吴小飞更多>>
相关机构:北京工业大学中国科学技术信息研究所中国工商银行股份有限公司更多>>
发文基金:国家自然科学基金北京市自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 12篇期刊文章
  • 1篇会议论文

领域

  • 13篇自动化与计算...

主题

  • 5篇语言处理
  • 5篇自然语言
  • 5篇自然语言处理
  • 4篇协同过滤
  • 3篇推荐系统
  • 2篇信任
  • 2篇信任计算
  • 2篇性能评价
  • 2篇语义
  • 2篇语义链
  • 2篇协同过滤推荐
  • 1篇单文档
  • 1篇信任关系
  • 1篇信任网络
  • 1篇信息抽取
  • 1篇信息抽取模型
  • 1篇信息检索
  • 1篇信息检索技术
  • 1篇性能分析
  • 1篇用户

机构

  • 13篇北京工业大学
  • 1篇复旦大学
  • 1篇中国科学技术...
  • 1篇中国工商银行...

作者

  • 9篇杜永萍
  • 7篇何明
  • 2篇张江涛
  • 2篇吴小飞
  • 2篇黄亮
  • 2篇刘江利
  • 1篇黄萱菁
  • 1篇姚长青
  • 1篇李薇
  • 1篇任万鹏
  • 1篇王振振
  • 1篇刘毅
  • 1篇魏铮
  • 1篇刘伟世

传媒

  • 6篇计算机科学
  • 2篇模式识别与人...
  • 1篇图书情报工作
  • 1篇计算机研究与...
  • 1篇北京工业大学...
  • 1篇山东大学学报...
  • 1篇第六届全国信...

年份

  • 1篇2017
  • 2篇2016
  • 1篇2014
  • 4篇2013
  • 1篇2012
  • 1篇2011
  • 1篇2010
  • 2篇2009
13 条 记 录,以下是 1-10
排序方式:
语义蕴涵关系识别中的特征提取方法
2013年
为了捕捉不同文本片段之间的语义推理结果,实现文本片段之间的推导,采用基于分类器的方法进行蕴涵关系的判断.特征的选取是影响分类器性能的关键因素,在采用基本的词汇特征的基础上,引入了句法特征以及语义特征.通过构建语义链的方法挖掘T和H之间的语义关联,并应用于不同的分类器检验语义特征的有效性.在公开评测的数据集RTE-3~RTE-5上评价系统的性能,AdaBoost与SVM分类器取得的准确率分别为61.0%和61.8%.t检验的结果表明:基于语义链的语义特征使得系统性能得到了显著的提高.
杜永萍张江涛刘江利
关键词:语义链自然语言处理
基于语义链的检索在QA系统中的应用被引量:6
2013年
自动问答系统以自然语言提出问题,并采用自然语言处理技术自动地将答案返回给用户。利用WordNet构建语义链,并将语义链用于问答系统。在面向Web的问答系统中,采用两种不同的计算文本相似度的方法对Google返回的Snippets按照相似度进行排序,对返回的第一个和前十个Snippets中包含答案片段的情况进行分析,与不使用语义链时的情况相比,使包含答案片段的准确率分别提高了150%和66.12%。对实验结果进行了显著性检验,在显著性水准α=0.05的条件下,得到p=0.000078,使系统的准确率得到显著提高。
张江涛杜永萍
关键词:WORDNET语义链问答系统
基于主题的舆情跟踪方法研究及性能评价被引量:4
2012年
舆情跟踪是对媒体信息流中的热点话题进行实时追踪,是近年来自然语言处理领域的研究热点。实现该任务的核心技术是进行文本分类,运用信息增益以及互信息计算特征项权重,提取向量空间模型中文档表示的有效特征;分别采用Rocchio、K-Nearest Neighbor(KNN)、Bayes方法对于给定主题的事件实现舆情跟踪。在测试集上的最优性能F-Measure值达到86.2%。舆情跟踪在信息安全等领域具有广阔的应用前景,为用户及时判断网络热点事件的发展趋势提供有效指导依据。
姚长青杜永萍
关键词:文本分类自然语言处理
开放领域的QA系统结构及性能分析
2009年
开放领域的问题回答(QA)是近年来自然语言处理研究领域的一个热门研究方向.文中介绍基于模式匹配策略的问题回答系统,并对其进行深层次的性能分析与评价,讨论检索参数和训练样例数目对系统性能的影响.同时,进行t-test来检验不同因素对系统性能影响的显著性,旨在对系统实现细节有更明确的分析,更有效地提高系统性能.系统中运用自然语言处理工具,如句法分析器、实体名识别工具等,工具本身的性能也是影响QA系统性能的一个重要因素.
杜永萍黄萱菁
关键词:性能分析自然语言处理
基于LDA主题模型的文本相似度计算被引量:91
2013年
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。
王振振何明杜永萍
关键词:主题模型LDA文本相似度GIBBS抽样
基于上下文项目评分分裂的协同过滤推荐被引量:3
2017年
上下文感知推荐系统的主要任务是利用上下文信息进一步提高推荐系统的推荐精度和用户满意度。提出了一种基于上下文项目评分分裂的推荐方法。该方法首先依据项目分裂判别标准对多维度上下文信息下的项目进行分裂,然后根据分裂结果并通过上下文维度进行聚类。在此基础上,利用协同过滤推荐算法进行未知评分预测。最后,面向不同的项目分裂标准,在LDOS-CoMoDa数据集上进行仿真对比实验。实验结果表明,相对于其他推荐算法,该方法有效提升了推荐精度,达到了提高推荐质量效果的目的。
何明刘毅常盟盟吴小飞
关键词:协同过滤
基于词汇与句法关系匹配的蕴涵关系识别方法
自然语言有丰富的表达方式,语义蕴涵识别任务RTE(Recognizing Textual Entailment)判断两个文本片断T(Text)和H(Hypothesis)之间是否具有蕴涵关系。本文使用了基于词汇和句法关系...
刘江利杜永萍
关键词:自然语言处理性能评价
文献传递
融合信任计算的协同过滤推荐方法被引量:12
2014年
协同过滤推荐是目前应用最为广泛的推荐策略之一,但存在数据稀疏和难扩展问题.文中在传统基于用户的协同过滤推荐算法的基础上,引入信任关系计算,利用信任关系的条件传递特性,设计并构建一个集用户声望信任和用户局部信任的混和信任网络,并将用户间评分相似度和网络中用户间信任评价度结合,为用户寻找更多基于信任因素和兴趣因素的二维相似近邻.在Epinions数据集上以平均绝对误差(MAE)和均方根误差(RSME)等作为实验评价指标,对该方法进行验证实验.结果表明相比传统协同过滤推荐算法,该方法在MAE上提高约6.8%,最优值达到0.7513,t检验的结果也表明该方法能显著提高推荐系统性能.
杜永萍黄亮何明
关键词:协同过滤信任计算推荐系统
基于多策略的单文档问答式信息检索技术被引量:1
2009年
单文档问答式信息检索,即是阅读理解(Reading Comprehension,简称RC)。该任务的目的在于理解一篇文档并对提出的问题返回答案句。提出了充分利用外部资源采用多策略技术来提高RC系统性能的方法,包括基于Web的答案模式匹配应用、词汇语义关联推理以及上下文辅助等策略。本方法使得RC系统性能在Remedia标准测试集上的性能得到提高。描述了不同策略对提高系统性能的有效性,t-test结果表明,运用答案模式匹配和词汇语义关联推理策略所得到的性能显著提高;同时分析了指代消解策略在系统中的关键作用;最后比较了RC任务和多文档问答式信息检索(Question Answering,简称QA)任务的差异性。
杜永萍何明
关键词:自然语言处理
基于信任关系的潜在好友推荐方法被引量:7
2013年
如何有效地帮助用户挖掘平台潜在好友成为电子商务中一项非常重要的服务需求。提出了一种综合考虑用户间兴趣因素和信任因素的好友推荐方法,设计并构建了一个包括用户声望信任和局部信任的混合信任网络,将网络中信任评价度与协同过滤中兴趣评分相似度进行组合来衡量用户间好友相似关联,以实现好友推荐。在Epinions数据集上以准确率、召回率和F值作为实验评价指标,对所提方法进行验证,相比其他同类应用准确率在10%-15%、召回率在10%~20%的性能,本文方法的准确率和召回率的最佳性能分别达到22.47%和21.15%,实验证明本文方法有效提高了推荐性能。
黄亮杜永萍
关键词:信任计算
共2页<12>
聚类工具0