宋晓雷
- 作品数:8 被引量:90H指数:4
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:山西省自然科学基金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于概率潜在语义分析的词汇情感倾向判别被引量:15
- 2011年
- 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。
- 宋晓雷王素格李红霞李德玉
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向
- 基于概率潜在语义分析的词汇情感倾向判别
- 本文利用概率潜在语义分析,给出了两种用于判别词汇的情感倾向的方法。一种是使用概率潜在语义分析获得每个目标词和基准词之间的相似度矩阵,再利用投票法决定每个目标词的情感倾向;二是利用概率潜在语义分析对目标词进行语义聚类和扩展...
- 宋晓雷王素格李红霞
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向
- 文献传递
- 面向特定领域产品评价对象自动识别研究
- 随着Internet技术的迅猛发展以及电子商务的不断普及,产品评价对象的识别已成为中文信息处理的一个研究热点。本文首先抽取候选评价对象。通过综合使用词形模板和词性模板以及在对候选评价对象评分之前进行预处理,提高了候选评价...
- 宋晓雷王素格李红霞
- 关键词:K均值聚类
- 文献传递
- 基于同义词的词汇情感倾向判别方法被引量:37
- 2009年
- 词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的词汇情感倾向判别方法,这种方法一定程度上避免了数据稀疏问题。实验结果表明,基于同义词的词汇情感倾向判别方法优于仅采用目标词与基准词的词汇情感倾向判别方法。
- 王素格李德玉魏英杰宋晓雷
- 关键词:计算机应用中文信息处理同义词
- 基于领域知识的问答对自动提取方法被引量:5
- 2010年
- 问答系统旨在用准确、简洁的答案回答用户用自然语言提出的问题。以旅游信息服务为应用背景,提出了基于领域知识的问答对自动提取方法。考察了常见旅游问题,建立了领域知识,在此基础上,设计了用户问题模式匹配算法和答案提取算法,对于不能匹配模式的问题,采用句子相似度计算得到相关的答案。实验结果表明,提出的方法是可行的,实现了旅游问题的自动问答。
- 王素格宋晓雷李红霞
- 关键词:问答系统领域知识库模式库
- 面向特定领域的产品评价对象自动识别研究被引量:34
- 2010年
- 产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。
- 宋晓雷王素格李红霞
- 关键词:计算机应用中文信息处理K均值聚类
- 基于Web的汽车产品评论观点挖掘方法研究
- 随着Internet的迅猛发展和电子商务的不断普及,网上信息大量涌现,越来越多的网民希望互联网能够提供更多人性化的服务:商家希望能够及时了解用户对产品的意见或建议,以便改进产品的性能和售后服务;消费者则可以利用网上的评论...
- 宋晓雷
- 关键词:WEB平台汽车产品
- 文献传递
- 基于概率潜在语义分析的词汇情感倾向判别
- 本文利用概率潜在语义分析,给出了两种用于判别词汇的情感倾向的方法。一种是使用概率潜在语义分析获得每个目标词和基准词之间的相似度矩阵,再利用投票法决定每个目标词的情感倾向;二是利用概率潜在语义分析对目标词进行语义聚类和扩展...
- 宋晓雷王素格李红霞
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向