王文华 作品数:5 被引量:30 H指数:4 供职机构: 湖南工业大学 更多>> 发文基金: 教育部人文社会科学研究基金 湖南省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于SVM的产品评论属性特征的情感倾向分析 被引量:9 2012年 产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。 王文华 朱艳辉 徐叶强 杜锐 鲁琳 邓程关键词:支持向量机 文本分类 中文信息处理 基于SVM的中文微博观点句识别算法 被引量:7 2013年 针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别。构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比。算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%。 杜锐 朱艳辉 鲁琳 王文华 邓程 喻魁兰关键词:支持向量机 中文产品评论中评价对象的识别研究 被引量:11 2012年 在中文产品评论中利用无监督的识别评价对象,准确率和召回率较低。为此,提出一种中文产品评论中的评价对象识别方法。对特殊词、评价对象非完整性、评价对象非稳定性等情况过滤噪声,利用评价对象在评论文本中与评价短语规则出现频率较高的特征,进行置信度排序。实验结果表明,对于14 799篇数码类评论文章,该方法的准确率、召回率和F值分别为0.605、0.780、0.681。 徐叶强 朱艳辉 王文华 杜锐 鲁琳 邓程 刘洪婧关键词:完整性 稳定性 手机产品信息垂直搜索引擎的研究 随着互联网技术的飞跃,电子商务的蓬勃发展,论坛,博客等的兴起,越来越多的人们喜欢针对商品的各种属性发表自己的评论,表达自己对某款商品的态度、看法以及使用感受。因此网络上涌现了海量产品评论信息。通过阅读这些评论,可以帮助潜... 王文华关键词:主题相关度 网络爬虫 搜索策略 垂直搜索 手机产品 文献传递 基于Lucene的海量数据库全文检索的设计与实现 被引量:4 2011年 基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。 徐叶强 朱艳辉 栗春亮 王文华关键词:LUCENE 关系数据库