您的位置: 专家智库 > >

湖南省自然科学基金(10JJ3002)

作品数:10 被引量:58H指数:5
相关作者:朱艳辉邓程杜锐徐叶强鲁琳更多>>
相关机构:湖南工业大学更多>>
发文基金:湖南省自然科学基金教育部人文社会科学研究基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇中文期刊文章

领域

  • 10篇自动化与计算...

主题

  • 4篇中文
  • 3篇抽取
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇向量
  • 2篇向量机
  • 2篇SVM
  • 1篇对象抽取
  • 1篇信息处理
  • 1篇余弦
  • 1篇余弦变换
  • 1篇属性词
  • 1篇数据库
  • 1篇数据挖掘
  • 1篇数据挖掘研究
  • 1篇水印
  • 1篇水印技术
  • 1篇评价对象抽取
  • 1篇情感
  • 1篇情感倾向

机构

  • 10篇湖南工业大学

作者

  • 9篇朱艳辉
  • 6篇杜锐
  • 6篇邓程
  • 5篇徐叶强
  • 5篇鲁琳
  • 4篇王文华
  • 3篇栗春亮
  • 2篇梁韬
  • 1篇柳位平
  • 1篇朱文球
  • 1篇喻魁兰
  • 1篇文志强
  • 1篇胡永祥
  • 1篇鲁林
  • 1篇刘洪婧

传媒

  • 5篇湖南工业大学...
  • 2篇计算机工程
  • 2篇科学技术与工...
  • 1篇计算机应用与...

年份

  • 1篇2014
  • 3篇2013
  • 3篇2012
  • 3篇2011
10 条 记 录,以下是 1-10
排序方式:
一种基于粗糙集的微博文本特征选择方法被引量:4
2013年
对中文微博中主客观分类特征的选取进行了研究。通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征。对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,提出的方法能达到较好的分类效果。
杜锐朱艳辉鲁琳邓程梁韬
关键词:粗糙集
一种基于多重词典的中文文本情感特征抽取方法被引量:10
2011年
情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。
朱艳辉栗春亮徐叶强柳位平
关键词:情感特征
基于C4.5算法的健身俱乐部会员数据挖掘研究被引量:2
2012年
以已投入使用的健身俱乐部管理系统为背景,提出了用C4.5决策树分类算法对健身记录进行数据挖掘。通过该方法找出俱乐部在有效期内的会员的年龄段、性别、会员卡类型和参与健身时间段的规律,提取特定时间段内参与健身的会员特征。实验结果表明:将该分类规则应用到会员管理系统中,可以辅助健身俱乐部的管理者有针对性地制定营销方案。
邓程朱艳辉杜锐鲁林
关键词:C4健身俱乐部
基于SVM的产品评论属性特征的情感倾向分析被引量:9
2012年
产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。
王文华朱艳辉徐叶强杜锐鲁琳邓程
关键词:支持向量机文本分类中文信息处理
面向中文微博的评价对象抽取方法研究
2014年
微博作为当前互联网信息快速传播与分享的新平台,具有信息量庞大、评论多样等特点。针对微博评论信息中的评价对象抽取,采用组块分析和词语位置特征对训练集中3 000条微博观点句的评价对象序列标注,利用条件随机场学习并识别评价对象的名称、属性及其他辅助信息,通过修改相关参数达到最优识别效果,并提出针对复杂观点句评价对象的提取算法。实验结果表明,对测试集中7 000条微博观点句进行评价对象的名称和属性的抽取,效果较好。
鲁琳朱艳辉杜锐邓程梁韬
基于SVM的中文微博观点句识别算法被引量:7
2013年
针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别。构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比。算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%。
杜锐朱艳辉鲁琳王文华邓程喻魁兰
关键词:支持向量机
中文产品评论中属性词抽取方法研究被引量:12
2011年
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。
栗春亮朱艳辉徐叶强
关键词:属性词
中文产品评论中评价对象的识别研究被引量:11
2012年
在中文产品评论中利用无监督的识别评价对象,准确率和召回率较低。为此,提出一种中文产品评论中的评价对象识别方法。对特殊词、评价对象非完整性、评价对象非稳定性等情况过滤噪声,利用评价对象在评论文本中与评价短语规则出现频率较高的特征,进行置信度排序。实验结果表明,对于14 799篇数码类评论文章,该方法的准确率、召回率和F值分别为0.605、0.780、0.681。
徐叶强朱艳辉王文华杜锐鲁琳邓程刘洪婧
关键词:完整性稳定性
基于离散小波变换的差分能量水印技术被引量:1
2013年
经典差分能量水印是基于离散余弦变换(DCT)的水印技术,为了使该水印在离散小波变换(DWT)域实现,提出一种基于DWT域的差分能量水印技术。首先通过选取DWT子带系数构成类似于DCT块的DWT块,由于差分能量水印方法在嵌入水印时建立局部能量差,检测时根据这能量差检测水印。其次,为了阻止局部能量差的消失,在保证视觉质量不受影响的情况下,适当地增加一个子区的能量,能有效降低加水印图像经过JPEG压缩后的水印检测比特差错率。对量化因子对图像质量的影响进行一些分析,并与文献方法的抗压缩攻击的鲁棒性进行比较。实验结果表明该方法是有效的。
文志强朱文球胡永祥
关键词:差分能量水印离散余弦变换离散小波变换比特差错率
基于Lucene的海量数据库全文检索的设计与实现被引量:4
2011年
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。
徐叶强朱艳辉栗春亮王文华
关键词:LUCENE关系数据库
共1页<1>
聚类工具0