李寿山
- 作品数:195 被引量:457H指数:11
- 供职机构:苏州大学更多>>
- 发文基金:国家自然科学基金模式识别国家重点实验室开放课题基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字理学更多>>
- 基于否定前后缀信息的否定句识别方法
- 本发明公开了一种基于否定前后缀信息的否定句识别方法,本发明基于否定前后缀信息的否定句识别方法首先利用单词训练集训练辅助任务模型,用于获取带有否定前后缀的单词的信息;然后利用句子训练集训练主任务模型,用于否定句的识别,在主...
- 李寿山李雅梦周国栋
- 基于不平衡数据的中文情感分类
- 近些年来,情感分类在自然语言处理研究领域获得了显著的发展。然而,大部分已有的研究都假设参与分类的正类样本和负类样本一样多,而实际情况中正负类数据的分布往往是不平衡的。本文收集四个产品领域的中文评论文本,发现正类样本的数目...
- 王中卿李寿山朱巧明李培峰周国栋
- 关键词:中文信息处理情感分类
- 文献传递
- 基于wav2vec的语音情感识别方法
- 本申请涉及一种基于wav2vec的语音情感识别方法,属于语音信号智能处理领域,该方法包括:获取样本语音信号并对样本语音信号进行预处理,获得处理后的样本语音信号;构建预设分类模型,所述预设分类模型由特征抽取网络和与特征抽取...
- 李寿山李林钦王中卿周国栋
- 文献传递
- 基于多任务学习的多模态情绪识别方法被引量:5
- 2019年
- 情绪分析是自然语言处理的一项基本任务,目前在单模态信息(文本)上的研究已经相当成熟。但是对于包含文本、图像和语音3种模态信息的多模态内容(如视频)来说,额外增加的模态信息让情绪分析变得更具挑战性。为了提升多模态情绪识别任务的性能,文中提出了一种基于多任务学习的神经网络方法,该方法在考虑模态内部信息的同时,充分结合了3种模态之间的联系。具体而言,首先对3种模态信息进行预处理,得到相应的特征表示;其次,分别为每个模态构建私有的双向LSTM,从而获得单模态的内部信息;分别为两两组合(文本-图像、文本-语音和图像-语音)的双模态信息构建共享的双向LSTM层,以学习双模态之间的动态交互信息;接着,为3种模态组合的信息构建一个共享的双向LSTM,从而捕捉3种模态之间的动态交互信息;最后,把网络层中得到的单模态的内部信息和多模态的动态交互信息进行融合,通过全连接层和Sigmoid层获取最终的情绪识别结果。在单模态实验中,相比于目前的最佳方法,所提方法在文本、图像和语音3个方面对所有情绪识别的效果分别平均提高了6.25%,0.75%和2.38%;在多模态实验中,该方法在情绪识别任务中达到了平均65.67%的准确率,相比其他基准方法有了明显的提升。
- 吴良庆张栋李寿山陈瑛
- 关键词:多模态情绪识别多任务学习自然语言处理
- 一种双语情感分类方法及装置
- 本申请提供了一种双语情感分类方法及装置,方法包括:翻译待分类的源语言文档和训练样本集的源语言文档,得到待分类的翻译文档和训练样本集的翻译文档;组合待分类的源语言文档和待分类的翻译文档,得到待分类的双语文档,组合训练样本集...
- 李寿山苏艳周国栋
- 文献传递
- 一种新闻分类方法和系统
- 本申请提供一种新闻分类方法和系统。其中,一种新闻分类方法包括:使用预先构建的每个基分类器对待分类新闻进行分类,得到每个基分类器的分类结果;依据每个基分类器的分类结果,分别对待分类新闻进行情绪判定,得到判定结果;使用判定结...
- 李寿山刘欢欢周国栋孔芳
- 文献传递
- 一种情感词典构建方法及系统
- 本发明涉及自然语言处理领域,公开了一种情感词典构建方法及系统。本方案公开的情感词典构建方法及系统,基于同义词词林,通过对同义词词林的检索,只需预先设定的少量种子词,就能获取大量情感词,从而获得扩展的种子词词集,并根据评价...
- 李寿山林莉媛周国栋
- 文献传递
- 面向问答文本的属性级情感分类研究被引量:2
- 2019年
- 传统情感分析任务的目的是分析整个文本的情感极性,这是一种粗粒度的任务。近年来,随着技术的革新,情感分析任务也在不断细化,研究者们希望能获取关于文本中具体对象的情感极性。文中的研究任务是获取问答文本中关于产品属性的情感极性。针对问答文本的属性级情感分析问题,提出了一种基于注意力机制的方法。首先,将属性信息拼接到答案词向量上;其次,对答案文本和问题文本学习一个LSTM模型;然后,通过注意力机制获得问题文本和答案文本的相关性,并根据相关性的重要程度获取答案文本的整体特征;最后,通过分类器输出最终的整体特征结果。实验结果表明,所提方法优于传统的属性级情感分析方法。
- 江明奇李逸薇刘欢李寿山
- 关键词:情感分析
- 基于联合学习的跨领域法律文书中文分词方法被引量:4
- 2019年
- 中文分词任务是自然语言处理的一项基本任务。但基于统计的中文分词方法需要大规模的训练样本,且拥有较差的领域适应性。然而,法律文书涉及众多领域,对大量的语料进行标注需要耗费大量的人力、物力。针对该问题,该文提出了一种基于联合学习的跨领域中文分词方法,该方法通过联合学习将大量的源领域样本辅助目标领域的分词,从而提升分词性能。实验结果表明,在目标领域标注样本较少的条件下,该文方法的中文分词性能明显优于传统方法。
- 江明奇严倩李寿山
- 关键词:中文分词法律文书
- 基于双语信息的情绪分类方法及系统
- 本发明公开了一种基于双语信息的情绪分类方法及系统,首先对收集的语料进行标注,得到标注样本,使用机器翻译程序,将中文语料翻译成英文语料、将英文语料翻译成中文语料,将两组中文语料进行合并得到最终的中文语料、将两组英文语料进行...
- 李寿山殷昊周国栋张民
- 文献传递