您的位置: 专家智库 > >

邹博伟

作品数:19 被引量:44H指数:4
供职机构:苏州大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划江苏省科技计划项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 11篇期刊文章
  • 5篇会议论文
  • 2篇学位论文

领域

  • 16篇自动化与计算...
  • 2篇文化科学

主题

  • 6篇信息检索
  • 6篇个性化信息
  • 6篇个性化信息检...
  • 4篇抽取
  • 3篇动态阈值
  • 3篇用户
  • 3篇随机场
  • 3篇条件随机场
  • 3篇自然语言
  • 3篇阈值
  • 3篇个性化检索
  • 2篇信息抽取
  • 2篇用户为中心
  • 2篇属性抽取
  • 2篇评测
  • 2篇情感分析
  • 2篇中文
  • 2篇自然语言文本
  • 2篇系统评测
  • 2篇聚焦点

机构

  • 11篇苏州大学
  • 7篇哈尔滨工业大...

作者

  • 18篇邹博伟
  • 7篇洪宇
  • 6篇刘挺
  • 5篇朱巧明
  • 5篇周国栋
  • 5篇范基礼
  • 3篇郑伟
  • 3篇张宇
  • 3篇张宇
  • 3篇郑伟
  • 2篇姚建民
  • 1篇钱忠
  • 1篇唐建

传媒

  • 5篇中文信息学报
  • 3篇计算机研究与...
  • 1篇模式识别与人...
  • 1篇北京大学学报...
  • 1篇软件学报
  • 1篇第四届全国信...

年份

  • 1篇2023
  • 2篇2021
  • 1篇2020
  • 3篇2019
  • 1篇2018
  • 1篇2016
  • 2篇2015
  • 3篇2009
  • 3篇2008
  • 1篇2007
19 条 记 录,以下是 1-10
排序方式:
汉语否定与不确定覆盖域检测
2019年
自然语言文本中存在大量否定和不确定表述,识别这些信息并将其与确定性内容分离,对自然语言处理的下游应用,如信息抽取、信息检索、情感分析等,都具有十分重要的意义.与英语相比,面向汉语的否定与不确定覆盖域检测研究目前较为匮乏.提出了一个基于双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络和条件随机场(conditional random fields, CRF)的融合模型,将覆盖域检测任务作为序列标注问题,针对给定的否定或不确定关键词,识别其在句子中的语义作用范围.该模型既具有LSTM(long short-term memory)网络能够利用前向与后向上下文信息的特性,同时又能够借助CRF 层获取输出标签之间的依赖关系,这得益于该框架能够有效地对序列信息及长距离上下文依赖信息进行编码的优势.在CNeSp语料集上的实验结果验证了模型的有效性,其中,在金融新闻子数据集上,否定与不确定覆盖域检测准确率分别达到79.16%和76.79%,比目前基于传统机器学习的汉语覆盖域检测方法分别提升了25.06%和34.46%.
叶静邹博伟洪宇沈龙骧朱巧明周国栋
基于类卷积交互式注意力机制的属性抽取研究被引量:8
2020年
在基于深度学习的属性抽取研究中,注意力机制是常用的模型之一.目前,面向属性抽取的注意力机制存在2个局限性:其一,注意力机制多为自注意力机制,这是一种全局式注意力机制,其将不相关的噪音(距离目标词较远且与之不相关的词)带入注意力向量的计算;其二,目前的注意力机制多为单层注意力机制,注意力一次建模后缺少交互性.针对这2个局限性,提出一种面向属性抽取的类卷积交互式注意力机制.该方法先将目标句输入到双向循环神经网络,借以获得每个词的隐式表达,再经过类卷积交互式注意力机制进行表示学习.类卷积交互式注意力机制分为2层注意力计算:第1层按序(从句首到句末)通过滑动窗口控制每个词的上下文宽度,并计算每个词的注意力分布向量;第2层将第1层的注意力分布向量与所有单词进行交互注意力计算,将得到的注意力向量与第1层的注意力向量拼接,最终输入到条件随机场进行属性标记.在2014—2016语义评估(semantic evaluation, SemEval)官方数据集上验证了模型的有效性.相比于基线模型,在4个数据集上的F1值分别提高了2.21,1.35,2.22,2.21个百分点.
尉桢楷程梦周夏冰李志峰邹博伟洪宇姚建民
关键词:属性抽取条件随机场情感分析
面向自然语言文本的否定性与不确定性信息抽取被引量:11
2016年
目前,信息抽取研究主要面向肯定性信息,而自然语言文本中包含了大量否定性和不确定性信息,为了将此类信息与肯定性信息区分开,有必要针对否定性与不确定性信息抽取进行深入研究.针对这一任务,首次构建了一个16 841句的汉语语料资源,利用序列标注模型与卷积树核模型,系统地探索了各种序列化依存特征和结构化句法树特征的有效性,并提出了元决策树模型,对二者进行融合.实验结果显示,该方法在否定性和不确定性信息抽取任务上的精确率分别达到69.84%和58.57%,为相关研究打下了坚实的基础.
邹博伟钱忠陈站成朱巧明周国栋
关键词:信息抽取
基于双向LSTM与CRF融合模型的否定聚焦点识别
否定表达作为自然语言文本中常见的语言现象,对自然语言处理上层应用,如情感分析、信息抽取等,具有十分重要的意义.否定聚焦点识别任务是更细粒度的否定语义分析,其旨在识别出句子中被否定词修饰和强调的文本片段.本文将该任务作为序...
沈龙骧邹博伟叶静周国栋朱巧明
关键词:条件随机场
基于人工标注的个性化检索系统评测的研究被引量:8
2009年
个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果。该文构建了个性化检索标注系统和个性化检索评测系统,生成个性化检索系统所需的语料集;并提出了以用户为中心的基于人工标注的个性化检索评价方法。个性化检索评测系统采用了NIST所建立的评价体系,根据用户的标注结果对个性化检索系统的性能进行自动评价,并给出量化、直观的性能指标。
张宇范基礼郑伟邹博伟刘挺
关键词:计算机应用中文信息处理个性化信息检索
基于改进的TeztTiling方法的用户新兴趣发现的研究
个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果.本文提出了用户新兴趣发现子任务,根据用户检索对象的变化识别包含新检索兴趣的查询.同时,本文引入TexTiling方法并对其进行改进,使系统可以自动选择合适的动态阈...
邹博伟张宇范基礼郑伟刘挺
关键词:个性化信息检索动态阈值
文献传递
否定与不确定信息抽取研究综述被引量:1
2015年
否定与不确定表达在自然语言中广泛存在,正确识别此类信息并将其与准确信息分开处理,在信息抽取、情感分析、文本挖掘等自然语言处理任务中具有重要研究价值。自从2008年BioScope语料库发布以来,针对否定与不确定信息抽取研究举办了多次大规模评测会议和学术论坛,为采集语料、明确任务及性能评测等提供了交流平台,否定与不确定信息抽取逐渐成为自然语言处理领域的研究热点。该文简要介绍了否定与不确定信息抽取的研究背景、任务定义、相关语料等,并通过回顾和分析该领域的研究现状,展望未来的发展趋势。
邹博伟周国栋朱巧明
关键词:不确定信息自然语言处理
基于人工标注的个性化检索系统评测的研究
个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果。本文构建了个性化检索标注系统和个性化检索评测系统,生成个性化检索系统所需的语料集;并提出了以用户为中心的基于人工标注的个性化检索评价方法。个性化检索评测系统采用了...
张宇范基礼郑伟邹博伟刘挺
关键词:个性化信息检索
文献传递
个性化信息检索中用户兴趣模型的研究
下一代搜索引擎的一个突出特点是个性化,个性化信息检索是以用户为中心的信息检索技术,它获取以多种形式表达的用户需求/(包括显式的、隐式的以及相关用户的需求/),并综合利用这些用户信息,提高信息检索系统的性能。 ...
邹博伟
关键词:个性化检索用户兴趣模型迭代法
文献传递
面向属性抽取的门控动态注意力机制被引量:3
2019年
在现阶段属性抽取研究中,现有注意力建模及训练较刚性(单句一次成型),而单句中不同词汇的上下文存在语境语义的差异,一致的注意力分布缺少动态的适应性.因此,文中提出面向属性抽取的门控动态注意力机制,利用双向长短时记忆网络捕获目标句中每个单词的隐层表示.在注意力模型处理词一级属性预测时,根据目标词及其上下文,计算适应该目标词的注意力分布向量,可以根据上下文的变化自动调整注意力权重的分配.借助门控调整注意力向量流向下一层神经元的信息量,最终使用条件随机场进行属性标记.应用2014-2016语义评估官方数据集验证文中方法的有效性,F1值均有所提高.
程梦洪宇唐建张家硕邹博伟姚建民
关键词:属性抽取条件随机场情感分析
共2页<12>
聚类工具0