黄小江
- 作品数:9 被引量:28H指数:3
- 供职机构:北京大学计算机科学技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于协同图排序的对比新闻自动摘要被引量:4
- 2013年
- 采用协同图排序模型,为两个可比的新闻话题自动生成对比摘要。利用一个话题内句子之间的相似性,以及不同话题中句子之间的对比性,采用迭代增强的方法,同时计算两个话题中每个句子的重要程度,并考虑信息的新颖程度,选择适当的句子组成对比摘要。实验结果表明了该方法的有效性。
- 黄小江万小军肖建国
- 关键词:多文档摘要
- 中文比较句分类器模型生成、中文比较句识别方法及装置
- 本发明公开了一种中文比较句分类器模型生成、中文比较句识别方法及装置,包括:将数据集各句子中每一个包含设定的比较关键词的分句转化成一个序列,并为序列建立与其对应分句所属句子相同的类别标记;得到序列集;采用序列模式挖掘算法从...
- 黄小江万小军杨建武肖建国
- 多文档摘要系统中句子排序研究
- 多文档摘要系统中旬子捧序问题一直是文档自动摘要系统中一项重要而艰巨的任务。传统的摘要句排序方法假设各句子在语义上是相互独立的,只简单利用句子的时间特征和在原文档中的位置特征来排序,效果较差。为了获取两个句子之间的语义先后...
- 贾候萍万小军黄小江杨建武肖建国
- 关键词:多文档摘要
- 文献传递
- 汉语比较句识别研究被引量:20
- 2008年
- 比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为"比较"和"非比较"两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。
- 黄小江万小军杨建武肖建国
- 关键词:计算机应用中文信息处理文本分类
- 互联网舆情精准搜索与语义分析技术及应用系统
- 杨建武万小军陈晓鸥吴於茜黄小江梁汝峰张丹于晓明吴新丽孙红娥
- 互联网具有开放性、虚拟性、隐蔽性等特点,已成为思想文化信息的集散地和社会舆论的放大器。网络信息和社会信息的交融对社会生活的直接影响越来越大,甚至关系到国家信息安全和长治久安。互联网舆情精准搜索与语义分析技术及应用系统可为...
- 关键词:
- 关键词:互联网
- 互联网环境下的英文同义术语自动发现研究与系统实现被引量:4
- 2012年
- 以英文同义术语为例,提出三种有效的自动获取互联网术语资源的技术手段,包括语法模式的自学习,在线同义词典的抽取,静态同义术语分类的爬取。在此基础上,设计并实现互联网同义术语检索原型系统(WebSynonym Searcher)。实验测试表明,从互联网中自动获取同义术语是一种非常有前景的途径。
- 刘伟黄小江万小军王星
- 关键词:互联网在线词典
- 互联网敏感信息快速识别技术
- 互联网敏感信息的识别过滤对促进互联网健康发展有重要意义。为逃避计算机的识别,敏感信息往往以变形形式出现,使得敏感信息的识别变得困难。针对这一问题,本文提出了一种多模式模糊匹配的敏感规则过滤算法。通过对用户自定义的关键词进...
- 王晨峰宗良黄小江杨建武
- 关键词:互联网敏感信息识别技术
- 面向比较语义的互联网文本挖掘关键问题研究
- 比较是人们日常生活中常用的一种行为方式,对获取知识有重要意义。随着社会发展和技术进步,可获取的信息量与日俱增,通过对比分析能够得到的知识也更为丰富。但通过人工方式处理数据需耗费大量人力物力,已无法满足广大用户的急切需求。...
- 黄小江
- 关键词:互联网文本挖掘
- 中文比较句分类器模型生成、中文比较句识别方法及装置
- 本发明公开了一种中文比较句分类器模型生成、中文比较句识别方法及装置,包括:将数据集各句子中每一个包含设定的比较关键词的分句转化成一个序列,并为序列建立与其对应分句所属句子相同的类别标记;得到序列集;采用序列模式挖掘算法从...
- 黄小江万小军杨建武肖建国
- 文献传递