您的位置: 专家智库 > >

万小军

作品数:66 被引量:133H指数:5
供职机构:北京大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术语言文字文化科学哲学宗教更多>>

文献类型

  • 44篇专利
  • 10篇期刊文章
  • 8篇会议论文
  • 3篇学位论文
  • 1篇科技成果

领域

  • 22篇自动化与计算...
  • 2篇文化科学
  • 2篇语言文字
  • 1篇经济管理
  • 1篇哲学宗教
  • 1篇医药卫生

主题

  • 25篇文档
  • 16篇句子
  • 12篇聚类
  • 10篇中文
  • 9篇新闻
  • 9篇语言
  • 9篇语言文字
  • 9篇文字
  • 7篇多文档
  • 7篇排序
  • 6篇信息处理
  • 6篇用户
  • 6篇互联
  • 5篇评测
  • 5篇主题检测
  • 5篇自然语言
  • 5篇标签
  • 4篇短语
  • 4篇信息检索
  • 4篇语义

机构

  • 66篇北京大学
  • 35篇北大方正集团...
  • 15篇北京北大方正...
  • 4篇北京北大方正...
  • 4篇北京方正电子...
  • 1篇复旦大学
  • 1篇哈尔滨工业大...
  • 1篇清华大学
  • 1篇苏州大学
  • 1篇中国科学技术...
  • 1篇中国人民大学
  • 1篇中国科学院软...
  • 1篇中国科学院自...
  • 1篇哈尔滨工业大...
  • 1篇北京天公瑞丰...
  • 1篇之江实验室

作者

  • 66篇万小军
  • 14篇杨建武
  • 12篇杨建武
  • 7篇骆雄武
  • 7篇黄小江
  • 4篇陈晓鸥
  • 3篇吴於茜
  • 3篇肖建国
  • 3篇张建敏
  • 2篇冯涛
  • 2篇魏薇
  • 2篇路斌
  • 2篇彭宇新
  • 2篇刘伟
  • 2篇贾候萍
  • 2篇王栋
  • 2篇肖建国
  • 2篇余军
  • 2篇马腾飞
  • 1篇吴新丽

传媒

  • 2篇计算机工程
  • 2篇中文信息学报
  • 1篇图书情报工作
  • 1篇北京大学学报...
  • 1篇华南理工大学...
  • 1篇计算机应用
  • 1篇中国科学:信...
  • 1篇大数据
  • 1篇第二届全国搜...

年份

  • 1篇2024
  • 2篇2023
  • 3篇2020
  • 1篇2019
  • 3篇2017
  • 2篇2016
  • 1篇2014
  • 3篇2013
  • 5篇2012
  • 6篇2011
  • 8篇2010
  • 6篇2009
  • 10篇2008
  • 4篇2007
  • 4篇2006
  • 1篇2005
  • 3篇2004
  • 3篇2003
66 条 记 录,以下是 1-10
排序方式:
一种新闻综述生成方法与系统
本发明公开了一种新颖的基于段落进行新闻综述生成的方法与系统,涉及语言文字处理领域。目前有大量关于同一个事件的新闻报道,且新闻报道的综述都是由人工编辑的,经济成本高,且很难保证时效性。本发明提出基于段落重新分割,排序,选择...
张建敏万小军
一种从网页中抽取信息的方法及装置
本发明公开了一种从网页中抽取信息的方法及装置,用以解决现有技术中不能从非结构化格式的网页中获取准确的信息问题。该方法包括:查找网页中的每种信息属性,获取每种信息属性对应的信息属性候选集,根据保存的信息属性间的位置关系与布...
刘伟万小军杨建武肖建国
文献传递
基于协同图排序的对比新闻自动摘要被引量:4
2013年
采用协同图排序模型,为两个可比的新闻话题自动生成对比摘要。利用一个话题内句子之间的相似性,以及不同话题中句子之间的对比性,采用迭代增强的方法,同时计算两个话题中每个句子的重要程度,并考虑信息的新颖程度,选择适当的句子组成对比摘要。实验结果表明了该方法的有效性。
黄小江万小军肖建国
关键词:多文档摘要
一种基于集成学习和词句综合信息的文本蕴涵识别方法
本发明公开了一种基于集成学习和词句综合信息的文本蕴涵识别方法,涉及语言文字处理领域。目前的中文文本蕴涵识别系统主要基于词汇特征、句法特征、知识库、人工定义的规则等,然而词汇、句法信息作为独立特征训练出的模型对数据的拟合度...
魏薇万小军
一种面向学术文献的知识推荐方法
本发明涉及一种面向学术文献的知识推荐的方法,属于语言文字处理技术。为寻求有效的研究方法来解决研究工作中的问题,研究人员需要阅读大量的文献,深入了解领域内的学术知识与相关技术,通过思考、分析和大量的实验与尝试,提出并验证自...
黄珊珊万小军唐学伟
文献传递
一种对文档集进行批量单文档摘要的方法及系统
本发明涉及一种对文档集进行批量单文档摘要的方法及系统,属语言文字处理技术领域。现有几乎所有单文档自动摘要方法均只利用单篇文档自身的信息进行摘要。本发明所述方法能够对给定文档集中的所有文档批量生成单文档摘要。该方法首先对给...
万小军杨建武吴於茜陈晓鸥
文献传递
一种多文档摘要的生成方法及装置
本发明公开了一种多文档摘要的生成方法及装置,用以解决现有技术中生成的多文档摘要的可读性差的问题。该方法从多篇文档中选择若干个摘要句;按照设置的至少一种排序规则将所述若干个摘要句进行排序生成多文档摘要,其中,每种排序规则根...
贾候萍万小军黄小江杨建武肖建国
文献传递
中文比较句分类器模型生成、中文比较句识别方法及装置
本发明公开了一种中文比较句分类器模型生成、中文比较句识别方法及装置,包括:将数据集各句子中每一个包含设定的比较关键词的分句转化成一个序列,并为序列建立与其对应分句所属句子相同的类别标记;得到序列集;采用序列模式挖掘算法从...
黄小江万小军杨建武肖建国
一种基于句子关系图的多文档摘要方法
本发明涉及一种基于句子关系图的多文档摘要方法,属于语言文字处理技术领域。现有的多文档摘要方法中,没有采用有效的措施保持摘要中句子的新颖性,也没有区分句子之间不同类型的关系,只简单利用了句子的自身内容来计算句子之间的关系,...
万小军杨建武吴於茜陈晓鸥
文献传递
获取预定义字符数据的方法和装置
本发明提供了一种获取预定义字符数据的方法和装置,本发明的方法包括:对待处理字符数据进行词性标注,划分出显性字符数据或/和隐性字符数据;从所述显性字符数据中查找出具有预定义字符数据类型的数据,作为所述显性字符数据的预定义字...
马腾飞万小军杨建武肖建国
文献传递
共7页<1234567>
聚类工具0