国家教育部博士点基金(20100001120029)
- 作品数:2 被引量:32H指数:2
- 相关作者:赵东岩王伟王伟赵伟王伟更多>>
- 相关机构:北京大学武警工程学院教育部更多>>
- 发文基金:国家教育部博士点基金北京市科委基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文新闻事件本体建模与自动扩充被引量:14
- 2012年
- 针对中文新闻事件的语义层次自动理解问题,给出了新闻事件的定义,构造了一种基于本体的新闻事件模型NOEM。NOEM利用事件的类型、时间、空间、结构、因果、媒体六个方面特征描述新闻事件的5W1H(Who,What,Whom,When,WhereandHow)语义要素。将抽取的关键事件语义要素自动扩充到本体中后,可构成事件知识库支持事件语义层次的应用。与现有事件模型的比较以及实际应用结果显示,NOEM能够有效描述单个新闻文档中的关键事件、语义要素以及它们之间的关联,具有很强的形式化知识表达、应用集成和扩展能力。
- 王伟王伟
- 关键词:5W1H本体
- 中文新闻关键事件的主题句识别被引量:18
- 2011年
- 提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
- 王伟王伟赵东岩
- 关键词:中文信息处理自动文摘事件抽取新闻标题