您的位置: 专家智库 > >

李文捷

作品数:5 被引量:93H指数:4
供职机构:香港理工大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划湖北省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 2篇中文
  • 2篇中文核心
  • 2篇领域本体
  • 2篇领域本体构建
  • 2篇本体
  • 2篇本体构建
  • 1篇多文档
  • 1篇新闻
  • 1篇信息抽取
  • 1篇信息处理
  • 1篇语言处理
  • 1篇语义图
  • 1篇人工智能
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇专名
  • 1篇专名识别
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇文档

机构

  • 5篇香港理工大学
  • 1篇北京大学
  • 1篇清华大学
  • 1篇武汉大学
  • 1篇武汉科技大学
  • 1篇菏泽学院
  • 1篇香港中文大学

作者

  • 5篇李文捷
  • 2篇崔高颖
  • 2篇谌贻荣
  • 2篇陆勤
  • 1篇苑春法
  • 1篇宋涛
  • 1篇刘茂福
  • 1篇李素建
  • 1篇姬东鸿
  • 1篇葛瑞芳
  • 1篇黄锦辉
  • 1篇王宁
  • 1篇高杰
  • 1篇幺鹏跃

传媒

  • 4篇中文信息学报

年份

  • 2篇2010
  • 2篇2009
  • 1篇2002
5 条 记 录,以下是 1-5
排序方式:
基于事件项语义图聚类的多文档摘要方法被引量:6
2010年
基于事件的抽取式摘要方法一般首先抽取那些描述重要事件的句子,然后把它们重组并生成摘要。该文将事件定义为事件项以及与其关联的命名实体,并聚焦从外部语义资源获取的事件项语义关系。首先基于事件项语义关系创建事件项语义关系图并使用改进的DBSCAN算法对事件项进行聚类,接着为每类选择一个代表事件项或者选择一类事件项来表示文档集的主题,最后从文档抽取那些包含代表项并且最重要的句子生成摘要。该文的实验结果证明在多文档自动摘要中考虑事件项语义关系是必要的和可行的。
刘茂福李文捷姬东鸿
关键词:DBSCAN聚类算法
中文金融新闻中公司名的识别被引量:77
2002年
在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。
王宁葛瑞芳苑春法黄锦辉李文捷
关键词:金融领域专名识别信息抽取金融新闻
一种基于使用差异的词语领域性分析方法被引量:5
2009年
领域知识的表达形式最终体现在词汇的领域性上,因此对领域词及其部件的领域度分析是一个关键。该文在分词的基础上,对各个领域语料进行分析,利用词语之间的关系,引入链接分析方法分析词语在各个领域中的使用重要性,并通过词语在各个领域中的使用差异性计算其领域度,从而达到领域分析的目的,获取某个领域的领域部件词。该文采用以上方法在军事、娱乐等领域进行了实验,实验结果表明该方法相对于当前常用的tf×idf方法和Bootstrapping方法,可以更有效地进行领域分析获取领域部件词。
李素建宋涛高杰幺鹏跃李文捷
关键词:人工智能自然语言处理链接分析
中文核心领域本体构建的一种改进方法被引量:5
2010年
核心本体对最基本的领域知识建模,并在上位本体和领域本体之间建立联系。上位本体是领域无关的而核心本体是领域相关的,因此在自动创建中文核心本体过程中,映射中文核心术语到上位本体概念有很多的错误。本文提出的改进方法首先找到共享后缀术语集内被共享的术语条数更多、与各术语的意义更接近的上位概念;然后用其来改进词集中的核心术语和概念之间的映射。实验证明,该方法有效的提高了核心本体自动创建的精确度。
谌贻荣陆勤李文捷崔高颖
关键词:计算机应用中文信息处理本体构建领域本体
一种基于共享后缀术语集改进中文核心领域本体构建的方法
核心本体对最基本的领域知识建模并在上位本体和领域本体之间建立联系。上位本体是领域无关的而核心本体是领域相关的,因此在自动创建中文核心本体过程中,映射中文核心术语到上位本体概念有很多的错误。本文以一个基于术语词集抽取共享后...
谌贻荣陆勤李文捷崔高颖
关键词:领域本体
文献传递
共1页<1>
聚类工具0