您的位置: 专家智库 > >

杨宇

作品数:1 被引量:7H指数:1
供职机构:北京大学信息科学技术学院计算机科学技术系更多>>
发文基金:国家自然科学基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...
  • 1篇文化科学

主题

  • 1篇元数据
  • 1篇元数据抽取
  • 1篇正则
  • 1篇正则表达式
  • 1篇数据抽取
  • 1篇课程
  • 1篇抽取

机构

  • 1篇北京大学

作者

  • 1篇张铭
  • 1篇杨宇

传媒

  • 1篇计算机科学

年份

  • 1篇2008
1 条 记 录,以下是 1-1
排序方式:
基于多种规则的课程元数据自动抽取被引量:7
2008年
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。
杨宇张铭周宝曜
关键词:元数据抽取正则表达式
共1页<1>
聚类工具0