您的位置: 专家智库 > >

庄丽

作品数:2 被引量:16H指数:2
供职机构:清华大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇语言模型
  • 2篇中文
  • 1篇信息处理
  • 1篇语音
  • 1篇语音合成
  • 1篇识别后处理
  • 1篇手写
  • 1篇中文地址
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇自动分词
  • 1篇文本
  • 1篇文本分析
  • 1篇模式识别
  • 1篇计算机
  • 1篇计算机应用
  • 1篇汉语自动分词
  • 1篇分词
  • 1篇本分
  • 1篇OCR

机构

  • 2篇清华大学

作者

  • 2篇朱小燕
  • 2篇庄丽
  • 1篇包塔
  • 1篇龙翀

传媒

  • 2篇中文信息学报

年份

  • 1篇2006
  • 1篇2004
2 条 记 录,以下是 1-2
排序方式:
盲人用计算机软件系统中的语音和自然语言处理技术被引量:10
2004年
本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分析需要反馈的屏幕信息 ,通过语音合成平台将其内容朗读出来 ,对用户进行语音提示 ;与汉语自动分词、语言模型等自然语言处理技术的结合 ,使系统能够进行汉字和盲文的转换 ,反馈信息可以通过盲文点显器输出 ,使用户能够摸读盲文点字来获取所需要的信息 ,用户也可以采用盲文输入法进行输入 。
庄丽包塔朱小燕
关键词:计算机应用中文信息处理语音合成文本分析汉语自动分词语言模型
手写中文地址识别后处理方法的研究被引量:6
2006年
OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语言模型的粒度对识别正确率的影响,分析了基于字和基于词的语言模型各自的优点和缺点,并采用了基于词的语言模型,在此基础上提出了加权词图搜索算法。实验证明,在58269条中文手写地址的测试集上,手写地址的整体识别率由原来的28.56%上升到了75.66%,错误率下降了65.93%,大大提高了系统的性能。
龙翀庄丽朱小燕黄开竹孙俊堀田悦伸直井聡
关键词:模式识别OCR语言模型
共1页<1>
聚类工具0