庄丽
- 作品数:2 被引量:16H指数:2
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 盲人用计算机软件系统中的语音和自然语言处理技术被引量:10
- 2004年
- 本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分析需要反馈的屏幕信息 ,通过语音合成平台将其内容朗读出来 ,对用户进行语音提示 ;与汉语自动分词、语言模型等自然语言处理技术的结合 ,使系统能够进行汉字和盲文的转换 ,反馈信息可以通过盲文点显器输出 ,使用户能够摸读盲文点字来获取所需要的信息 ,用户也可以采用盲文输入法进行输入 。
- 庄丽包塔朱小燕
- 关键词:计算机应用中文信息处理语音合成文本分析汉语自动分词语言模型
- 手写中文地址识别后处理方法的研究被引量:6
- 2006年
- OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语言模型的粒度对识别正确率的影响,分析了基于字和基于词的语言模型各自的优点和缺点,并采用了基于词的语言模型,在此基础上提出了加权词图搜索算法。实验证明,在58269条中文手写地址的测试集上,手写地址的整体识别率由原来的28.56%上升到了75.66%,错误率下降了65.93%,大大提高了系统的性能。
- 龙翀庄丽朱小燕黄开竹孙俊堀田悦伸直井聡
- 关键词:模式识别OCR语言模型