公共文化服务平台

2025年1月8日星期三

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

龙翀: 作品数：8 被引量：10H指数：2; 供职机构：清华大学更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术文化科学更多>>

合作作者

朱小燕清华大学信息科学技术学院清华信...
庄丽清华大学
张宏涛清华大学信息科学技术学院清华信...
刘铮北京工业大学附属中学
湛文红教育部考试中心

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
2篇学位论文

领域

2篇自动化与计算...

主题

3篇语言模型
3篇OCR
2篇识别后处理
2篇中文
1篇多粒度
1篇信息处理
1篇信息度量
1篇信息距离
1篇印刷体
1篇印刷体汉字
1篇手写
1篇统计语言模型
1篇中文地址
1篇中文信息
1篇中文信息处理
1篇文本挖掘
1篇粒度
1篇模式识别
1篇汉字识别
1篇REVIEW

机构

4篇清华大学

作者

4篇龙翀
2篇朱小燕
1篇庄丽
1篇张宏涛

传媒

2篇中文信息学报

年份

1篇2010
1篇2009
1篇2007
1篇2006

共 8 条记录，以下是 1-4

全选清除导出

排序方式：

手写中文地址识别后处理方法的研究被引量：6: 2006年; OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语言模型的粒度对识别正确率的影响,分析了基于字和基于词的语言模型各自的优点和缺点,并采用了基于词的语言模型,在此基础上提出了加权词图搜索算法。实验证明,在58269条中文手写地址的测试集上,手写地址的整体识别率由原来的28.56%上升到了75.66%,错误率下降了65.93%,大大提高了系统的性能。; 龙翀庄丽朱小燕黄开竹孙俊堀田悦伸直井聡; 关键词：模式识别 OCR 语言模型

基于多粒度的统计语言模型的研究以及在OCR后处理中的应用: 龙翀; 关键词：统计语言模型粒度 OCR GRANULARITY OCR

多个对象间信息度量的研究及应用: 龙翀; 关键词：信息距离文本挖掘

印刷体汉字识别后处理方法的研究被引量：5: 2009年; 高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的基本表示单位,模型的复杂度大大降低,从而数据稀疏问题得到很大程度上缓解。实验证明,采用基于字节的语言模型的后处理系统能够以极少的时空开销获取很好的识别性能。在有部分分割错误的测试集上,正确率从88.67%提高到了98.32%,错误率下降了85.18%,运行速度较基于字以及基于词的系统有了大幅的提升,提高了后处理系统的综合性能;与目前常用的基于词的语言模型后处理系统相比,新系统能够节省95%的运行时间和98%的内存资源,但系统识别率仅降低了1.11%。; 张宏涛龙翀朱小燕孙俊; 关键词：中文信息处理汉字识别 OCR 语言模型

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张