郑泽之
- 作品数:12 被引量:52H指数:5
- 供职机构:厦门大学人文学院中国语言文学系更多>>
- 相关领域:语言文字自动化与计算机技术文化科学社会学更多>>
- 汉语文本中字母词语的使用与规范探讨
- 本文基于2002年《人民日报》的语料,对计算机自动提取出的字母词语块进行了考察分析;文章重点考察了字母词语和对应汉字词语或汉字词语和对应字母词语在专名中同现的情形,并就如何规范字母词语提出了两点思考。
- 杨建国郑泽之
- 关键词:字母词语汉语文本
- 文献传递
- 字母词语自动提取的几点分析被引量:8
- 2005年
- 字母词语大多是术语和专名,也是汉语自动分词中的未登录词,其正确识别与否不仅关系到大规模中文文本自动分词和标注,也关系到信息检索、搜索引擎、机器翻译等应用软件的质量。本文对大规模真实文本中的字母词语的使用情况进行了考察,对其自动提取进行研究,并就汉语文本字母词语自动提取的难点进行了分析,给出了一些建议。
- 郑泽之张普
- 关键词:字母词语词汇
- 汉语文本中字母词语的使用与规范探讨被引量:29
- 2005年
- 本文基于2002年《人民日报》的语料,对计算机自动提取出的字母词语块进行了考察分析;文章重点考察了字母词语和对应汉字词语或汉字词语和对应字母词语在专名中同现的情形,并就如何规范字母词语提出了两点思考。
- 杨建国郑泽之
- 关键词:字母词语专名
- 中文自动分词的一些问题
- 自动分词是中文信息处理系统的基础,有着极其广泛的实际应用。为了了解自动分词在当前实际应用中的情况,作者使用第三代智能分词系统3GWS 对2006年3月《人民日报》的300个新闻文本进行了分词词性标注加人工校对,并对分词结...
- 郑泽之
- 关键词:自动分词词性标记
- 文献传递
- 一个基于ASP的流行语投票系统被引量:6
- 2003年
- 利用ASP可以直接在HTML文件中嵌入用JavaScript或VBScript脚本语言编写的脚本命令和ADO组件,对任何与ODBC兼容的数据库或OLE DB数据源的高性能连接的优点,结合数据库结构化查询语言(SQL),构建了一个动态交互的投票系统,完成流行语的网上投票。该系统可以修改泛化应用于各种类型的网上投票或调查系统。
- 郑泽之张普
- 关键词:ASPADO投票系统WEB服务器浏览器
- 汉语真实文本字母词语考察被引量:11
- 2005年
- 借助计算机自动提取,本文对2002年《人民日报》(网络版)全年真实文本中外文字母的使用情况进行了统计考察,给出了作者对字母词语中几个问题的分析讨论,包括对外文字母在该报纸语料中使用情况的分类、字母词语的工程界定(ELWP)、单字母ELWP、含数字ELWP的分类分析和并列结构ELWP处理等。希望对字母词语的规范和中文信息处理有所裨益。
- 郑泽之张普
- 关键词:字母词语
- 基于语料库的字母词语自动提取研究
- 本文分析了字母词语的组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征,提出了规则加统计辅助的字母词语自动提取的算法。算法简单,但有效。召回率为100%,准确率在80%以上。
- 郑泽之张普杨建国
- 关键词:字母词语自然语言处理
- 文献传递
- 基于语料库的字母词语自动提取研究
- 本文分析了字母词语的组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征,提出了规则加统计辅助的字母词语自动提取的算法.算法简单,但有效.召回率为100﹪,准确率在80﹪以上.
- 郑泽之张普杨建国
- 关键词:字母词语自然语言处理语料库
- 文献传递
- 数学教材语言与语料库建设
- 数学是一门重要的基础学科,对数学语言的研究不仅有助于教材的编写,更有助于数学教学质量的提高。文章首先对数学教材语言系统进行了层次划分,对数学语言的特色从字、词、语法等角度分别进行了分析,以此作为数学教材语言语料库加工的依...
- 郑泽之卞成德
- 关键词:数学语言语料库
- 文献传递
- 基于ASP的流行语投票系统
- 2002年
- 本文介绍了我们利用ASP可以直接在HTML文件中嵌入脚本命令用JavaScript或VBScript脚本语言编写程序以及ADO组件对任何与ODBC兼容的数据库或OLE DB数据源的高性能连接并结合数据库结构化查询语言(SQL)开发的一个流行语投票系统.
- 郑泽之
- 关键词:ASP数据库浏览器源代码ADO