章云帆
- 作品数:4 被引量:65H指数:2
- 供职机构:语言文字应用研究所更多>>
- 发文基金:国家语委科研项目国家高技术研究发展计划更多>>
- 相关领域:语言文字哲学宗教更多>>
- 语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》被引量:14
- 2003年
- 本文就制定《信息处理用现代汉语词类标记集规范》阐述我们对于规范问题的看法和做法。规范不是强制的 ,只规范加工结果 ,不规范加工过程。《规范》研制的目的在于为中文信息处理研究提供一套可以作为国家规范的现代汉语词类标记集体系 ,以便各个中文信息处理系统能够使用规范统一的词类标记集。这个《规范》试图解决词类标记的统一问题 ,该《规范》的特点是 :继承性 ,单功能性 ,通用性和可扩充性。本文还主要讨论了关于研制规范的一些原则性问题和小类标记问题 ,最后给出基于《规范》的词性标注在真实语料中的覆盖实验数据。
- 靳光瑾郭曙纶肖航章云帆
- 关键词:语料库
- “说道”和“说到”
- 2009年
- "说道"即"说"的意思,是同义复合词,后面多是引进的人物说的话,还有"说及、言及"的意思;"说到"的一个意思是"说",另一个意思是"说及、言及"。二者都有"说及、言及"的意思,在实际使用中应给以注意。
- 章云帆
- 关键词:说道说到
- 现代汉语语料库建设及深加工被引量:51
- 2005年
- 靳光瑾肖航富丽章云帆
- 关键词:语料库建设现代汉语深加工
- 信息处理用现代汉语词类标记规范
- 本标准规定了信息处理中现代汉语词类及其他切分单位的标记代码。 本标准适用于汉语信息处理,也可供现代汉语教学与研究参考。
- 靳光瑾肖航郭曙伦富丽章云帆于桂英陈玉泉王立
- 关键词:数据传输中文代码语言
- 文献传递