您的位置: 专家智库 > >

王晓玉

作品数:5 被引量:29H指数:2
供职机构:南京师范大学文学院更多>>
发文基金:国家社会科学基金江苏省社会科学基金教育部人文社会科学研究基金更多>>
相关领域:语言文字自动化与计算机技术哲学宗教文化科学更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 2篇语言文字
  • 1篇哲学宗教
  • 1篇自动化与计算...
  • 1篇文化科学

主题

  • 4篇中古
  • 3篇语料
  • 3篇语料库
  • 3篇中古汉语
  • 3篇古汉语
  • 3篇汉语
  • 1篇虚化
  • 1篇语料库建设
  • 1篇深加工
  • 1篇平行语料
  • 1篇平行语料库
  • 1篇自动分词
  • 1篇古籍
  • 1篇古籍电子化
  • 1篇法苑珠林
  • 1篇分词
  • 1篇副词
  • 1篇S模
  • 1篇S模型
  • 1篇《法苑珠林》

机构

  • 5篇南京师范大学
  • 1篇郑州大学

作者

  • 5篇王晓玉
  • 1篇赵家栋
  • 1篇李斌

传媒

  • 1篇中国语文
  • 1篇辞书研究
  • 1篇古籍整理研究...
  • 1篇南京师范大学...
  • 1篇数据分析与知...

年份

  • 1篇2019
  • 2篇2018
  • 2篇2017
5 条 记 录,以下是 1-5
排序方式:
中古“X用”类副词的产生与发展被引量:1
2019年
中古时期"用"经常与副词搭配使用,形成"X用"组合,在句中做状语,这一组合在译经文献中尤其常见,然而目前研究甚少。董志翘、蔡镜浩(1994)将"甚用"解释为并列式甚度副词,该解释并不确切;方一新、高列过(2012)将"甚用"等解释为程度副词,太过笼统。本文深入考察中古文献,发现"用"主要和程度副词搭配,同时也可以和时间、范围、情状等副词搭配使用,在这些组合中"用"发生了虚化,具有副词词尾的性质,这些组合也具有了成为词的资格。
王晓玉
关键词:副词词尾虚化
基于CRFs和词典信息的中古汉语自动分词被引量:20
2017年
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词不一致研究主要针对双字词,因此三字以上词语(多字词)的识别效果稍有欠缺。【结论】在有效提高分词一致性的前提下,字符分类、词典标记特征能够有效提高中古汉语CRFs分词的精确度。同时本文提出的中古汉语分词系统可以服务于中古时期多类别的汉语语料。
王晓玉李斌
关键词:中古汉语自动分词
中古汉语语料库的设计与实现被引量:7
2017年
文章探索了中古汉语研究型语料库的设计原则和具体构建方法。首先,明确了中古汉语语料库设计的总原则,并针对语料库构建过程中的每一个环节设立了分原则;其次,把语料库构建过程分为语料选取、语料加工、语料库管理及检索系统研发三大块,勾勒出了每一模块构建的具体流程和方法,并对构建环节中遇到的具体问题及对策做出了阐述。文章是对中古汉语研究型语料库构建过程和方法的总结,可以辅助人们更加深入地了解该语料库的总体概况和使用方法,对语料库理论的发展也可起到一定的补充作用。
王晓玉
关键词:语料库建设中古汉语
佛教类书与所出原经深加工平行语料库建设与研究——以《经律异相》《法苑珠林》为样本被引量:1
2018年
"佛教类书与所出原经深加工平行语料库"综合运用了汉语史深加工语料库和平行语料库的建设理论和方法,选取《经律异相》《法苑珠林》与其所出原经文本语料作为研究对象,建立了多经文间的文本平行对应关系。该实践不仅对所收语料进行了分词、标注、释义等深加工,也构建了语料间的多层级平行对比关系,使语料库平台具备多项检索功能,拓宽了深加工汉语史语料库的构建模式,为文献语言研究、特别是汉语史研究以及佛教文化史研究提供重要的语料库资源。
王晓玉赵家栋
关键词:平行语料库深加工
论中古语料库古籍电子化相关问题被引量:1
2018年
本文基于中古语料库的构建实践,对其中涉及到的古籍电子化相关问题进行了探讨研究。首先,辨别古籍的版本和古籍中的佚文、古注,厘清古籍类语料的选定细节;其次,对古籍中的缺字、繁简字、古今字、异体字、新旧字形、未收字等用字问题分类探讨,制定古籍数字化用字操作规范;最后,构建、升级中古义项库,为古籍深加工提供权威工具。本文直接服务于中古语料库的构建,对古籍数字化等实践也具有一定指导意义。
王晓玉
关键词:中古汉语语料库古籍电子化
共1页<1>
聚类工具0