吴杰
- 作品数:5 被引量:9H指数:2
- 供职机构:中国社会科学院语言研究所更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 汉语语文词典的词条结构模型被引量:4
- 2009年
- 词典可以认为是一种用非结构化形式表现的、具有半结构化特征的语言数据。词典的编纂、查考、典藏以及语言研究和语言工程,常常需要对文本形式的词典及其词条内容进行结构化处理。本文尝试用数据建模的方法对汉语词典及其词条进行形式化描述,采用XML Schema定义词条结构,根据词条结构的数据模型对词典文本作XML标注,描述词条中蕴含的各种语言学信息,为辞书编纂、词汇研究和语言工程提供数据资源。
- 傅爱平吴杰李芸
- 关键词:XML
- 人机交互式的汉语辞书编纂系统被引量:5
- 2013年
- 人机交互式的汉语辞书编纂系统是一个计算机网络应用系统,在互联网上为汉语语文辞书的编纂提供协同工作环境。这个系统以语言数据资源的建设和应用为基础,借鉴语言信息处理的相关研究成果,融入汉语语文辞书编纂的知识和经验,用人机交互方式管理词典编纂的工作流程,包括新编词典立项、词条结构设置、选词立目、词条编写修改和审定、词条编审历程的保留与追溯、辅助词典成书等,同时也集成了多个语料库、已有辞书和词表,提供给词典编者作为参考。文章简要论述这个系统的设计思想、主要功能和关键技术。
- 傅爱平吴杰张弘李芸
- 汉语辞书辅助编纂系统的功能设计
- 2010年
- 汉语辞书辅助编纂系统是一个正在开发的计算机应用软件,用于汉语语文辞书的编纂。目的是改变以往全部由手工操作的工作方式,提高词典编纂的质量、效率和科学性。本文简要介绍这个系统的几项功能:用XML Schema支持下的辞书结构模型描述多部语文辞书的文本结构;根据新编词典的需要定制词典的词条结构;有选择地复制词条内容;保留词条编写和修改的记录,并根据需要追溯词条的编写过程;在词典编写过程中积累词汇资料数据;词条内容的规范表达;编纂系统的数据统计;以及词典编纂资料的收集。
- 吴杰傅爱平
- 以成语为范围的词汇支援系统
- 1993年
- 这篇论文介绍有关调用汉语成语的词汇支援系统。人们给系统一个话题后,该系统将针对该话题提供一批成语来帮助人们选择和寻找词语。文章还介绍了成语的知识表达方法和自动的语义检索过程。
- 林联合吴杰吴亮
- 关键词:汉语成语
- 从辞书数据建模到辞书辅助编纂
- 本文以词典数据库的建立和管理、以及词条结构定制为例,介绍辞书数据结构模式(XML Schema)在辞书辅助编纂系统中的应用。在辞书辅助编纂系统的任务流程中需要多部词典参与,词典是这个系统最基本的数据资源。文本形式的词典是...
- 吴杰傅爱平
- 关键词:数据建模
- 文献传递