您的位置: 专家智库 > >

卢达威

作品数:10 被引量:63H指数:4
供职机构:北京大学中国语言文学系更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划中国博士后科学基金更多>>
相关领域:自动化与计算机技术语言文字文化科学更多>>

文献类型

  • 8篇期刊文章
  • 2篇会议论文

领域

  • 7篇自动化与计算...
  • 2篇语言文字
  • 1篇文化科学

主题

  • 5篇汉语
  • 4篇自足
  • 2篇教育
  • 2篇汉语篇章
  • 2篇标点
  • 1篇动词
  • 1篇对外汉语
  • 1篇对外汉语教育
  • 1篇信息处理
  • 1篇信息化
  • 1篇语句
  • 1篇语用功能
  • 1篇数学
  • 1篇数学建模
  • 1篇自动识别
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇文本信息
  • 1篇文本信息处理
  • 1篇小句

机构

  • 10篇北京语言大学
  • 4篇北京大学
  • 1篇广东外语外贸...
  • 1篇中山大学

作者

  • 10篇卢达威
  • 6篇宋柔
  • 4篇尚英
  • 1篇葛诗利
  • 1篇袁毓林
  • 1篇洪炜

传媒

  • 5篇中文信息学报
  • 2篇计算机工程与...
  • 1篇语言教学与研...
  • 1篇第九届中文教...

年份

  • 1篇2018
  • 1篇2017
  • 2篇2016
  • 1篇2015
  • 4篇2014
  • 1篇2013
10 条 记 录,以下是 1-10
排序方式:
从广义话题结构考察汉语篇章话题认知复杂度被引量:10
2014年
语言理解问题从认知的角度已有大量的研究,但针对汉语的研究却很少。由于认知实验操作复杂,不容易大规模复制,因此难以量化其结论的普遍性以及对语言事实的覆盖度。该文尝试模拟人补足汉语篇章片段中话题-说明信息的过程,建立广义话题结构认知机模型,并通过认知机对大规模汉语语料进行定量分析,考察汉语标点句的话题认知所需的记忆资源及认知局限性。用作统计特征量的广义话题结构特征有标点句的深度、话题结构内折返度、话题栈深度、话题栈折返度、搁置区使用量。统计数据可从认知行为的视角得到合理解释。该文一方面揭示了说汉语者的话题认知能力的表现和局限性,另一方面又说明了广义话题结构认知机是话题认知的合理模型。
卢达威宋柔尚英
关键词:汉语篇章
面向文本信息处理的汉语句子和小句被引量:11
2017年
小句和句子分别是篇章信息处理的基本单位和复合单位。但是汉语中,这两个概念至今未有公认的适用于语言信息处理的界定,这种状况阻碍了汉语信息处理的发展。该文将汉语的句子大致界定为自足的广义话题结构,把小句界定为基于广义话题结构的话题自足句,并提出了这样界定的语言学依据和认知依据。
宋柔葛诗利尚英卢达威
关键词:句子小句
基于远监督的语义知识资源扩展研究
语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。本文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。本文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根...
卢达威王星友袁毓林
汉语教材评估现状与思考--以数学建模思想构建教材发展梯度模型
0年来,对外汉语教学事业空前繁荣,其中成就最大的就是对外汉语教材建设(李泉,2009)。21世纪以来,尤其是2005年后,汉语教材研发更是进入迅猛发展时期。虽然其中不乏优秀教材,但仍存在大量低水平重复建设,原因之一是“缺...
卢达威尚英
关键词:对外汉语教育教材评估数学建模
汉语国际教育信息化的发展与展望被引量:34
2013年
本文讨论的汉语国际教育信息化不仅包括传统意义上的计算机辅助汉语课堂教学和多媒体教学资源开发,还包括各种汉语学习、汉语传播平台及辅助汉语教学研究的各类数字化资源建设。我们将汉语国际教育信息化发展划分为起步、全面发展、国际传播三个阶段,详述了国际汉语信息化从无到有,从小到大,从内到外的发展过程,并阐述了信息化在汉语国际教育学科建设和汉语国际教育事业传播中的作用。文章最后指出当前信息化存在的不足,并提出了今后发展的建议。
卢达威洪炜
关键词:汉语国际教育信息化教育技术
广义话题结构理论视角下话题自足句成句性研究被引量:4
2014年
话题自足句是在广义话题结构理论的基础上定义的。话题自足句的成句性是广义话题结构的重要性质之一。该文在38万字不同语体的广义话题结构语料库中对话题自足句的成句性进行了实证性调查,发现有少量话题自足句不成句,对不成句现象进行了分析、分类,并提出了使其成句的办法。这将进一步完善广义话题结构理论,并能提高使用话题自足句的应用系统的性能。
尚英宋柔卢达威
动词引出新支话题的语用功能研究被引量:1
2014年
汉语是一种话题显著的语言。汉语篇章中,同一话题会多次延续,也可能发生话题转换。该文讨论一种话题转换现象:原话题的说明中的某个成分成为新话题,但该新话题及其说明并不构成原话题的说明或原话题说明的一部分。这种话题可称为新支话题。该文对动词按照词汇语义进行分类,揭示动词将其宾语引出成为新支话题的能力所在。文章给出了《围城》中动词引出新支话题的全部实例的词汇语义分布统计。
季翠卢达威宋柔
关键词:动词
基于远监督的语义知识资源扩展研究
2016年
语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。该文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。该文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根据词的句法格式将词典的词分类,将待扩展的新词通过分类器映射到原有词典的词中,以此把词典扩展问题转化为多类分类问题。依据的原理是词典词和待扩展新词在大规模语料中句法结构的相似性。该文通过远监督的方法构造训练数据,避免大量的人工标注。训练过程结合了浅层机器学习方法和深度神经网络,取得了有意义的成果。实验结果显示,深度神经网络能够习得句法结构信息,有效提升匹配的准确率。
卢达威王星友袁毓林
基于最大熵模型的汉语标点句缺失话题自动识别初探被引量:4
2015年
本文的任务是判别标点句缺失话题是上句的主语还是宾语,将该任务作为标点句缺失话题自动识别研究的切入点。首先归纳了判别这一任务的一系列字面特征和语义特征,然后结合规则和最大熵模型,进行自动判别实验。结果显示,对特定类别动词的实验F值达到82%。对实验结果的分析说明,动词特征和语义特征对判别该任务的作用最大,规则方法和统计方法在判别任务中不能偏废,精细化的知识对判别的性能有重要影响。
卢达威宋柔
关键词:自动识别最大熵模型
汉语篇章广义话题结构的认知计算模型研究被引量:2
2018年
广义话题结构是汉语篇章中客观存在的结构形式。依据有限状态机的思想设计了识别广义话题结构的计算模型,在较大规模语料中初步检验了它的有效性,分析了该模型的空间复杂度和时间复杂度。该模型的特点是:递推控制,输出和输入以标点句为单位同步进行,无长距离回溯,有限回填,有限存储,保持词序。这些特点正是人在"话题—说明"信息的认知过程中所遵循的准则,因此该计算模型可以看作人完成这一认知过程的机械模型。
卢达威宋柔尚英
共1页<1>
聚类工具0