您的位置: 专家智库 > >

北京大学信息科学技术学院计算语言学研究所

作品数:354 被引量:2,857H指数:30
相关作者:俞士汶朱学锋段慧明刘扬于江生更多>>
相关机构:南开大学文学院中国语言文学系南开大学文学院郑州大学信息工程学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字文化科学自然科学总论更多>>

文献类型

  • 218篇期刊文章
  • 135篇会议论文

领域

  • 220篇自动化与计算...
  • 133篇语言文字
  • 14篇文化科学
  • 3篇自然科学总论
  • 2篇经济管理
  • 2篇一般工业技术
  • 2篇理学
  • 1篇机械工程
  • 1篇电子电信
  • 1篇交通运输工程
  • 1篇医药卫生
  • 1篇社会学

主题

  • 86篇汉语
  • 57篇中文
  • 50篇信息处理
  • 49篇自然语言
  • 45篇语言处理
  • 44篇自然语言处理
  • 40篇中文信息
  • 40篇中文信息处理
  • 32篇知识库
  • 29篇语义
  • 27篇语料
  • 27篇语料库
  • 27篇语言学
  • 25篇计算机
  • 25篇翻译
  • 23篇现代汉语
  • 22篇机器翻译
  • 21篇计算机应用
  • 19篇语词
  • 19篇语言知识库

机构

  • 353篇北京大学
  • 9篇北京信息科技...
  • 9篇南开大学
  • 8篇郑州大学
  • 7篇清华大学
  • 6篇哈尔滨工业大...
  • 6篇北京拓尔思信...
  • 5篇中国科学技术...
  • 4篇北京语言大学
  • 4篇南京师范大学
  • 4篇山东中医药大...
  • 4篇语言文字应用...
  • 3篇东北大学
  • 3篇北京联合大学
  • 3篇鲁东大学
  • 3篇华中师范大学
  • 3篇北京理工大学
  • 3篇教育部
  • 3篇中国科学院
  • 3篇香港理工大学

作者

  • 107篇俞士汶
  • 34篇穗志方
  • 32篇王厚峰
  • 32篇朱学锋
  • 30篇吴云芳
  • 28篇常宝宝
  • 25篇段慧明
  • 24篇刘云
  • 19篇刘扬
  • 18篇昝红英
  • 16篇孙斌
  • 15篇吕学强
  • 15篇彭爽
  • 12篇苏祺
  • 12篇刘耀
  • 12篇李素建
  • 10篇王惠
  • 9篇金晓艳
  • 9篇张仰森
  • 7篇贾玉祥

传媒

  • 65篇中文信息学报
  • 17篇语言文字应用
  • 10篇术语标准化与...
  • 8篇第四届全国学...
  • 7篇计算机学报
  • 6篇辞书研究
  • 6篇全国第八届计...
  • 6篇全国第八届计...
  • 5篇软件学报
  • 5篇第二届中日自...
  • 5篇第一届全国信...
  • 5篇NCIRCS...
  • 4篇当代语言学
  • 4篇广西师范大学...
  • 4篇计算机工程与...
  • 4篇语言科学
  • 3篇计算机研究与...
  • 3篇外语电化教学
  • 3篇小型微型计算...
  • 3篇第三届学术计...

年份

  • 1篇2022
  • 1篇2021
  • 2篇2020
  • 2篇2019
  • 6篇2018
  • 6篇2017
  • 4篇2016
  • 8篇2015
  • 12篇2014
  • 4篇2013
  • 4篇2012
  • 10篇2011
  • 16篇2010
  • 14篇2009
  • 30篇2008
  • 22篇2007
  • 32篇2006
  • 49篇2005
  • 35篇2004
  • 38篇2003
354 条 记 录,以下是 1-10
排序方式:
关键词自动标引系统的知识库建设
关键词对于文本聚类/分类、信息检索等任务都具有非常重要的意义。然而,其自动标引技术的实现离不开知识库的支持。本文首先列出了关键词自动标引系统的重要组成部分,并对知识库进行了详细介绍,并且列出了与一般专家系统知识库的区别。...
李素建辛乘胜王厚峰俞士汶
关键词:自动标引文本聚类知识库建设
文献传递
基于统计的翻译等价词对抽取研究被引量:16
2003年
对利用汉英双语语料进行翻译等价词对抽取进行了探索 .对不同的词对关联度量方法进行了对比 ,考察了词性信息、多词翻译单元识别对翻译等价词对抽取结果所可能产生的改进以及负面影响 .
常宝宝
关键词:机器翻译双语语料库知识获取
内部紧密度和边缘自由度相结合的符号串单元度计算
当今社会,新词层出不穷,自动词语提取日益变得重要.本文提出了一种基于内外部信息的词语单元度计算公式.该方法利用词串每个符号之间的内部节点的结合紧密度以及边界的左右两个节点的边界使用自由度来估算词语的单元度.实验表明该算法...
谌贻荣
文献传递网络资源链接
《现代汉语语法信息词典》在计算机辅助语言教学中的应用
本文简要介绍了《现代汉语语法信息词典》,论述了其在计算机辅助语言教学中应用的可行性,以及在对外汉语教学和母语教学中的具体应用。
亢世勇朱学锋俞士汶
关键词:对外汉语教学母语教学
计算语言学与外语教学被引量:8
2006年
本文概要介绍计算语言学的基本概念及计算语言学对外语教学的意义和作用,希望为促进外语教学提供一些新的想法,同时也希望吸引更多外语教学研究者关注计算语言学,共同推动人类语言技术的进步。
俞士汶柏晓静
关键词:计算语言学外语教学语料库教育科技
基于层次聚类的网络新闻热点发现
网络新闻热点发现的主要目的是从海量互联网数据中发现人们感兴趣的热点话题。在已有研究中,主要采用基于单篇报道的增量聚类方法。本文则提出一套针对单日新闻进行层次聚类,发现每日热点,再对热点进行增量聚类的框架。在对每日新闻的层...
彭楠赟王厚峰凌晨添
关键词:特征选取层次聚类
文献传递
面向EBMT的汉语单句谓语中心词识别研究被引量:24
1998年
在基于实例的汉英机器翻译(EBMT)系统中,为计算语句相似度,需要对句子进行适当的分析。本文首先提出了一种折中的汉语句子分析方法———骨架依存分析法,通过确定谓语中心词来把握句子的整体结构,然后,提出了一种根据汉英例句集中英语例句的谓语中心词来识别相应的汉语例句的谓语中心词的策略。
穗志方俞士汶
关键词:机器翻译汉语句子汉英机器翻译
旁指代词的连接功能考察被引量:1
2006年
本文对旁指代词“另”和“另外”的连接功能进行了详细的分析,并简要地探讨了旁指代词的连接功能在英语中的表现形式。
金晓艳彭爽
关键词:旁指代词
结合RNN和CNN层次化网络的中文文本情感分类被引量:21
2018年
提出一种多层网络H-RNN-CNN,用于处理中文文本情感分类任务。将文本按句子进行划分,引入句子层作为中间层,以改善文本过长带来的信息丢失等问题。模型中使用循环神经网络建模词语序列和句子序列,并通过卷积神经网络识别跨语句的信息。探讨循环神经网络变种和不同输入向量对模型的影响。实验结果表明,所提方法在多类数据集上都取得良好的效果。
罗帆王厚峰
关键词:循环神经网络
人民日报标注语料的索引方法研究
本文对人民日报标注语料的索引方法进行了研究,提出一种词语和标记的二元混合索引的方法,在可以同时检索词语和标记串的基础上,有效地提高了检索效率。
王洪俊施水才俞士汶肖诗斌
关键词:混合索引
文献传递
共36页<12345678910>
聚类工具0