您的位置: 专家智库 > >

北京市自然科学基金(KZ200811232019)

作品数:9 被引量:84H指数:5
相关作者:张仰森孙超张桂琴王俊生施运梅更多>>
相关机构:北京信息科技大学中国科学院自动化研究所更多>>
发文基金:北京市自然科学基金国家自然科学基金北京市属高等学校人才强教计划资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 9篇自动化与计算...

主题

  • 2篇语料
  • 2篇中文
  • 2篇最大熵
  • 2篇最大熵模型
  • 2篇《知网》
  • 1篇电子词典
  • 1篇信息处理
  • 1篇引擎
  • 1篇语句相似度
  • 1篇语块
  • 1篇语料库
  • 1篇语言
  • 1篇语言处理
  • 1篇语义知识
  • 1篇语义知识库
  • 1篇知识
  • 1篇知识获取
  • 1篇知识获取方法
  • 1篇知识库
  • 1篇知识融合

机构

  • 9篇北京信息科技...
  • 1篇中国科学院自...

作者

  • 9篇张仰森
  • 2篇孙超
  • 1篇乔剑敏
  • 1篇施运梅
  • 1篇刘安宇
  • 1篇郭充
  • 1篇张桂琴
  • 1篇王俊生

传媒

  • 2篇计算机工程
  • 2篇计算机工程与...
  • 2篇计算机科学
  • 1篇中文信息学报
  • 1篇计算机技术与...
  • 1篇北京信息科技...

年份

  • 1篇2011
  • 5篇2010
  • 3篇2009
9 条 记 录,以下是 1-9
排序方式:
智能化立体仓库入库货位分配的综合优化算法被引量:14
2010年
智能化立体仓库对现代企业提高仓储利用率和生产效率具有重要作用。介绍了秦皇岛港务集团公司立体仓库管理系统中仓库货位计算机分配的智能化算法,该算法充分考虑了重量均匀分布、就近货位选择、备件品种均匀分布、备件使用率、货位空置时间等因素,根据整个仓库的当前状态计算入库货位,为入库货位的选择提供辅助决策。实际项目运行表明,所提的综合货位优化分配算法是有效的,对提高仓库的安全性、入库工作效率等具有非常重要的意义。
张仰森刘安宇
词义标注一致性检验系统的设计与实现被引量:3
2010年
词义消歧是自然语言处理领域的一个重要研究课题。词义标注的一致性将直接影响语料库的建设质量,进而直接或间接影响到其相关的应用领域。由于语言本身的复杂性与发展性以及算法设计的难点和缺陷,目前各种词义标注的算法与模型还不能百分之百正确地标注词义,即不能保证词义消歧的正确性与一致性。而人工校验在时间、人力方面的投入是个难题。该文在对《人民日报》语料、语句相似度算法和语义资源《知网》研究的基础上,提出了对《人民日报》语料词义标注进行一致性检验的方法。实验结果表明,此方法是有效的。
乔剑敏张仰森
关键词:计算机应用中文信息处理词义标注《知网》语料语句相似度
面向综合语言知识库的知识融合与获取研究被引量:2
2010年
针对如何填补语料库和电子词典的数据结构之间的差异,如何将语料库与电子词典融合到综合语言知识库系统中,并进行多语言知识资源之间的交叉参考等问题,提出并实现了一种便捷的语言知识查阅方法。该方法以语料库为基础,利用鼠标左键点击完成从电子词典中获取相关知识的操作。通过在北大语料检索工具上的实验,使得用户在浏览语料的同时即可获取电子词典中相应的词汇知识,实现了语料库和词典间便捷、准确的对应和参照,体现了此方法的优势。
孙超张仰森
关键词:语料库电子词典自然语言处理知识获取方法
基于《知网》义原搭配的中文文本语义级自动查错研究被引量:12
2010年
语义级的自动查错一直是汉语文本自动校对技术的难点。针对汉语文本中的语义搭配错误,提出了一种基于《知网》义原搭配的有效的自动查错方法,主要包括语义知识库的构建和自动查错算法。语义知识库的构建分为两步:①根据规则从训练语料中统计出大量的动词与名词之间的二元搭配组合,并利用互信息等因素筛选记录;②利用《知网》对词语义项的义原描述(对于动词抽取其义项中的主义原,名词抽取其义项中的主义原和常见的4个辅助义原),将动词与名词的二元搭配组合转变为义原之间相互制约的多元组合。在语义知识库的基础上设计相应的自动查错算法。实验结果显示,该方法的召回率为35%,精确率为82.3%,具有较好的应用前景。
郭充张仰森
关键词:互信息知网语义知识库
基于Hadoop的分布式搜索引擎关键技术被引量:16
2011年
实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处理。通过实验对比了集中式搜索引擎和分布式搜索引擎,结果表明了基于hadoop的分布式搜索引擎在处理数据方面强劲的优势。
王俊生施运梅张仰森
关键词:HADOOP分布式搜索引擎MAP/REDUCE索引表分词
利用浅层句法分析提取特征的词义消歧被引量:1
2010年
针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北京大学计算语言研究所的现代汉语基本标注语料库为基础,选取了44个多义词,通过使用最大熵消歧模型进行训练和预测实验,准确率达到了78.71%。
孙超张仰森
关键词:词义消歧浅层句法分析语块特征提取最大熵模型
基于最大熵模型的汉语词义消歧与标注方法被引量:9
2009年
分析最大熵模型开源代码的原理和各参数的意义,采用频次和平均互信息相结合特征筛选和过滤方法,用Delphi语言编程实现汉语词义消歧的最大熵模型,运用GIS(Generalized Iterative Scaling)算法计算模型的参数。结合一些语言知识规则解决训练语料的数据稀疏问题,所实现的汉语词义消歧与标注系统,对800多个多义词进行词义标注,取得了较好的标注正确率。
张仰森
关键词:最大熵模型
汉语统计语言模型训练样本容量的定量化度量被引量:1
2009年
统计语言模型的参数训练是语言建模的关键,选择多大的训练样本就能够达到建模的参数估计误差要求,是语言建模理论关心的问题之一。应用数理统计理论对汉语统计语言模型的训练语料样本容量进行了定量化描述,给出了汉语n-gram模型训练样本容量下界的估算方法及量化估算公式,可根据模型参数估计的误差要求计算出模型训练所需的样本容量。
张仰森
直线往复式轨道自动导引车智能调度算法被引量:28
2009年
以某自动化立体仓库系统为例,介绍运行于单条轨道上的2辆直线往复式轨道自动导引车(RGV)的智能调度算法和避碰防撞算法,解决2辆RGV的相向碰撞和同向追尾问题,在不相撞的前提下合理高效地向2辆RGV分配任务。实际应用结果表明,该算法能有效提高工作效率。
张桂琴张仰森
关键词:自动化立体仓库避碰算法
共1页<1>
聚类工具0