北京信息科技大学网络文化与数字传播北京市重点实验室开放课题(ICDD201203)
- 作品数:2 被引量:2H指数:1
- 相关作者:吕学强王玥李红莲吴云芳李卓更多>>
- 相关机构:北京信息科技大学北京拓尔思信息技术股份有限公司北京大学更多>>
- 发文基金:北京市教委科技发展计划国家自然科学基金北京信息科技大学网络文化与数字传播北京市重点实验室开放课题更多>>
- 相关领域:自动化与计算机技术更多>>
- 搜索日志中中文人名自动识别被引量:1
- 2015年
- 搜索日志中人名识别一直是日志挖掘中的一个重点和难点,其结果好坏直接关系搜索引擎的检索效率和准确率。由于分析了长文本中人名识别方法在搜索日志中使用存在很多困难与不足,因而该文提出了一种在搜索日志中识别中文人名的方法。该方法将搜索日志中人名内部用字的概率特征引入条件随机场,再根据搜索日志的特点计算人名可信度提取搜索日志中的中文人名。在搜狗查询日志上进行实验,正确率平均达到了81.97%、召回率平均达到了85.81%,综合指标F值平均达到了83.79%。
- 王玥吕学强李卓舒燕
- 关键词:人名识别搜索日志条件随机场
- 融合词义信息的中文短语句法分析被引量:1
- 2014年
- 针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法。首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的词性区分其不同的词义。在宾州中文树库(CTB)的实验结果表明,正确率为80.30%,召回率为78.12%,F值为79.19%。相对于没有进行词性消歧的系统,该方法有效提高了短语句法分析的性能。
- 耿立飞李红莲吕学强吴云芳
- 关键词:汉语句法分析同义词词林知网一词多义词义消歧