您的位置: 专家智库 > >

潘华山

作品数:6 被引量:12H指数:2
供职机构:昆明理工大学信息工程与自动化学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 5篇自动化与计算...

主题

  • 4篇随机场
  • 4篇条件随机场
  • 3篇命名实体识别
  • 3篇柬埔寨语
  • 2篇识别方法
  • 2篇分词
  • 2篇词性
  • 2篇词性标注
  • 1篇新闻
  • 1篇新闻文本
  • 1篇映射
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇越语
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇特征映射
  • 1篇文本分类
  • 1篇相似度
  • 1篇向量

机构

  • 6篇昆明理工大学

作者

  • 6篇潘华山
  • 4篇严馨
  • 3篇余正涛
  • 2篇郭剑毅
  • 1篇石林宾
  • 1篇王炎冰
  • 1篇周枫
  • 1篇秦雨

传媒

  • 1篇山西大学学报...
  • 1篇数据采集与处...
  • 1篇中文信息学报

年份

  • 1篇2016
  • 1篇2015
  • 3篇2014
  • 1篇2013
6 条 记 录,以下是 1-6
排序方式:
融合实体特性的柬埔寨语命名实体识别方法
针对柬埔寨语命名实体的识别问题,提出一种在采用通用特征模板的基础上融合柬语实体特性的命名实体识别方法.对于时间、数字表达式等构成较固定的实体,通过人工制定规则进行识别;对于人名、地名、组织机构名等构成较复杂的实体,利用条...
潘华山严馨余正涛郭剑毅
关键词:柬埔寨语命名实体识别条件随机场
文献传递
融合实体特性的柬埔寨语命名实体识别方法
针对柬埔寨语命名实体的识别问题,提出一种在采用通用特征模板的基础上融合柬语实体特性的命名实体识别方法,对于时间、数字表达式等构成较固定的实体,通过人工制定规则进行识别;对于人名、地名、组织机构名等构成较复杂的实体,利用条...
潘华山严馨余正涛郭剑毅
关键词:柬埔寨语命名实体识别条件随机场
基于特征映射的微博用户标签兴趣聚类方法被引量:5
2015年
针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。
秦雨余正涛王炎冰石林宾潘华山
关键词:特征映射模糊聚类语义相似度
基于层叠条件随机场的高棉语分词及词性标注方法被引量:2
2016年
针对高棉语分词及词性标注问题,提出一种基于层叠条件随机场模型的自动分词及词性标注方法。该方法由三层条件随机场模型构成:第一层是分词模型,该模型以字符簇为粒度,结合上下文信息与高棉语的构词特点构建特征模板,实现对高棉语句子的自动分词;第二层是分词结果修正模型,该模型以词语为粒度,结合上下文信息与高棉语中命名实体的构成特点构建特征模板,实现对第一层分词结果的修正;第三层是词性标注模型,该模型以词语为粒度,结合上下文信息与高棉语丰富的词缀信息构建特征模板,实现对高棉语句子中的词语进行自动标注词性。基于该模型进行开放测试实验,最终准确率为95.44%,结果表明该方法能有效解决高棉语的分词和词性标注问题。
潘华山严馨周枫余正涛郭剑毅
关键词:高棉语层叠条件随机场分词词性标注
基于条件随机场的柬埔寨语词法分析方法研究
柬埔寨语词法分析是柬埔寨语信息处理的一项基础性工作,词法分析结果的好坏将直接影响柬埔寨语信息处理上层应用的效果。由于语言之间存在的差异性,传统的汉英词法分析技术无法直接移植到柬埔寨语上。为了丰富柬埔寨语词法分析的理论研究...
潘华山
关键词:柬埔寨语分词词性标注命名实体识别条件随机场
文献传递
共1页<1>
聚类工具0