您的位置: 专家智库 > >

王建新

作品数:2 被引量:19H指数:2
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇多模态
  • 1篇数据表示
  • 1篇无监督学习
  • 1篇关联性分析
  • 1篇大数据

机构

  • 2篇山西大学

作者

  • 2篇钱宇华
  • 2篇王建新
  • 1篇成红红

传媒

  • 1篇数据采集与处...
  • 1篇计算机科学

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
符号数据的无监督学习:一种空间变换方法被引量:2
2016年
近年来符号数据的无监督学习在模式识别、机器学习、数据挖掘和知识发现等诸多领域扮演着越来越重要的角色。然而现有的针对符号数据的聚类算法(经典的K-modes系列算法等),相比数值型数据的聚类算法,在性能方面仍然有很大的提升空间。其根本原因在于符号数据缺乏类似数值数据那样清晰的空间结构。为了能够有效地发掘符号数据内在的空间结构,采用了一种全新的数据表示方案:空间变换方法。该方法将符号数据映射到相应的由原来的属性组成的新的维度的欧氏空间中。在这一框架的基础上,为了找到符号数据更有代表性的模式,结合CarreiraPerpin提出的K-modes算法进行无监督学习。在9个常用的UCI符号数据集上进行了测试,与传统的符号数据聚类算法进行了实验比较,结果表明几乎在所有的数据集上提出的方法都是更加有效的。
王建新钱宇华
大数据关联关系度量研究综述被引量:17
2015年
大数据关联性分析是大数据挖掘的基础,一个好的关联性度量是实施关联分析的关键。本文首先指出大数据时代关联度量面临的挑战和研究现状,从关联关系度量的构造角度出发,对现有的关联关系度量进行整理,归纳总结了这些关联关系的性质和适用条件。在回顾关联度量发展历程的基础上,结合大数据时代关联关系的特点,提出构造关联度量可能满足的条件。最后针对多模态数据关联关系度量的若干问题进行探讨和梳理,从3个角度出发,提出应对多模态数据空间转换的挑战,以引起对该领域更深入的思考与研究工作,从而促进大数据挖掘工作的进展。
钱宇华成红红梁新彦王建新
关键词:大数据关联性分析
共1页<1>
聚类工具0