您的位置: 专家智库 > >

赵红

作品数:17 被引量:28H指数:3
供职机构:闽南师范大学更多>>
发文基金:国家自然科学基金漳州市自然科学基金福建省教育厅科技项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 13篇期刊文章
  • 4篇会议论文

领域

  • 15篇自动化与计算...

主题

  • 6篇粗糙集
  • 4篇属性约简
  • 4篇自适
  • 4篇自适应
  • 4篇分治
  • 3篇名词
  • 3篇名词性
  • 3篇分治算法
  • 3篇词性
  • 2篇数据挖掘
  • 2篇最大化
  • 2篇粒计算
  • 2篇流形
  • 2篇流形学习
  • 2篇聚类
  • 1篇代价敏感学习
  • 1篇递归
  • 1篇多标记
  • 1篇映射
  • 1篇有监督学习

机构

  • 17篇闽南师范大学
  • 1篇天津大学
  • 1篇厦门大学

作者

  • 17篇赵红
  • 5篇杨文元
  • 4篇林姿琼
  • 3篇黄伟婷
  • 3篇李婵
  • 2篇祝峰
  • 1篇林耀进
  • 1篇闵帆
  • 1篇李绍滋
  • 1篇胡清华
  • 1篇徐子龙

传媒

  • 3篇南京大学学报...
  • 3篇计算机科学与...
  • 2篇郑州大学学报...
  • 1篇数据采集与处...
  • 1篇软件学报
  • 1篇计算机工程与...
  • 1篇山东大学学报...
  • 1篇智能系统学报

年份

  • 1篇2022
  • 3篇2018
  • 3篇2017
  • 5篇2016
  • 2篇2014
  • 3篇2013
17 条 记 录,以下是 1-10
排序方式:
联合依赖最大化与稀疏表示的无监督特征选择方法被引量:1
2017年
高维数据分析任务中,无监督特征选择是一项重要并具有挑战性的任务.传统的无监督特征选择算法通过保持流形结构或者特征之间相关性进行特征选择,而没有直接考虑选择特征与原始数据的依赖程度.通过考虑投影后的低维空间数据与原始数据信息之间的依赖性,提出有良好性能的特征依赖于原始数据的度量原则.首先利用最大化依赖使投影后数据尽可能保持原始数据的特征信息,据此获得投影矩阵,从而对原始数据达到降维效果.然后联合稀疏表示进行特征选择.提出一种新的无监督特征选择算法,称之为联合依赖最大化与稀疏表示的无监督特征选择方法(DMSR).在4个实际的数据集上进行实验,并与3种已有的无监督特征选择算法进行比较,在两种评价指标聚类精度和互信息上的实验结果表明,提出的DMSR算法是有效的.
李婵杨文元赵红
名词性数据的五种代价敏感属性约简算法比较
代价敏感学习是数据挖掘研究领域最具有挑战性的问题之一。属性约简是数据挖掘中重要的经典问题。代价敏感属性约简问题是对经典属性约简问题的自然扩展,已经逐渐成为研究的热点。本文通过对当前具有代表性的五种处理名词性数据的代价敏感...
林姿琼李静宽赵红
关键词:数据挖掘属性约简
动态误分类代价下代价敏感属性选择分治算法
2018年
代价敏感属性选择问题的目的是通过权衡测试代价和误分类代价,得到一个具有最小总代价的属性子集。目前,多数代价敏感属性选择方法只考虑误分类代价固定不变的情况,不能较好地解决类分布不均衡等问题。而在大规模数据集上,算法效率不理想也是代价敏感属性选择的主要问题之一。针对这些问题,以总代价最小为目标,设计了一种新的动态误分类代价机制。结合分治思想,根据数据集规模按列自适应拆分各数据集。基于动态误分类代价重新定义最小代价属性选择问题,提出了动态误分类代价下的代价敏感属性选择分治算法。通过实验表明,该算法能在提高效率的同时获得最优误分类代价,从而保证所得属性子集的总代价最小。
黄伟婷赵红
关键词:粗糙集
代价敏感属性约简的自适应分治算法
2016年
代价敏感属性约简问题作为经典属性约简问题的自然扩展,将代价引入数据,使得属性约简问题更加具有现实意义。文章基于分治思想,先按列将数据集拆分为若干个互不相交的子数据集,然后对各子数据集进行约简,并把约简后的子数据集多路合并。依次继续执行约简和合并操作,最终得到最小测试代价约简。每个子数据集的大小及子数据集的总个数自适应于各个数据集的规模而非固定不变。为验证算法的有效性,选择四个UCI标准数据集进行实验,并与其他算法进行结果对比。实验结果表明,该算法能在较短时间内获得可接受的结果,更适应实际问题的需要。
黄伟婷赵红祝峰
关键词:粗糙集粒计算属性约简
名词性数据最小测试代价属性约简的模拟退火算法
最小测试代价属性约简问题是数据挖掘和机器学习中的重要问题。最近,一个信息增益算法被设计用于解决该问题,但该算法的效果并不理想。提出一个模拟退火算法解决最小测试代价属性约简问题。算法首先随机产生一批属性子集作为原子解。然后...
徐子龙赵红闵帆
关键词:代价敏感学习模拟退火算法正区域
基于误差数据的最小代价属性选择分治算法被引量:1
2016年
最小代价属性选择是数据挖掘的重要问题之一,问题的优化目标是得到总代价最小的属性子集.在实际数据的获取过程中,测量误差是不可避免的.基于测量误差,目前已有一些相关的最小代价属性选择方法.但这些方法存在效率上的问题,特别是对大规模数据集.为解决这一关键问题,提出一种基于误差数据的最小代价属性选择分治算法.该算法将数据集按列拆分为若干个互不相交的子数据集,实现对各子数据集的求解,分而治之.对于不同规模的数据集,其子数据集的大小及总个数并非固定不变,而是根据各数据集的规模自适应设定的.该算法通过拆分数据集来降低问题规模,有效地提高了计算效率.对6个不同规模UCI数据集的实验分析表明该算法的有效性,与经典回溯算法相比,该算法的效果相当但效率至少提高了30%,更能适应实际问题的需要.
黄伟婷赵红
关键词:粗糙集
应用k-means算法实现标记分布学习被引量:8
2017年
标记分布学习是近年来提出的一种新的机器学习范式,它能很好地解决某些标记多义性的问题。现有的标记分布学习算法均利用条件概率建立参数模型,但未能充分利用特征和标记间的联系。本文考虑到特征相似的样本所对应的标记分布也应当相似,利用原型聚类的k均值算法(k-means),将训练集的样本进行聚类,提出基于kmeans算法的标记分布学习(label distribution learning based on k-means algorithm,LDLKM)。首先通过聚类算法kmeans求得每一个簇的均值向量,然后分别求得对应标记分布的均值向量。最后将测试集和训练集的均值向量间的距离作为权重,应用到对测试集标记分布的预测上。在6个公开的数据集上进行实验,并与3种已有的标记分布学习算法在5种评价指标上进行比较,实验结果表明提出的LDLKM算法是有效的。
邵东恒杨文元赵红
关键词:聚类K-MEANS多标记均值向量
基于局部邻域嵌入的无监督特征选择被引量:2
2016年
机器学习中,特征选择可以有效降低数据维度.考虑到流形学习能够保持原始数据的几何结构,l_(2,1)范数能够防止过拟合,提升模型的泛化能力,将二者结合起来可以提高特征选择的效果和效率.结合局部邻域嵌入(LNE)算法和l_(2,1)范数,提出一种新的无监督特征选择方法.其主要思想是:首先利用数据样本和邻域间的距离以及重构系数构造相似矩阵;其次构建低维空间并结合l_(2,1)范数进行稀疏回归;最后计算每个特征的重要性并选出最优特征子集.实验通过与几种典型的特征选择算法做对比,验证了所提算法的有效性.
脱倩娟赵红
关键词:流形学习
基于标签关联性的分层分类共有与固有特征选择被引量:5
2022年
在大数据时代,数据的样本数量、特征维度和类别数量都在急剧增加,且样本类别间通常存在着层次结构.如何对层次结构数据进行特征选择具有重要意义.近年来,已有相关特征选择算法提出,然而现有算法未充分利用类别的层次结构信息,且忽略了不同类节点具有共有与固有属性的特点.据此,提出了基于标签关联性的分层分类共有与固有特征选择算法.该算法利用递归正则化对层次结构的每个内部节点选择对应的固有特征,并充分利用层次结构分析标签关联性,进而利用正则化惩罚项学习各子树的共有特征.该模型不仅能够处理树结构层次化数据,也能直接处理更为复杂常见的有向无环图结构的层次化数据.在6个树结构数据集和4个有向无环图结构数据集上的实验结果,验证了该算法的有效性.
林耀进林耀进赵红李绍滋赵红
名词性数据的五种代价敏感属性约简算法比较被引量:2
2014年
代价敏感学习是数据挖掘研究领域最具有挑战性的问题之一。属性约简是数据挖掘中重要的经典问题。代价敏感属性约简问题是对经典属性约简问题的自然扩展,已经逐渐成为研究的热点。对当前具有代表性的5种处理名词性数据的代价敏感属性约简算法进行了分析和比较,总结了每种算法的各方面特性及不足之处,从而便于研究者对已有算法进行改进,并且进一步提出具有更好性能的新的约简算法,方便用户对算法的选择和使用。
林姿琼李静宽赵红
关键词:数据挖掘属性约简
共2页<12>
聚类工具0