国家自然科学基金(61170131)
- 作品数:19 被引量:84H指数:5
- 相关作者:吴昊黄发良张师超吴林雷聪更多>>
- 相关机构:广西师范大学柳州铁道职业技术学院福建师范大学更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学理学经济管理更多>>
- 我国各省规模以上工业企业发展水平的研究
- 2013年
- 近年来,我国工业企业增长方式有所转变,规模以上工业企业发展水平稳步提高,但各地区工业企业的发展仍不平衡.依据2011年各地区规模以上工业企业的经济和效益指标统计数据,运用因子分析与指标变量聚类分析等方法,对各地区工业企业的发展状况及层次进行分析,并与我国目前经济区域进行比较.结果发现大部分地区的经济发展是与其所在地区的经济发展水平基本一致,呈现东高、西低、中中的格局.这为各地区工业企业今后发展制定方针政策提供了一定的理论参考.
- 吴昊
- 关键词:聚类分析
- 加权壳近邻填充数学模型被引量:4
- 2013年
- 提出加权壳近邻填充(WSNI)缺失数据数学模型,充分利用壳近邻填充选取近邻数据的特性,侧重于被重复选择的近邻点,有效提高了填充效果.实验结果表明,提出的加权壳近邻填充数学模型比k近邻填充和壳近邻填充的效果好.
- 吴昊唐振军
- 关键词:缺失数据
- 基于异构代价敏感决策树的分类器算法被引量:10
- 2013年
- 代价敏感学习方法常常假设不同类型的代价能够被转换成统一单位的同种代价,显然构建适当的代价敏感属性选择因子是个挑战。设计了一种新的异构代价敏感决策树分类器算法,该算法充分考虑了不同代价在分裂属性选择中的作用,构建了一种基于异构代价的分裂属性选择模型,设计了基于代价敏感的剪枝标准。实验结果表明,该方法处理代价机制和属性信息的异质性比现有方法更有效。
- 阮晓宏黄小猛袁鼎荣段巧灵
- 关键词:决策树分类代价敏感学习
- 基于多目标优化的网络社区发现方法被引量:30
- 2013年
- 社区发现是复杂网络挖掘中的重要任务之一,在恐怖组织识别、蛋白质功能预测、舆情分析等方面具有重要的理论和应用价值.但是,现有的社区质量评判指标具有数据依赖性与耦合关联性,而且基于单一评判指标优化的网络社区发现算法有很大的局限性.针对这些问题,将网络社区发现问题形式化为多目标优化问题,提出了一种基于多目标粒子群优化的网络社区发现算法MOCD-PSO,它选取模块度Q、最小最大割MinMaxCut与轮廓(silhouette)这3个指标进行综合寻优.实验结果表明,MOCD-PSO算法具有较好的收敛性,能够发现分布均匀且分散度较高的Pareto最优网络社区结构集,并且无论与单目标优化方法(GN与GA-Net)相比较,还是与多目标优化算法(MOGANet与SCAH-MOHSA)相比较,MOCD-PSO算法都能在无先验信息的条件下挖掘出更高质量的网络社区.
- 黄发良张师超朱晓峰
- 关键词:复杂网络多目标粒子群优化
- 基于数据挖掘的个性化推荐
- 2013年
- 为了将网站访问者转化为消费者,设计一种电子商务网站个性化推荐方法.该方法采用数据挖掘技术获取客户的个性化特性,从而产生个性化产品推荐建议或决策.实验表明,提出的方法是有效可行的.
- 吴昊
- 关键词:电子商务数据挖掘个性化推荐
- 基于mutual KNN和标准化的谱聚类算法被引量:4
- 2019年
- 在谱聚类算法中,利用K近邻算法构建拉普拉斯矩阵时,会造成聚类的算法复杂度提高和聚类结果不佳的问题,为此提出一种基于mutual KNN和标准化矩阵的谱聚类算法,能有效提升聚类划分的执行效率和准确率。将提出算法与多组对比算法在多个数据集上进行实验比较,比较结果表明,多个评测指标(如聚类准确率、聚类的标准化互信息、方差等)全面验证了该算法能有效提高聚类性能和执行效率,适用于高维大数据的聚类分析。
- 谭马龙文国秋童涛吴林杜婷婷
- 关键词:拉普拉斯矩阵谱聚类
- 基于核函数的低秩非线性属性选择算法被引量:1
- 2019年
- 高维的数据之间除了有线性关系之外,还有非线性的关系,为此提出一种基于核函数的低秩非线性属性选择算法。通过核函数把数据的每个属性都映射到高维空间,在高维空间中表示出属性之间的非线性关系;通过低秩约束排除噪声的干扰,利用高维空间中数据属性对应的稀疏正则化因子进行属性选择。核函数映射可以找出数据属性之间的非线性关系,低秩约束相当于对高维数据的全局结构进行子空间学习。该算法是一种嵌入了低秩结构的非线性属性选择算法。实验结果表明,该算法比其它的属性选择算法具有更好的效果。
- 李佳烨张乐园雷聪
- 关键词:核函数子空间学习
- 一种高效的K值自适应的SA-KNN算法被引量:6
- 2015年
- 传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性。为此,提出引入稀疏学习理论,利用训练样本重构测试样本的方法,重构过程使用了样本间的相关性,也用到局部保持投影LPP保持数据结构不变,同时引入l2,1范数用于去除噪声样本的方法来寻找投影变换矩阵W,进而利用W确定KNN算法中K值的SA-KNN算法。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN分类算法和Entropy-KNN算法有更高的分类准确度。
- 孙可龚永红邓振云
- 关键词:K近邻分类局部保持投影
- 肿瘤基因图集(TCGA)中恶性胶质瘤数据的挖掘被引量:3
- 2012年
- 本文以非肿瘤样本为参照物,采用甲基化数据的距离相关性将病人分成两类,并分析和比较这两类病人,得到了一些潜在有意义的结论。
- 严小卫田强张师超
- 关键词:恶性胶质瘤甲基化
- 基于局部协方差矩阵的谱聚类算法被引量:7
- 2019年
- 针对传统谱聚类算法没有解决簇划分过程中,簇间交叉区域样本点对聚类效果有影响这个问题,提出一种基于局部协方差矩阵的谱聚类算法,主要介绍了一种新的计算样本之间相似度亲和矩阵的方法,即通过计算样本点之间的欧氏距离划分出小子集,计算小子集的协方差,通过设定阈值剔除交叉点,由剩下的点构造相似矩阵,对相似矩阵进行特征值分解,用经典的k -means算法对由特征向量组成的矩阵聚类。通过在Control等真实数据集上的实验结果表明,该算法在聚类准确率、标准互信息等指标上比较对比算法获得更优秀的效果。
- 杜婷婷文国秋吴林童涛谭马龙
- 关键词:谱聚类协方差矩阵相似矩阵