黄哲学
- 作品数:81 被引量:328H指数:7
- 供职机构:深圳大学计算机与软件学院更多>>
- 发文基金:国家自然科学基金中国博士后科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电子电信更多>>
- 提升企业绩效的新途径:选择创新型供应商
- 2008年
- 首先分析全球化竞争和电子商务环境中企业面临的挑战,论述选择创新型供应商对提高企业绩效的必要性,提出基于数据挖掘的创新型供应商选择模型。最后,总结整体解决方案的优势。
- 于昕王道平黄哲学
- 关键词:企业绩效供应商选择数据挖掘
- 跨数据中心的数据分析方法、装置、设备及存储介质
- 本申请适用于数据处理技术领域,提供了一种跨数据中心的数据分析方法、装置、设备及存储介质,所述数据中心内存储有数据子集,所述方法包括:根据各个数据中心内的数据子集,对应生成所述各个数据中心的数据模型;从各个所述数据模型中,...
- 龙浩吴胤旭黄哲学
- 一种基于位置信息的移动互联网用户行为分析方法及装置
- 本发明涉及一种基于位置信息的移动互联网用户行为分析方法及装置,包括步骤:S1、获取并存储移动互联网用户的IMEI码、IMSI码;S2、获取并存储各个身份移动互联网用户的历史位置信息以及历史应用服务信息;S3、根据所述历史...
- 张媛陈小军黄哲学
- 文献传递
- 加权子空间的随机向量函数链接网络集成方法
- 2022年
- 随机向量函数链接网络(RVFL)是一种随机权网络模型,其基于非迭代权重更新方式,直接求解输出层权重完成模型训练,因此具有训练速度快的优点,已有的实验证明了其在分类和回归任务中均具有良好的泛化能力.目前在RVFL的改进工作中存在两点问题:改善网络结构会复杂化模型,容易造成过拟合现象;结合集成学习往往无法进一步通过增加集成多样性来提升模型性能.因此,本文基于子空间策略,提出了一种基于加权子空间的随机向量函数链接网络集成方法(WAB-RVFL).基于RVFL网络结构中输入层和输出层直连的线性特点,WAB-RVFL引入属性优化的思想并提出属性加权矩阵的概念,对属性子空间进行加权转化获得更优质的加权子空间,使其更利于模型进行集成训练.通过在8个高维分类数据集上的实验测试,证实了WAB-RVFL的可行性、合理性和有效性,其能够获得比6种流行的RVFL网络模型更优的泛化能力.
- 叶璇何玉林张曼静黄哲学
- 关键词:泛化能力粒子群优化
- RSP:突破大数据计算内存限制的新技术
- 大数据是人工智能的血液,为人工智能提供营养。大数据的应用将引领数字经济产业的发展,大数据时代也给技术创新和产业转型升级带来新的机遇和巨大的发展空间。数据的日益增加对现有的计算技术带来空前的挑战,许多重要的数据分析工作,由...
- 黄哲学
- 关键词:人工智能
- 基于统计感知策略的高斯混合模型求解方法被引量:1
- 2023年
- 高斯混合模型(Gaussian mixture model,GMM)是一种经典的概率模型,常被用于无监督学习领域来确定无类别标记样本点的类别分布。作为求解GMM参数的重要技术,期望最大化(Expectation maximization,EM)算法通过计算GMM对应似然函数的最优解确定基模型自身参数以及基模型的混合系数。利用EM算法求解GMM存在如下两个缺陷:EM算法易于陷入局部最优解以及EM算法确定GMM基模型相关参数的不稳定,尤其是针对多维随机变量。本文提出了一种基于统计感知(Statistical⁃aware,SA)策略的GMM求解方法——SA⁃GMM方法。该方法从估计给定数据集的未知概率密度函数入手,建立了核密度估计(Kernel density estimation,KDE)与GMM之间的关联。为避免KDE对“过平滑”窗口的选取,设计了同时最小化KDE与GMM之间的经验风险和KDE窗口结构风险的目标函数,进而确定了GMM的最优参数。在11个标准概率分布上的实验证明了SA⁃GMM方法的可行性、合理性和有效性,同时结果也表明SA⁃GMM能够获得显著优于基于EM算法的GMM及其变体的概率密度函数估计表现。
- 陈佳琪何玉林黄哲学FOURNIER-VIGER Philippe
- 关键词:高斯混合模型粒子群优化
- 基于候选中心融合的多观测点I-nice聚类算法
- 2022年
- 伴随着问题场景数据在规模上的快速增长和构成上的复杂化,精确估计簇的个数和簇的中心点是当下聚类算法处理和分析复杂大规模数据的重要挑战.簇数及簇心的精确估计对于部分有参聚类算法、数据集整体复杂性度量和数据简化表示等都十分关键.文中在深入分析I-nice的基础上,提出基于候选中心融合的多观测点I-nice聚类算法.在原多观测点投影分治框架上采用混合高斯模型(Gaussian Mixture Model,GMM),结合粗细粒度最佳GMM搜索策略,实现数据子集的精确划分.此外,基于候选中心点分别到各观测点的距离值及最佳GMM,构造候选中心点的GMM构件向量,并设计一组闵可夫斯基距离对进行候选中心点间的相异度度量,实现基于GMM构件向量相异度的多观测点I-nice候选中心融合.不同于现有聚类算法,文中算法联合优化分治环节数据子集划分和候选中心集成这两个关键过程,实现成百上千个簇的精确高效估计.在真实数据集和仿真数据集上的一系列实验表明,文中算法能精确估计簇数和簇中心,具备较高的聚类精度.实验同时验证算法的有效性及在各类数据场景下的稳定性.
- 陈鸿杰何玉林何玉林尹剑飞
- 关键词:无监督学习观测点高斯混合模型
- 一种基于用户群关联度的个性化推荐方法及系统
- 本发明涉及互联网通信领域,公开一种基于用户群关联度的个性化推荐方法,包括:A、使用聚类算法对用户进行聚类;B、判断目标用户与聚簇边缘的距离,当距离大于给定阈值则执行步骤C,否则执行B-1、计算目标用户所在聚簇与其他聚簇之...
- 高明黄哲学
- 文献传递
- 一种数据分块方法、装置及终端设备
- 本发明适用于大数据处理技术领域,提供了一种数据分块方法、装置及终端设备,方法包括:将数据分块并分别存储到C个数据中心;将第i个数据中心中所存储的数据块切割成P<Sub>i</Sub>个原始数据子块,并分布式放置在第i个数...
- 黄哲学朱胡飞
- 文献传递
- 一种购物篮分析方法及系统
- 本发明适用于数据挖掘领域,提供了一种购物篮分析方法,包括:从零售企业数据库中读取交易数据;对所述交易数据按交易号进行分组聚集以及对商品名称进行编码;利用所述分组聚集和所述编码并通过迭代方式产生购物篮候选集C<Sub>k<...
- 陈小军褚维伟黄哲学张文斌
- 文献传递