李裕梅
- 作品数:23 被引量:90H指数:5
- 供职机构:北京工商大学更多>>
- 发文基金:国家自然科学基金北京市优秀人才培养资助北京市科技计划项目更多>>
- 相关领域:自动化与计算机技术理学文化科学轻工技术与工程更多>>
- 主成分分析的几个应用理解及R语言实践
- 2021年
- 主成分分析是一种常用的简化数据集的技术,也是一种应用广泛的多元统计分析方法。在各高校开设的多门课程中,主成分分析的理论都是重点内容。但在教学过程中,我们发现其理论与实际应用间还有很多值得理解、挖掘和实践验证的地方。本文针对主成分分析过程进行回顾,并主要探讨其几个应用情况,即基于主成分分析的数据降维、基于主成分分析的综合评价、基于主成分分析的关键特征确定、基于主成分分析的样本聚类等几个方面。我们详细梳理并部分推导和补充每个应用的理论过程,整理各种应用在一些文献里的使用场景,给出我们对各个应用的R语言实践代码和相应分析等。这些应用的理论过程和R语言实践,有助于对主成分分析进行深刻理解和融会贯通,为主成分分析的学习和使用提供重要的参考。
- 赵霂李裕梅
- 关键词:主成分分析数据降维综合评价样本聚类
- 一种基于数据插值和拟合的煎炸油废弃点预警分析方法
- 本发明公开了一种基于数据插值和拟合的煎炸油废弃点预警分析方法,属于油脂鉴别技术领域,(1)对煎炸油标准样品进行平行测试,获得酸价、羰基价、极性组分理化指标;(2)对数据整体情况进行可视化观察,以初步判断测出来的数据整体的...
- 李裕梅曹雁平曹显兵冯宇旭解久莹吉静筠王鑫
- 文献传递
- 关联规则挖掘中几个兴趣度量的值域研究
- 2024年
- 本文旨在研究关联规则挖掘中的各种兴趣度量的值域问题。首先,详细介绍了关联规则挖掘过程中涉及的定义和支持度、置信度、确信度、提升度和Laplace测度这五种兴趣度量的定义,并通过具体例子对这些度量进行了说明和解释。然后,深入探讨了这五种兴趣度量的值域,并给出了其在数据库大小有限和接近无穷两种情况下的值域情况。此外,本文还对这些兴趣度量值域的区间端点的取值进行了细致讨论,指出了与其他研究结果的区别及其原因,并给出了严谨的数学证明和对比分析,为关联规则挖掘提供了更全面和准确的度量工具。
- 万鑫李建军李裕梅
- 关键词:关联规则挖掘值域
- 关联规则分析中兴趣度量Lift与Conviction的关系探讨及教育数据验证
- 2024年
- 关联规则分析是数据挖掘中最常用的研究方法之一。在关联关系的发现过程中兴趣度量是关联规则发现的理论基础,它可以度量规则的重要程度,其中Lift和Conviction这两个度量在数据分析中被广泛应用于筛选关联规则。本文对这两种兴趣度量进行了研究。首先,提出并证明了当后项集固定时,Conviction取值随Lift取值单调增加,且Conviction (Lift)是一个凸函数。然后,证明了当Confidence固定时,Conviction取值随Lift取值单调增加,且Conviction (Lift)是一个凹函数。最后,综合以上两个方面,得到一个重要结论:当后项集保持不变或当Confidence固定时,根据Conviction和Lift筛选出来的规则都是相同的。最后,利用某高校数学类专业三个年级的成绩数据进行了定理及相应结论的验证。
- 万鑫李梓如李裕梅
- 关键词:关联规则分析LIFTCONVICTION
- 基于LSTM神经网络的沪深300指数预测模型研究被引量:31
- 2019年
- 将LSTM用于沪深300指数的股价预测中,并在通用变量开盘价、收盘价、最高价、最低价的基础上新加入了日成交量与日成交额,以此来预测第二日的最高价,获得了比较好的预测效果,并与SVR模型和Adaboost模型预测作对比,LSTM获得的测试集RMSE要更低.接着,用SVR、Adaboost和LSTM进行岭回归集成,即,先用训练集对这三种模型进行训练,然后用训练数据进行测试,将它们的测试结果作为自变量,以相应的真实第二日最高价作因变量,进行岭回归,再对测试集数据做出预测,得到测试集的RMSE进一步降低;再者,查看回归方程发现SVR系数为负,与因变量呈负相关关系,进一步选取Adaboost和LSTM两种模型在训练集上的预测结果做自变量,相应的真实第二日最高价作因变量,再次进行岭回归,得到测试集的RMSE再次降低,进一步验证了回归集成算法的有效性,可以为广大投资者做买卖决策时提供重要的参考价值.
- 冯宇旭李裕梅
- 关键词:股价预测沪深300指数SVRADABOOSTRMSE
- 基于Haar-CNN模型的自然场景图像分类的研究被引量:11
- 2017年
- 研究基于Haar-CNN模型的图像特征提取用于自然场景图像分类的问题.Haar小波变换是图像处理中常见的一种变换,可以提取图像的局部和空间信息,并把彩色图像的颜色、轮廓和纹理信息进行分层次的表达.卷积神经网络(CNN)是一种得到广泛研究与应用的深度学习模型,对图像特征具有很好的表达能力.基于Haar小波变换和CNN模型的优势,提出一种新的图像特征提取方法,即Haar-CNN模型;利用该模型提取得到图像更丰富的特征信息;然后比较基于Haar-CNN和CNN模型提取的自然场景图像特征在分类中的效果,探究Haar-CNN模型对于自然场景图像特征提取的优势.再对比在不同颜色空间上Haar-CNN模型对自然场景图像的分类效果,实验结果表明YCb Cr颜色空间上的分类精度最高,为96.2%,比灰度图像的分类精度提高了7.8%.同时,进一步分析Haar-CNN模型中图像块大小、隐藏层神经元个数、池化区域大小、模型深度等参数对图像分类精度的影响,实验结果表明参数选择对图像分类很重要,合适的参数选择可以提高分类精度.
- 张慧娜李裕梅傅莺莺
- 关键词:图像分类
- 一种基于胶囊神经网络的指纹识别技术
- 本发明公开了一种基于胶囊神经网络的指纹识别技术,属于指纹识别技术领域,(1)指纹图像区域的自动寻找和提取;(2)对指纹图片进行预处理(包括指纹图像增强、二值化、细化);(3)设置胶囊神经网络的结构;(4)设置胶囊神经网络...
- 李裕梅杨顺欣王鑫曹显兵傅莺莺
- 文献传递
- 线性规划单纯形代数7小步法与简易矩阵表格法被引量:3
- 2011年
- 在《运筹学》这门课的教学过程中,单纯形法一直是教学的一个难点,学生也比较难理解、不容易学明白.通过多年的运筹学教学经验,针对目标为max的线性规划问题,提出"单纯形代数7小步法"和"简易矩阵表格法".对于"单纯形代数7小步法",只需要按照这7个步骤一步一步操作就能得到最优解和目标函数最优值;对于"简易矩阵表格法",根据题目的模型得到初始矩阵表格后,就是不断地在矩阵表格中寻找主元,然后将主元变成1,并将主元所在列的其他元素变成0,再根据矩阵的最后一行元素的正负进行最优性检验;最后得到最优矩阵表格,从最优矩阵表格里就能直接读出最优解和目标函数的最优值.将单纯形法提炼成比较容易理解和接受的这两种形式,为学生学习单纯形法提供重要的参考,同时也为运筹学老师的对这一部分内容的教学提供借鉴.
- 李裕梅曹显兵吴巧梅蒋心为赵晋
- 关键词:线性规划单纯形法
- 基于检索性能的最佳特征融合方案的探索
- 在图像基于内容检索中,目前已经有很多学者提出了很多单一特征提取方案,比较有名的有LBP、HOG和SIFT特征。其中LBP有很多种形式,比如Basic LBP、The derivation of the generic L...
- 李裕梅高剂斌熊令纯
- 关键词:LBPHOGSIFT
- 文献传递
- 方差分析的回归解读与假设检验被引量:14
- 2019年
- 文章引入虚拟变量,将方差分析化为特殊形式的多元线性回归,证明了方差分析与虚拟变量回归中方差分解各项对应相等、两类假设检验对应等价,介绍了R软件中方差分析及其虚拟变量回归的实现。讨论了方差分析中两水平差异检验与两正态总体均值差t检验之间的联系。
- 傅莺莺田振坤李裕梅
- 关键词:方差分析