雷蕾
- 作品数:6 被引量:35H指数:2
- 供职机构:上海财经大学更多>>
- 发文基金:国家教育部“211”工程更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 缺失数据处理方法的比较研究
- 数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯补缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠...
- 刘鹏雷蕾张雪凤
- 关键词:数据挖掘缺失值朴素贝叶斯分类器信息增益
- 文献传递
- 缺失数据处理方法与朴素贝叶斯分类器的应用
- 缺失数据处理是数据挖掘过程中数据预处理的一个重要内容.介绍了缺失数据的产生机制和处理准则以及目前流行的缺失数据处理方法,提出了基于朴素贝叶斯分类器的缺失数据处理模型.通过实验分析与比较,以及在一个真实的健康医疗数据集上的...
- 刘鹏雷蕾
- 关键词:缺失数据朴素贝叶斯分类器数据挖掘信息增益
- 文献传递
- 灵敏度分析:分类器中的缺失数据被引量:4
- 2005年
- 在数据挖掘技术中,分类预测具有十分广泛的应用。由于数据集中总是存在着不同程度的数据缺失,降低了分类模型的预测准确率。主要通过灵敏度分析来研究缺失数据对分类算法的影响。对6种分类器进行实验,结果显示,当数据集中缺失数据超过20%,会对分类模型的预测准确率产生很大的不利影响,而且对于不同特征的数据集影响也不同。在这6种分类器中,朴素贝叶斯分类器对缺失数据最不敏感。对于目前流行缺失数据的处理方法———利用预测模型来预测并填补缺失数据,朴素贝叶斯分类器将是一个不错的选择。
- 雷蕾吴乃君刘鹏刘兰娟
- 关键词:分类器缺失数据数据挖掘
- 灵敏度分析:分类器中的缺失数据
- 在数据挖掘技术中,分类预测具有十分广泛的应用。由于数据集中总是存在着不同程度的数据缺失,降低了分类模型的预测准确率。主要通过灵敏度分析来研究缺失数据对分类算法的影响。对6种分类器进行实验,结果显示,当数据集中缺失数据超过...
- 雷蕾吴乃君刘鹏刘兰娟
- 关键词:分类器缺失数据数据挖掘
- 文献传递
- 缺失数据处理技术与NBI模型
- 数据挖掘致力于从大型数据库中挖掘有价值的信息。然而,现实世界中的数据集往往不可避免地含有一些缺失数据。这使得数据挖掘算法的性能下降,甚至影响到知识发现的有效性。本文主要研究缺失数据的处理技术,并提出一个有效可行的缺失数据...
- 雷蕾
- 关键词:朴素贝叶斯分类器数据挖掘数据处理缺失数据
- 缺失数据处理方法的比较研究被引量:31
- 2004年
- 数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。
- 刘鹏雷蕾张雪凤
- 关键词:信息增益朴素贝叶斯分类器决策树数据集医疗数据