徐菲菲
- 作品数:20 被引量:232H指数:7
- 供职机构:上海电力学院计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术理学电气工程更多>>
- 基于模糊粗糙集的肿瘤分类特征基因选取被引量:14
- 2009年
- 依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取。然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验。以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性。
- 徐菲菲苗夺谦魏莱
- 关键词:特征选取粗糙集模糊粗糙集互信息
- 基于互信息的模糊粗糙集并行约简被引量:2
- 2015年
- 模糊粗糙集结合了粗糙集和模糊集的优势,使得可以直接处理连续值属性,成功应用于诸多领域.然而,在信息爆炸的时代,现实世界的数据绝大多数都在不断发展变化,传统的模糊粗糙集已不再适用于动态变化的数据.针对动态增长或变化的数据,将并行约简理论引入至模糊粗糙集中,结合信息论,提出信息论意义下的模糊粗糙集并行约简概念,并利用互信息的概念提出了基于互信息的模糊粗糙集并行约简算法.实验结果表明本文所提算法与传统的模糊粗糙集约简方法保持相近的分类准确率,但避免了繁琐的重新训练过程,大大提高了学习速度,因此,提高了分类的可扩展性和适应性.
- 徐菲菲魏莱毕忠勤
- 关键词:模糊粗糙集互信息
- 基于带权多维尺度变换的奇异值挖掘被引量:4
- 2008年
- 大量的高维数据在分布上表现为一低维流形,试图从这样的数据集中探测出奇异点,传统的奇异点挖掘算法可能失效。本文提出了一种带权重的多维尺度变化,算法通过局部的高维数据集和其低维重构的误差来设定数据点的局部权重,再利用权重之和得到的数据点置信度,以此来进行奇异值的判定。通过实验验证了算法的有效性。
- 魏莱王守觉徐菲菲
- 关键词:奇异值流形学习
- 一种基于互信息的模糊粗糙分类特征基因快速选取方法被引量:6
- 2013年
- 依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对该算法进行了改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。
- 徐菲菲魏莱杜海洲王文欢
- 关键词:特征选取模糊粗糙集互信息
- 知识的划分粒度表示法被引量:14
- 2009年
- 对知识的分类能力给予量化,提出一种知识表示法——划分粒度表示法,利用划分粒度可定量表示知识的分类能力.首先给出粗糙集理论中主要概念的代数表示,其次定义知识的划分粒度并研究它的性质,最后证明知识的代数表示与划分粒度表示是等价的.
- 冯琴荣苗夺谦程昳徐菲菲
- 关键词:粗糙集信息系统知识约简
- 粒计算的集合论描述被引量:54
- 2012年
- 粒计算的形式化研究一直没有被仔细讨论.文中在集合论框架下,对粒计算做了系统研究,给出了粒度空间的三层模型(论域,基,粒结构).借用逻辑语言L判定粒的可定义性,将经典粗糙集通过此模型重新解释.根据模型中从基到粒结构不同的构造规则,引出并可约和交可约粒度空间的定义,分别讨论了不同粒度空间下覆盖、基和粒结构的关系,从而给出从覆盖求基的方法;进一步,利用子系统表示方法对扩展粗糙集以及一般的交可约与并可约空间的上下近似进行了研究,分析了现有的4种基于覆盖的粗糙集模型的合理性;研究了形式概念分析以及知识空间的粒度空间模型,给出这两种理论中上下近似的概念.
- 苗夺谦徐菲菲姚一豫魏莱
- 关键词:粒计算粒度空间粗糙集形式概念分析知识空间
- 基于改进的邻域粗糙集与概率神经网络的水电机组振动故障诊断被引量:6
- 2016年
- 提出了一种基于改进的邻域粗糙集与概率神经网络的水电机组振动故障诊断方法.该方法将邻域粗糙集中的近似精度与信息论观点中的条件熵结合,提出近似条件熵的属性约简算法,减少故障冗余信息,得到最优决策表,并将得到的最优决策表作为概率神经网络(PNN)的训练样本,提高了PNN的训练速度和诊断效率,通过实验证明了所述方法的可行性和有效性.
- 谢玲玲雷景生徐菲菲
- 关键词:邻域粗糙集属性约简概率神经网络故障诊断
- 模糊加权流数据软子空间的聚类算法被引量:1
- 2013年
- 现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.
- 朱林雷景生毕忠勤徐菲菲
- 关键词:子空间聚类数据流聚类模糊聚类
- 基于联合属性重要度的决策风险最小化属性约简被引量:3
- 2016年
- 经典粗糙集属性约简基本都是保持正域、负域和边界域不变,而决策粗糙集对属性的增减过程不具备单调性,因此不可能同时保持3个区域均不变。在决策粗糙集模型中,作出决策更应该考虑风险最小化原则,因此提出一种改进的风险最小化属性约简方法,在属性的选取过程中同时考虑所选取的属性子集对决策的划分能力,即联合属性重要度以及风险最小化。实验证明所提方法是有效的。
- 徐菲菲毕忠勤雷景生
- 关键词:属性约简风险最小化
- 一种对奇异值不敏感的ISOMAP被引量:3
- 2007年
- ISOMAP是一种经典的非线性降维方法,能够有效地发现高维非线性数据集的低维几何结构,但该算法对奇异值和噪声非常敏感。利用具有鲁棒性的主成分分析(Robust PCA)来探测奇异点,并对奇异点进行适当处理以降低ISOMAP对其的敏感程度。所提出的算法直观且易于理解,实验结果也证明它具有较好的鲁棒性,而且在奇异点较多的情况下仍能保持数据的整体结构。
- 魏莱王守觉徐菲菲
- 关键词:流形学习主成分分析等度规映射