施万锋
- 作品数:3 被引量:12H指数:1
- 供职机构:合肥工业大学计算机与信息学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- K-split Lasso:有效的肿瘤特征基因选择方法被引量:12
- 2012年
- 随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而使得对肿瘤特征基因选择和亚型分类的研究成为生物信息学领域的热点。基于Lasso(least absolute shrinkage and selection operator)方法提出了K-split Lasso特征选择方法,其基本思想是将数据集平均划分为K份,分别使用Lasso方法对每份进行特征选择,而后将选择出来的每份特征子集合并,重新进行特征选择,得到最终的特征基因。实验采用支持向量机作为分类器,结果表明K-split Lasso方法减少了冗余特征,提高了分类精度,具有良好的稳定性。由于每次计算的维数降低,K-split Lasso方法解决了计算开销过大的问题,并在一定程度上解决了"过拟合"问题。因此K-split Lasso方法是一种有效的肿瘤特征基因选择方法。
- 张靖胡学钢张玉红施万锋
- 关键词:肿瘤基因表达谱支持向量机
- K-split Lasso:一种有效的肿瘤特征基因选择方法
- 随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而为研究肿瘤特征基因选择和亚型分类提供了方便,其成为生物信息学领域的研究热点.然而,面对高维小样本的肿瘤基因表达谱数据,如何在成千上万个基因...
- 张靖胡学钢张玉红施万锋
- 文献传递
- 基于EP模式的高维数据分类算法研究
- 近年来,随着信息采集技术和数据处理能力的迅速发展和广泛应用,众多领域如科学研究、生物医学、网络通信、商业等出现了大量高维数据,因而对高维数据进行分类成为数据挖掘领域的研究热点。由于“维度效应”的原因,许多在低维数据空间中...
- 施万锋
- 关键词:高维数据