李昆仑
- 作品数:46 被引量:367H指数:11
- 供职机构:河北大学电子信息工程学院更多>>
- 发文基金:国家自然科学基金河北省自然科学基金河北省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术生物学石油与天然气工程天文地球更多>>
- 模型聚类及在集成学习中的应用研究被引量:7
- 2007年
- 聚类技术是一种重要的数据分析工具,在数据挖掘、模式识别等领域具有广泛的应用前景.通常,聚类算法的聚类对象为传统的数据集合,它们可以表示为欧式空间中的点.然而,在一些任务中,聚类的对象并不是显式的数据点,而是一些抽象的数据模型,例如神经网络、决策树、支持向量机等模型.通过定义广义的距离(实际任务中的距离定义可能各不相同),研究了数据对象为一般模型的聚类方法,提出了基于模型对象的一般聚类算法框架;作为模型聚类的一个应用,研究了应用神经网络模型的聚类提高集成学习差异性的方法,实验研究了聚类的簇数、集成学习的规模以及集成学习性能间的关系.
- 李凯李昆仑崔丽娟
- 关键词:模型聚类度量空间聚类有效性
- 入侵检测的1类支持向量机模型被引量:11
- 2003年
- 计算机网络尤其是互联网的迅速发展与普及 ,使得信息安全已经成为一个全球瞩目的重要研究课题。随着攻击技术的不断进步与更新 ,迫切需要一种有效的入侵检测技术来保护信息系统的安全。由于几乎所有的攻击与滥用都被记录在系统的网络数据中 ,因而可以基于计算机系统的网络数据构造入侵检测系统。在对网络数据进行深刻的分析和研究的基础上 ,提出了入侵检测的 1类支持向量机模型。第一 ,构造适于异常点检测的1类支持向量机模型 ;第二利用抽象化的网络数据对该模型进行训练以确定其中各个参数的值。实验表明 。
- 李昆仑黄厚宽田盛丰赵俊忠
- 关键词:入侵检测计算机网络信息安全防火墙
- 多决策模板分类器融合
- 2011年
- 针对多类分类问题提出了一种新的度量层分类器融合方法,为每个模式类设置多个决策模板,每个决策模板针对一种容易发生的分类错误,从而能够有效地降低错误率;此外,采用模糊系统表示Meta层样本与各个决策模板之间的关系,能够比较准确地计算样本属于各个模式类的总分类置信度。从公用数据仓库中选取了三个较大规模数据集对新方法进行测试,并且与k-近邻规则、投票法、朴素贝叶斯法、线性规则、模板匹配法等常用的分类器融合方法进行了比较。大量实验结果表明,对于类别数在3~15之间的分类问题,该方法具有较好的综合性能。
- 刘明张锁良李昆仑袁保宗
- 关键词:模式识别分类器融合模糊系统
- 半监督聚类的若干新进展被引量:53
- 2009年
- 半监督聚类方法利用少量标记数据提高聚类算法的性能,已逐渐发展成为模式识别及相关领域的研究热点.文中首先综述了半监督聚类算法的一些新进展,包括基于约束的方法、基于距离的方法和基于距离与约束的融合方法.然后提出一种基于约束的半监督模糊C-means聚类算法.实验表明,该算法与传统的模糊C-means及半监督K-means方法相比,具有更好的聚类精度.
- 李昆仑曹铮曹丽苹张超刘明
- 关键词:半监督聚类标记数据
- 基于半监督学习的SVM-KNN
- 当前机器学习面临的主要问题之一,是如何解决含有大量未标记样本的分类问题.本文针对性的提出了一种新的基于半监督的SVM-KNN分类方法,当可用的训练样本较少时,使用SVM进行分类,不能得到准确的分类边界,但可以从大量未标记...
- 李昆仑骆学荣孟晓倩
- 关键词:半监督学习支持向量机K-近邻边界向量迭代
- 基于SVM的蛋白质二级结构预测方法的研究
- 2007年
- 应用计算智能方法分析,有效地处理现实世界中的大规模数据,是当今人工智能、机器学习等领域所追求的目标之一.简单综述了SVM用于处理大规模数据方法的发展现状,并针对蛋白质结构预测中数据量庞大、数据维数过高等问题,提出了SVM基于分解算法的蛋白质二级结构预测的实现方法,并应用固定长度的字符串核对多类分类SVM算法进行了改进.实验表明,该方法是行之有效的.
- 李昆仑崔丽娟张伟戴运娜
- 关键词:支持向量机蛋白质二级结构预测
- 基于特征项分布的信息熵及特征动态加权概念漂移检测模型被引量:6
- 2015年
- 现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态演化性出发,根据样本和特征空间的拟合程度,运用特征信息熵理论对数据流中的概念漂移现象进行捕捉,以实现新旧概念的过渡.利用改进的隐含Dirichlet模型特征动态加权算法,以解决当前特征与历史特征的权重确定和无效特征的裁剪问题.在公开的语料库CCERT和Trec06上的测试实验证明了所提出算法的有效性.
- 孙雪李昆仑韩蕾白晓亮
- 关键词:概念漂移LDA模型信息熵
- 基于改进用户相似性度量和评分预测的协同过滤推荐算法被引量:30
- 2018年
- 协同过滤推荐算法是个性化推荐系统中研究最多也是应用最广的推荐算法之一.针对该算法中存在的数据稀疏性问题、可扩展性问题以及用户评分尺度不同导致的近邻用户寻找不准确的问题,提出了一种叫做基于改进用户相似性度量和评分预测的协同过滤推荐算法,该算法有以下三个方面的改进:(1)通过计算向量的平均欧式距离将相似的两个向量的均值引入对向量缺失值的填充并实现降维;(2)将用户评分的均值差引入对用户相似度的计算;(3)通过邻近用户对目标项目进行评分预测时,引入目标用户和邻近用户的平均评分.本文在Movie Lens数据集中进行了相应的实验验证,证明了本文算法的有效性.
- 李昆仑万品哲张德智
- 关键词:相似度协同过滤
- 基于全局最优的半监督K-means算法
- 本文提出一种基于全局最优的半监督K-means算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据。结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中...
- 孙雪李昆仑赵瑞胡夕坤
- 关键词:半监督聚类K均值算法投票阈值
- 基于自训练大间隔近邻的人脸识别
- 2015年
- 人脸图像是潜在高维空间的低维流形。流行的本质上表现为特征变化的连续性缓慢性,也表现在空间的相邻性。本文提出了一种基于自训练的大间隔近邻方法,通过自训练迭代,使类内样本尽可能紧凑,类间样本保持一定大距离,在邻域内标记无标记样本。实验证明,该方法在小样本情况下拥有相对较好的识别度。
- 赵一儒李昆仑李彦波
- 关键词:人脸识别