您的位置: 专家智库 > >

高文涛

作品数:5 被引量:9H指数:2
供职机构:燕山大学信息科学与工程学院更多>>
发文基金:中国博士后科学基金河北省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 3篇期刊文章
  • 2篇学位论文

领域

  • 4篇自动化与计算...
  • 1篇经济管理

主题

  • 2篇支持向量
  • 2篇支持向量机
  • 2篇向量
  • 2篇向量机
  • 1篇农村
  • 1篇偏倚
  • 1篇评价指标
  • 1篇县域
  • 1篇县域经济
  • 1篇县域农村
  • 1篇小样本
  • 1篇鲁棒
  • 1篇本约
  • 1篇不确定性

机构

  • 5篇燕山大学

作者

  • 5篇高文涛
  • 3篇胡正平
  • 1篇任大伟

传媒

  • 3篇燕山大学学报

年份

  • 1篇2011
  • 1篇2010
  • 2篇2009
  • 1篇2004
5 条 记 录,以下是 1-5
排序方式:
划分分类模型中主动学习关键技术研究
在机器学习中,主动学习可以避免分类模型被动地接受样本信息,有选择地从未标注样本集中选取信息量最大的样本进行专家标注,然后通过对较少的大信息量样本进行学习,得到代价小、性能高的分类器。随着获得的未标注样本数据越来越多,人工...
高文涛
关键词:支持向量机
文献传递
基于改进加权压缩近邻与最近边界规则SVM训练样本约减选择算法被引量:6
2010年
大规模的训练集中通常含有许多相似样本和大量对分类器模型构造"无用"的冗余信息,利用全部样本进行训练不但会增加训练时间,还可能因为出现"过拟合"现象而导致泛化能力下降。针对这一问题,本文从最具代表性样本与最近边界样本两个角度综合考虑,提出一种基于改进加权压缩近邻与最近边界规则SVM训练样本约减选择算法。该算法考虑到有价值训练样本对SVM分类器性能的重要影响,引进减法聚类利用改进的加权压缩近邻方法选择最具代表性的样本进行训练,在此基础上利用最近边界规则在随机小样本池中选择边界样本提高分类精度。在UCI和KDDCup1999数据集上的实验结果表明,本文的算法能够有效地去除大训练集中的冗余信息,以较少的样本获得更好的分类性能。
胡正平高文涛
关键词:支持向量机
基于样本不同属性综合的鲁棒偏倚赖主动学习分类算法研究
2011年
主动学习算法可以有效减少样本标注的工作量,每次选取最有信息量的样本交由专家标注。样本的代表性与不确定性都是衡量样本信息量的重要因素,将两者综合考虑能够获得更好的综合效果,但在两者的结合方式上一直存在不少问题,导致算法的适应性不强。为解决该问题,本文提出了基于样本不同属性的鲁棒偏倚赖主动学习分类算法,通过引入偏倚赖权值系数函数,在综合考虑样本的代表性和不确定性的同时,更可以突出样本的特性。同时由于样本代表性模型的渐变,在选择样本过程中更能突出代表性样本与不确定性样本的学习层次,前期训练以代表性样本为主,后期训练以不确定性样本为主,使得算法的适应性大大提高。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,与所提供的对比算法相比,本文的方法只需较少的标注样本便可以达到相同的分类正确率。
任大伟胡正平高文涛
县域农村工业化研究
本文按照全面建设小康社会的总体要求,在总结国内外农村工业化发展经验的基础上,依据经济理论对国内外成功的农村工业化发展道路进行了系统的分析,主要是对苏南模式、温州模式、珠江模式、沪郊模式、白沟模式、耿车模式各自产生的背景、...
高文涛
关键词:县域经济评价指标
文献传递
基于样本不确定性和代表性相结合的可控主动学习算法研究被引量:4
2009年
通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量。在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法。首先利用样本的NN分布状况建立不确定性置信度模型,该思路不需要知道样本分布的具体类型和参数计算;然后在样本聚集度模型的基础上进行聚类,在此基础上建立代表性置信度模型。最后将不确定性置信度模型与代表性置信度模型进行综合,构造可控的主动学习策略,使得每次主动学习选择的样本更具有"价值"。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,当达到相同的目标正确率时,本文的方法比随机采样算法所需的样本数量少得多。
胡正平高文涛万春艳
共1页<1>
聚类工具0