针对小样本学习过程中样本数量不足导致的性能下降问题,基于原型网络(Prototype network,ProtoNet)的小样本学习方法通过实现查询样本与支持样本原型特征间的距离度量,从而达到很好的分类性能.然而,这种方法直接将支持集样本均值视为类原型,在一定程度上加剧了对样本数量稀少情况下的敏感性.针对此问题,提出了基于自适应原型特征类矫正的小样本学习方法(Few-shot learning based on class rectification via adaptive prototype features,CRAPF),通过自适应生成原型特征来缓解方法对数据细微变化的过度响应,并同步实现类边界的精细化调整.首先,使用卷积神经网络构建自适应原型特征生成模块,该模块采用非线性映射获取更为稳健的原型特征,有助于减弱异常值对原型构建的影响;然后,通过对原型生成过程的优化,提升不同类间原型表示的区分度,进而强化原型特征对类别表征的整体效能;最后,在3个广泛使用的基准数据集上的实验结果显示,该方法提升了小样本学习任务的表现.
标记分布学习是近年来提出的一种新的机器学习范式,它能很好地解决某些标记多义性的问题。现有的标记分布学习算法均利用条件概率建立参数模型,但未能充分利用特征和标记间的联系。本文考虑到特征相似的样本所对应的标记分布也应当相似,利用原型聚类的k均值算法(k-means),将训练集的样本进行聚类,提出基于kmeans算法的标记分布学习(label distribution learning based on k-means algorithm,LDLKM)。首先通过聚类算法kmeans求得每一个簇的均值向量,然后分别求得对应标记分布的均值向量。最后将测试集和训练集的均值向量间的距离作为权重,应用到对测试集标记分布的预测上。在6个公开的数据集上进行实验,并与3种已有的标记分布学习算法在5种评价指标上进行比较,实验结果表明提出的LDLKM算法是有效的。