张伟
- 作品数:6 被引量:37H指数:4
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于趋势信息的时间序列分类方法被引量:3
- 2019年
- 大部分时间序列数据分析的一个重要组成部分是相似性度量方式.在众多相似性度量方式中,基于最长公共子序列的相似性度量方式是一种常用的有效方法,但该方法仅仅度量序列点对点的数值差异,而忽略了序列的变化趋势.为此提出一种基于趋势信息的时间序列离散化方法并用最长公共子序列进行相似性度量.该方法能够很好地度量时间序列的趋势信息.此外,还将其与现有的点对点函数线性结合.与现有相似性度量方法不同,该方法能同时考虑时间序列的趋势信息和函数距离,相似性度量方案运用最近邻分类算法规则进行分类.为了进行全面的比较,在42个时间序列数据集上测试该算法的有效性.实验结果表明,所提出的方法能有效提高时间序列分类准确率.
- 林钱洪王志海原继东张伟
- 关键词:时间序列
- 一种时间序列鉴别性特征字典构建算法被引量:4
- 2020年
- 时间序列数据广泛产生于科技和经济的多个领域.基于符号傅里叶近似(symbolic Fourier approximation)和滑动窗口的定长单词抽取算法是目前时间序列特征字典构建过程中最有效的特征生成算法之一,但是该算法在特征生成过程中不能根据不同滑动窗口长度动态地选择保留的最优傅里叶值的个数,而且特征字典构建过程中缺少从生成的海量特征中对鉴别性特征进行有效选择的算法.为此,提出一种鉴别性特征字典构建算法.首先,提出一种针对不同长度滑动窗口学习最优单词长度的基于Fourier近似的可变长度单词抽取方法;其次,构建了一种新的特征鉴别性评价指标,并依据其动态阈值对生成的特征进行选择.实验结果表明,基于构建的特征字典的逻辑回归模型不仅分类精度高,而且可以有效发现预测过程中的鉴别性特征.
- 张伟王志海原继东郝石磊
- 一种基于Shapelets的懒惰式时间序列分类算法被引量:9
- 2019年
- 近些年,时间序列分类问题研究受到了越来越多的关注.基于shapelets的时间序列分类技术是一种有效的方法.然而,其在提取最优shapelet的过程中要建立包含大量冗余元素的候选shapelets集合,一般所获得的shapelets只在平均意义上具有某种鉴别性;与此同时,普通模型往往忽略了待分类实例所具有的局部特征.为此,我们提出了一种依据待分类实例显著局部特征的懒惰式分类模型.这种模型为每个待分类实例构建各自的数据驱动的懒惰式shapelets分类模型,从而逐步缩小了与其分类相关的时间序列搜索空间,使得所获得的shapelets能够直接反映待分类实例的显著局部特征.实验结果表明该文提出的模型具有较高的准确率和更强的可解释性.
- 王志海张伟原继东刘海洋
- 关键词:时间序列可解释性
- 面向复杂时间序列的k近邻分类器被引量:9
- 2017年
- 基于时序对齐的k近邻分类器是时间序列分类的基准算法.在实际应用中,同类复杂时间序列经常展现出不同的全局特性.由于传统时序对齐方法平等对待实例特征并忽略其局部辨别特性,因此难以准确、高效地处理此类具有挑战性的时间序列.为了有效对齐并分类复杂时间序列,提出了一种具有辨别性的局部加权动态时间扭曲方法,用于发现同类复杂时间序列的共同点以及异类序列间的不同点.同时,通过迭代学习时间序列对齐点的正例集与负例集,获取每条复杂时间序列中每个特征的辨别性权重.在多个人工和真实数据集上的实验结果表明了基于局部加权对齐策略的k近邻分类器所具有的可解释性与有效性,并将所提出方法扩展至多变量时间序列分类问题中.
- 原继东王志海孙艳歌张伟
- 关键词:K近邻
- 一种基于深度属性加权的数据流自适应集成分类算法被引量:3
- 2018年
- 针对现有的大多数数据流集成分类算法对分类器的评估时未考虑历史数据的重要性,同时忽略对无关属性和噪声属性干扰的处理等问题,提出一种基于深度属性加权的数据流自适应集成分类算法,旨在有效组合多个基于深度属性加权的朴素贝叶斯模型。通过在不同数据块中深入分析不同属性取值对类属性归属的贡献,并将学习到的局部属性权重作用于不同的属性取值,以降低噪声数据干扰。在评价基分类器时,权衡历史数据和当前最新数据的重要性;采用基于测试实例的分类器置信度和分类正确率权重的组合投票策略进行子分类器组合以提高整体分类性能。通过在多个基准数据集上与经典算法对比试验,本研究算法在分类正确率和概念漂移适应性上具有一定优势。
- 李尧王志海孙艳歌张伟
- 关键词:数据流概念漂移自适应
- 一种局部属性加权朴素贝叶斯分类算法被引量:10
- 2018年
- 朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了每个测试实例所具有的特点,同时从整个训练集上学习到的属性权重并不能准确反映每个属性对待分类实例的影响.为此提出一种基于数据驱动的懒惰式局部属性加权方法,它在每个测试实例的近邻集合上学习属性权重,并通过最优化方法建立相应的局部属性加权朴素贝叶斯模型.实验结果表明:和当前常见的准朴素贝叶斯模型相比,本文模型具有较高的分类准确率.
- 张伟王志海原继东刘海洋
- 关键词:朴素贝叶斯属性加权