国家自然科学基金(60603023)
- 作品数:25 被引量:89H指数:6
- 相关作者:秦玉平王春立王秀坤李祥纳陈一荻更多>>
- 相关机构:渤海大学大连海事大学大连理工大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划辽宁省教育厅资助项目更多>>
- 相关领域:自动化与计算机技术理学环境科学与工程更多>>
- 一种新的兼类文本分类方法被引量:1
- 2011年
- 提出了一种基于超椭球的兼类文本分类算法。对每一类样本,在特征空间求得一个包围该类样本的最小超椭球,使得各类样本之间通过超椭球隔开。对待分类样本,通过判断其是否在超椭球内确定其类别。若没有超椭球包围待分类样本,则通过隶属度确定其所属类别。在标准数据集Reuters 21578上的实验结果表明,该方法较超球方法提高了分类精度和分类速度。
- 秦玉平陈一荻王春立王秀坤
- 关键词:缩放因子
- 基于多Agent的垃圾邮件过滤系统的研究被引量:1
- 2009年
- 单一的垃圾邮件过滤技术已经不能有效阻止不断出现的新型垃圾邮件,基于多Agent技术结合现有垃圾邮件过滤技术建立一个多技术整合分层过滤的垃圾邮件过滤系统。该系统在服务器端主要对一些具有反动、色情和病毒特征的邮件进行强制过滤,在客户端可以根据用户的兴趣选择进行个性化过滤。
- 翟军昌秦玉平王春立
- 关键词:多AGENT系统垃圾邮件白名单朴素贝叶斯
- 环Z_n上圆锥曲线加法的改进被引量:1
- 2010年
- 环Zn圆锥曲线上的加法都要以(x,y)的形式表示出来作为判定条件,分别考虑运算结果属于C1,C2,C3,O的情况,因此计算比较繁琐.根据环Zn上的加法的定义对环上加法进行改进.运算过程中,圆锥曲线上的点都以参数t表示,不用每一步都计算出(x,y),利用中国剩余定理对点P坐标进行分解,然后将(tmp,tnq)合并,计算nP的坐标,运算时只需要对参数t进行操作,简化了环Zn上圆锥曲线的加法运算,明显减低计算的时间复杂度,算法优于改进前的加法运算.
- 李国敬李勇男温涛
- 关键词:圆锥曲线中国剩余定理公钥密码
- 基于C-SVM和KPCA的垃圾邮件检测研究被引量:3
- 2010年
- 现有的垃圾邮件检测算法存在小样本情况下泛化能力差的问题。提出了利用核主成分分析和支持向量机结合进行垃圾邮件检测的方法。与传统算法相比,该方法与邮件异构有很高的检测率、更强的泛化能力和更高的检测效率。实验证明了方法的实用性和高效性。
- 秦玉平耿姝孙宗宝
- 关键词:支持向量机核主成分分析垃圾邮件检测
- 一种改进的有向无环图支持向量机被引量:1
- 2011年
- 构造合理的有向无环图是有向无环图支持向量机亟需解决的一个关键问题。本文提出一种改进的有向无环图支持向量机,根据超球支持向量机获得类的最小包围球,根据该最小包围球计算类与类之间的最短距离,根据该最短距离形成最短距离矩阵,根据该最短距离矩阵来构造有向无环图。实验结果表明,该改进算法较传统有向无环图支持向量机分类精度有明显提高。
- 艾青秦玉平赵骥
- 关键词:超球支持向量机
- Viterbi和DTW算法的关系分析——在非特定人手语识别中的应用被引量:7
- 2010年
- 在经典的模式识别理论中,Viterbi算法代表了统计概率的模式匹配算法,而DTW算法代表了模版匹配的模式匹配算法,它们之间是否存在关系至今尚无定论.为了找到这两种算法之间的关系,在"类别隶属度"是广义概率的假设前提下,应用模糊数学的理论在Viterbi算法与DTW算法之间建立起联系.首先,提出了利用模糊数学的贴近度把DTW算法的"距离"向Viterbi算法的"概率"转化的通用贴近度表达式,并对通用贴近度表达式给出了理论上的证明.其次,应用DTW的通用贴近度表达式重估HMM参数,建立DTW算法与Viterbi算法之间的模糊贴近度关系,并为此提出了δ-ε算法,得到基于数据帧的类似于HMM的参数重估形式.然后,为了确保建立DTW算法与Viterbi算法之间的模糊贴近度关系的正确性,以定理的形式给出了相应的证明.再次,通过设定的DTW贴近度表达式对HMM参数重估的过程中,发现了DTW贴近度的重估参数与HMM重估参数之间存在着的模糊关系,以定理的形式对这种模糊关系加以证明.最后,依据上述定理提出了Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法,以定理的形式对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法的正确性加以证明,并将对Dtw-ViterbiⅠ,Ⅱ,Ⅲ算法应用于非特定人手语的识别.实验表明,把DTW算法的路径搜索策略以概率的形式引进到Viterbi算法中,能够以削减候选词集的方式部分消除非特定人手语识别的误识,从而提高大词汇量情况的下非特定人手语识别的识别率和速度.
- 倪训博赵德斌姜峰程丹松
- 关键词:VITERBI算法DTW算法隐MARKOV模型
- 一种新的类增量学习方法被引量:2
- 2011年
- 提出一种新的基于超椭球的类增量学习算法。对每一类样本,在特征空间求得一个包围该类尽可能多样本的最小超椭球,使得各类样本之间通过超椭球隔开。类增量学习过程中,只对新增类样本进行训练。分类时,通过计算待分类样本是否在超椭球内判定其所属类别。实验结果证明,该方法较超球方法提高了分类精度和分类速度。
- 秦玉平陈一荻王春立王秀坤
- 关键词:缩放因子
- 基于句子相似度的论文抄袭检测模型研究被引量:9
- 2011年
- 提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。
- 冷强奎秦玉平王春立
- 关键词:句子相似度抄袭检测
- 实现兼类样本增量学习的一种算法
- 2009年
- 针对兼类样本,提出一种增量学习算法。利用超球支持向量机,在特征空间对属于同一类别的样本求得一个能包围该类尽可能多样本的最小超球,使各类样本之间通过超球隔开。增量学习过程中,只对新增样本以及与新增样本具有相同兼类的旧样本集中的支持向量进行训练,且每次训练只针对一类样本,使得算法在很小的样本集、很小的空间代价下实现兼类样本增量学习,同时保留了与新增样本类别无关的历史训练结果。分类过程中,通过计算待分类样本到各超球球心的距离判定其所属类别,分类准确快捷。实验结果证明了该算法的有效性。
- 秦玉平王秀坤王春立
- 关键词:支持向量机超球
- 基于最大间隔最小体积超球支持向量机的多主题分类算法被引量:1
- 2012年
- 针对多主题分类,结合最大间隔最小体积超球支持向量机和模糊理论,提出一种多主题最大间隔最小体积超球支持向量机来实现多主题分类。该算法首先基于最大间隔最小体积超球支持向量机,采用1-a-r方法训练子分类器,通过子分类器得到待分类样本的隶属度向量,再依据隶属度向量判定该待分类样本所属类别。实验结果表明,该算法具有较好的准确率、召回率、F1值。
- 艾青赵骥秦玉平