广东省自然科学基金(04300462)
- 作品数:4 被引量:28H指数:3
- 相关作者:印鉴任江涛黄焕宇施潇潇孙婧昊更多>>
- 相关机构:中山大学清华大学广东省信息安全技术重点实验室更多>>
- 发文基金:国家自然科学基金广东省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大访问模式挖掘的数据库异常行为检测
- 2006年
- 引入访问模式描述用户访问数据库系统的主要行为特征,利用从数据库审计记录中挖掘的最大访问模式来检测数据库系统的异常行为.基于FP-tree结构,提出了一种最大访问模式挖掘算法MMAP.基于数据库系统中关系之间的外键依赖提出了一种关系距离约束,进一步减少挖掘算法的搜索空间.基于MMAP算法建立了一个检测模型,测试表明该模型能有效地检测数据库系统的异常行为.
- 刘玉葆蔡嘉荣印鉴黄志兰
- 关键词:数据库入侵检测数据挖掘
- 基于最大访问模式挖掘的数据库异常行为检测
- 引入访问模式描述用户访问数据库系统的主要行为特征,利用从数据库审计记录中挖掘的最大访问模式来检测数据库系统的异常行为.基于FP-tree结构,提出了一种最大访问模式挖掘算法MMAP.基于数据库系统中关系之间的外键依赖提出...
- 刘玉葆蔡嘉荣印鉴黄志兰
- 关键词:数据库入侵检测数据挖掘
- 文献传递
- 一种时间序列快速分段及符号化方法被引量:4
- 2005年
- 作为一类重要的复杂类型数据,时间序列已成为数据挖掘领域的热点研究对象之一。针对时间序列的挖掘通常首先需要将时间序列分段并转变为种类有限的符号序列,以利于进一步进行时间序列模式挖掘。针对当前的时间序列分段方法复杂度较大,效率不高等问题,本文提出了一种简单高效的基于拐点检测的时间序列分段方法,并且采用动态时间弯曲度量计算不等长子序列的相异度,最后运用层次化聚类算法实现子序列的分类及符号化。实验表明,本文所提出的方法切实可行,实验结果具有较为明显的物理意义。
- 任江涛何武印鉴张毅
- 关键词:时间序列符号化数据挖掘
- 一种改进的基于特征赋权的K均值聚类算法被引量:17
- 2006年
- 聚类分析是数据挖掘及机器学习领域内的重点问题之一。近年来,为了提高聚类质量,借鉴和引入了分类领域特征选择及特征赋权思想,提出了一些基于特征赋权的聚类算法。在这些研究基础上,本文提出了一种基于密度的初始中心点选择算法,并借鉴文[1]所提出的特征赋权方法,给出了一种改进的基于特征赋权的K均值算法。实验表明该算法能较为稳定地得到较高质量的聚类结果。
- 任江涛施潇潇孙婧昊黄焕宇印鉴
- 关键词:聚类初始化
- 交通流时间序列分离方法被引量:7
- 2005年
- 采用聚类分析方法对交通流时间序列进行分析可以发现典型的交通流变化模式。通常 可采用欧式距离及K均值算法进行时间序列聚类,但经分析发现单凭此方法还难以实现不同变化趋 势的交通流时间序列的有效分离。针对此问题,提出了将动态时间弯曲及灰色关联度引入交通流时 间序列相似性度量,且结合层次化聚类方法对交通流时间序列进一步分离的方法。通过实验研究,发 现基于灰色关联度的层次化聚类方法能较好地实现交通流时间序列的进一步有效分离。
- 任江涛谢琼琼印鉴
- 关键词:交通流时间序列