文平
- 作品数:2 被引量:3H指数:1
- 供职机构:中国工程物理研究院计算机应用研究所更多>>
- 发文基金:中国工程物理研究院科学技术发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 上下文不一致性缺陷的检测
- 2015年
- 为了检测在软件开发过程中由拷贝-粘贴操作引起的上下文不一致性缺陷,在基于频繁子序列挖掘算法的克隆代码检测模型基础上,改进上下文不一致性缺陷检测过滤规则,对上下文结构类型不一致性和上下文条件谓词不一致性两种缺陷进行了检测。为了识别具有相同语义但不同语法结构(即语法树表示)的表达式,还增加了对生成的表达式语法树的标准化处理。开源代码上的实验结果表明,该模型对拷贝-粘贴操作引起的上下文不一致性缺陷具有较低的误检率,不存在漏检,尤其适用于安全攸关的软件系统。
- 王伟刘渊张春瑞文平谢家俊
- 关键词:克隆代码软件缺陷检测
- 基于后缀树的半监督自适应多密度文本聚类算法被引量:3
- 2016年
- 半监督文本聚类是文本聚类中的研究热点,广泛应用于数据挖掘和机器学习领域.现有基于划分和密度的半监督文本聚类算法不能适应多密度不平衡文本数据集的聚类.此外,基于向量空间的文档模型使用词或字向量表示文档特征,没有考虑到词组之间的关联性.针对以上问题,提出一种基于后缀树文档模型的半监督自适应多密度文本聚类算法.该算法基于后缀树文档模型表征文档间的相似度,使用K最近邻思想传播扩展簇标签,并在传播扩展过程中不断更新扩展阈值,以适应多密度不平衡的文本数据集.经实验验证,算法具有较高质量的聚类结果且能够适应多密度数据集.
- 文平刘渊张春瑞
- 关键词:后缀树文本聚类