中国博士后科学基金(20070420711)
- 作品数:34 被引量:186H指数:9
- 相关作者:熊忠阳张玉芳刘君王银辉邓剑勋更多>>
- 相关机构:重庆大学重庆广播电视大学华为技术有限公司更多>>
- 发文基金:中国博士后科学基金重庆市自然科学基金教育部留学回国人员科研启动基金更多>>
- 相关领域:自动化与计算机技术电气工程更多>>
- 结合编辑距离和Google距离的语义标注方法被引量:10
- 2010年
- 提出了一种在领域本体指导下对网页进行语义标注的方法。该方法利用编辑距离和Google距离从词语的语法和语义两方面综合度量词汇与本体概念之间的语义相关度,从而在网页与本体之间建立映射关系。此外,对网页进行语义标注后,利用标注结果对本体进行有效扩充,使本体更趋于领域化。实验结果表明该方法是行之有效的。
- 张玉芳艾东梅黄涛熊忠阳
- 关键词:语义网本体语义标注
- 基于密度的kNN分类器训练样本裁剪方法的改进被引量:13
- 2010年
- 在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率。通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的均匀状态即两两样本之间的距离相等;二是未对低密度区域的样本做任何处理,裁剪之后仍存在大量不均匀的区域。针对这两处不足,提出了以下两点改进:一是优化了裁剪策略,使裁剪之后的训练集更趋于理想的均匀状态;二是实现了对低密度区域样本的补充。通过实验对比,改进后的方法在稳定性和准确率方面都有明显提高。
- 熊忠阳杨营辉张玉芳
- 关键词:文本分类K-近邻
- 基于FP-Tree含正负项目的频繁项集挖掘算法被引量:4
- 2008年
- 借鉴 FP_growth 算法中频繁模式树的思想,提出包含正负项目的频繁模式树的构造方法.通过对该频繁模式树进行模式扩展,可以挖掘出包含正负项目的频繁项集.该算法与直接使用 FP_growth 算法挖掘含负项目的频繁项集相比,无需对原始数据库进行负项目的扩展,也不用再构造并销毁额外的数据结构,只需在原始的频繁模式树上修改,在时间和空间的开销上都具有一定优势.实验表明,本文算法比现有的同类挖掘算法和直接 FP_growth 算法具有更好的效率.
- 张玉芳熊忠阳彭燕赵鹰
- 关键词:负项目关联规则频繁模式树频繁项集
- 改进的概率潜在语义分析下的文本聚类算法被引量:14
- 2011年
- 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。
- 张玉芳朱俊熊忠阳
- 关键词:文本聚类概率潜在语义分析参数初始化潜在语义分析
- 彩色栅格地图矢量化方法研究被引量:7
- 2008年
- 采用分区梯度模糊检测方法可以解决梯度边缘检测和模糊边缘检测方法在滤除背景时缺失前景要素的现象。利用提出的最优分量分色法,可以成功分离提取出前景要素;而在对提取出的线性要素进行细化时,提出了一种基于梯度特性的细化方法,得到的要素能很好地体现线性信息;采用现有的数学形态学方法对得到的细化要素进行后处理,最后得到了能够清晰表示要素特征的地图前景要素像素。
- 张玉芳熊忠阳陈铭灏赵鹰
- 关键词:栅格地图要素提取
- 基于上下文的领域本体概念和关系的提取被引量:14
- 2010年
- 目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。
- 张玉芳杨芬熊忠阳陈小莉
- 关键词:本体学习上下文语义相似度
- 一种新的频繁项集挖掘算法
- 通过分析Eclat算法,针对Eclat算法在产生Tidset时规模庞大、消耗系统大量内存的缺陷,提出了一种新的Eclat的改进算法——DEclat。该算法将基于划分的思想应用于Eclat中,减少了交操作时Tidset的规...
- 熊忠阳耿晓斐张玉芳
- 关键词:数据挖掘关联规则概念格
- 文献传递
- 各向异性扩散的遥感图像边缘增强方法被引量:1
- 2012年
- 为解决遥感图像边缘增强过程中辨识弱边缘和噪声的问题,提出一种改进的模糊各向异性边缘增强方法。根据非下采样轮廓波变换系数分布特征,获得像素几何结构信息;并基于各像素在不同子带的系数分布特征和噪声方差,分析其均值和最大值的模糊隶属度;利用模糊推理计算扩散系数,更好地控制各向异性扩散过程。实验结果显示,该方法具有更好的边缘增强和抑噪性能,能有效地辨识弱边缘和降低时间复杂度。
- 孙建中熊忠阳张玉芳
- 关键词:遥感图像各向异性扩散模糊推理
- 采用多尺度滤波的遥感图像关键点检测方法被引量:2
- 2012年
- 针对关键点检测过程中遥感图像会因为局部结构变形发生误检测的问题,提出一种鲁棒的关键点检测新方法。该方法首先基于映射策略和提升结构实现非下采样多尺度滤波器,用于获得平滑图像;然后根据图像尺度空间理论和尺度不变特征变换生成高斯差分尺度空间,并利用有限差分计算尺度空间采样点局部极值,子像元插值和Hessian矩阵删除不稳定极值点;最后用梯度分布直方图描述关键点。在仿真实验平台上,与现阶段方法的关键点计算时间和图像匹配性能做比较分析,实验结果表明,改进的方法有较低的计算时间复杂度,具有较好的鲁棒稳定性。
- 孙建中熊忠阳张玉芳
- 关键词:遥感图像多尺度滤波尺度不变特征变换图像匹配
- 图像多分类主动学习方法被引量:2
- 2010年
- 以决策速度快的决策导向非循环图支持向量机(Decision DirectedAcyclic Graph Support Vector Machine)为基准分类器,结合主动学习的思想,提出了一种图像多分类主动学习方法。这种方法是一种半自动的图像语义分类方法,可以将图像分成多个语义类别。该方法在最近边界主动选择方法的基础上,提出一种基于质疑度的主动选择策略。这种策略将SVMactive中提出的最近邻SVM分类面选择的反馈样例策略延伸到多分类中,通过区别对待奇异样例和容易错分样例,减少了噪声数据对分类器的干扰,提高了分类的精度。
- 刘君熊忠阳王银辉
- 关键词:支持向量机