四川省科技攻关计划(07GG006-014)
- 作品数:26 被引量:129H指数:5
- 相关作者:钟勇朱颢东崔梦天周姝赵海军更多>>
- 相关机构:中国科学院成都计算机应用研究所中国科学院研究生院西华师范大学更多>>
- 发文基金:四川省科技攻关计划四川省科技计划项目中国科学院西部之光基金更多>>
- 相关领域:自动化与计算机技术电子电信理学自然科学总论更多>>
- 结合优化的文档频和LSA的特征选择方法被引量:2
- 2009年
- 为了提高文本分类算法的效率和精度,必须使用特征选择算法来降低特征空间的维数。然而许多常用特征选择算法在选择属性时,只是利用特征的权重而并没有考虑特征之间的隐含关系,使得得到的特征集存在一定的冗余,并不具备较好的代表性。首先给出了一个基于最小词频的文档频方法,并用它过滤掉一些词条以降低文本矩阵的稀疏性,然后使用LSA进行词语间的语义分析,消除同义词和多义词的影响,提高了文本分类的速度与精确度。实验结果表明此种特征选择方法效果良好。
- 朱颢东钟勇
- 关键词:文本分类词频潜在语义分析
- ATM网络中全动态视频源的二次建模
- 2009年
- 通过对ATM网络视频业务传输性能及其建模分析,针对高运动性(即全动态)视频源的建模,给出基于块的MPEG运动估计算法,提出一种非线性模型。基于自回归在GOP层对MPEG视频流进行二次建模。仿真表明,该文提出的NAR模型能准确预测具有适度运动性的实际MPEG流,对具有高运动性的流在不同的负荷和缓冲器的条件下提供可接受的预测。
- 赵海军崔梦天李明东
- 关键词:非线性模型
- 使用PGA的特征选择方法被引量:1
- 2009年
- 特征选择是文本分类系统的核心步骤之一。然而现有的特征选择方法都是串行化的,应用于中文海量文本数据时时间效率较低,因此利用并行策略来提高特征选择的效率,已经成为研究的热点。详细设计了一个用于特征选择的并行遗传算法,该算法采用遗传算法搜索特征,利用并行策略评价特征子集,即将种群中个体的适应度计算并行在多个计算节点上同时进行,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。
- 马春华朱颢东
- 关键词:文本分类遗传算法
- 一种有效的特征词获取方法被引量:1
- 2009年
- 目前很多知识库中的领域特征主要依靠专家手工来获得,不但费时费力,而且知识库的质量受专家知识与经验的限制。虽然也存在一些领域特征的自动获取方法,但它们提取的特征集大多存在冗余。因此,较具代表性的领域特征集的有效自动获取成为一个亟待解决的问题。首先分析了一些领域词语自动获取方法的不足,对它们加以改进,然后利用改进方法实现在大规模分类语料中自动获取领域词语的目的,最后利用粗集理论对所得领域词语集进行属性约简,从而得到冗余度低、代表性好的领域特征集。实验验证了所提方法的有效性和实用性。
- 马春华朱颢东
- 关键词:知识库特征提取粗集属性约简
- 结合粗集和神经网络的图像识别模型被引量:2
- 2010年
- 通过对粗集和神经网络在图像识别中的作用分析,以及对两者结合的可能性研究,将粗集和神经网络进行了有机结合,提出了一个基于粗集和神经网络的图像识别模型。该模型先对原始图像数据进行预处理,然后用粗集进行特征选择,减少了神经网络的输入维数,提高神经网络学习和识别速度,也提高了识别正确率。最后将该模型应用于手写体数字图像识别之中,实验结果表明,该模型是有效的、可行的。
- 朱颢东钟勇
- 关键词:粗集神经网络图像识别
- 基于规则综合质量的属性值约简算法被引量:3
- 2009年
- 属性值约简是粗集理论的核心内容之一。将属性值约简和数据挖掘相结合,给出支持度、置信度、覆盖度的定义。在此基础上,提出了一种新的属性值约简算法—基于规则综合质量的属性值约简算法.通过算法复杂度分析说明,该算法在一定程度上解决了属性值约简的NP难问题。实例仿真表明该算法在解决一些相关实际问题方面是可行的,具有一定的实用价值。
- 朱颢东钟勇
- 关键词:属性值约简粗集算法复杂度NP难问题
- 基于优化的文档频和粗糙集的特征选择方法被引量:5
- 2009年
- 特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用基于最小词频的文档频方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.
- 朱颢东钟勇
- 关键词:文本分类词频属性约简粗糙集
- 基于相似矩阵的连续域决策表属性约简算法
- 2010年
- 把模糊集和粗糙集结合起来,对连续域决策表属性约简算法进行了研究。首先,使用三角隶属度函数将连续属性值转化为模糊值;然后定义了两模糊对象间的相似度、模糊对象的相似类以及连续属性在对象集上划分所形成的相似类集组成的特征向量;给出了连续型属性的数字特征向量,并以此为基础建立了连续属性间的相似矩阵;最后,提出了一个新的属性约简算法,并用实例进行了验证。
- 黎仁国钟勇魏世博
- 关键词:模糊集相似矩阵属性约简
- 一种无决策属性的信息系统的属性约简算法被引量:3
- 2010年
- 经典属性约简及其延伸算法是基于有决策属性的信息系统的属性约简算法,它们对无决策属性的信息系统的属性约简无能为力.为此,本文以粗集理论为基础,对无决策属性的信息系统从集合论的论域划分方面进行研究,提出了一种适用于无决策属性的信息系统的启发式属性约简算法.该算法在一定程度上能够解决无决策属性的信息系统属性约简问题,进一步扩展了粗集理论的应用范围.实例表明该算法是有效可行的.
- 朱颢东钟勇
- 关键词:属性约简信息系统集合论
- 一种基于SAGE的高性能PIM的解决策略
- 2008年
- 针对主处理器和存储处理器之间运行速度存在差距,为了减少运行时间和充分利用PIM结构的优越性,按照这两种不同处理器的特点,提出了使用语句分析分组估算(SAGE)系统来实现PIM高速性的一种新策略.在该策略里,源程序被分割成块,同时为主处理器和存储处理器生成一个可用的运行调度机制,这个调度机制具有低的时间复杂度,并给出了新策略的同步机制.实验和结果充分论证了所提出策略的有效性.
- 傅德月