安徽省自然科学基金(10040606Q42) 作品数:7 被引量:17 H指数:3 相关作者: 程玉胜 詹文法 王一宾 梁辉 查怀志 更多>> 相关机构: 安庆师范学院 安庆师范大学 大连理工大学 更多>> 发文基金: 安徽省自然科学基金 安徽高校省级自然科学研究基金 安徽省高校省级自然科学研究项目 更多>> 相关领域: 自动化与计算机技术 社会学 经济管理 电子电信 更多>>
一种相对游程长度编码方案 被引量:6 2012年 提出一种相对游程长度编码方案,以在不增加待编码数据中游程数量的情况下,达到减少待编码游程长度的目的,即通过缩短代码字长度来提高压缩效果。对ISCAS89部分基准电路的实验结果显示,提出的方案在压缩效率和解压结构方面都明显优于Golomb码、FDR码、EFDR等同类方案。 韩建华 詹文法 查怀志关键词:测试数据压缩 内建自测试 结合关键词微变和LD算法的文本相似性研究 2016年 为了解决基于传统向量空间模型的文本相似性算法没有考虑向量高维及关键词的微变,而导致文本相似性计算结果不够精确的问题,提出了关键词微变情况下基于聚类和LD算法的文本相似性算法TSABCLDA(Text Similarity Algorithm Based on Clustering and LD Algorithm)。对文本进行移除数字、标点符号和停用词等预处理;采用聚类的方法约简文本中的低频词,利用LD算法计算特征词间的相似度,建立文本相似度矩阵;用特征词相似度及其权重构建的空间向量计算文本间的相似度,这样不仅考虑了关键词微变的情况,而且有效地解决了文本向量的高维问题,将其应用于文本挖掘中,能够提高相似文本的挖掘效率。实验结果表明,由于考虑了关键词微变情况,在一定的阈值范围内,该算法文本相似性的准确率得到了明显的提高。 程玉胜 梁辉 王一宾 任勇关键词:聚类 向量空间模型 面向协同产品商务的零件信息表达与共享 2011年 根据协同产品商务中各方对零件信息统一表达和共享的需要,提出一种面向协同产品商务的零件信息表达与共享方法。该方法分析零件信息特征构成及特征间关系,并基于特征建模技术建立面向协同产品商务的零件信息特征模型,将零件信息特征模型转化为统一的XML Schema信息模式,阐述转化的基本规则,构建面向协同产品商务的零件信息共享与交换平台,该平台以XML Schema信息模式进行检验,零件信息由XML描述并通过各种XSL样式表映射,满足不同用户的显示需要,实现零件信息的共享与交换。应用实例证明了该方法的有效性和可行性。 汪洋 刘晓冰关键词:协同产品商务 零件信息 可扩展标记语言 集成电路测试数据减少技术综述 2013年 通过减少测试数据来减少测试成本是集成电路测试领域的热点之一。文章综述了测试数据减少技术,分析了每一种技术的优缺点,指出了该技术的发展需求和方向。 詹文法 程玉胜关键词:测试数据压缩 内建自测试 文字云及主题模型的统计挖掘 2014年 互联网等信息技术的迅猛发展使网络中积累了大量半结构化和非结构化的文本数据,如何从这些海量电子文档中获取需要的信息并以高效直观信息图的形式展现,成为统计分析工作者的一项主要任务。文字云是信息图表达的一种新型文本显示方式,利用文字云和主题模型文本挖掘方法,对文本进行移除数字、去除停用词等预处理操作,然后执行中文分词,构建语料库,建立文档-词条矩阵,最后以文字云和主题模型的形式呈现挖掘结果。实验中主要利用R语言,以多年粗糙集会议纪要为实验数据进行了相关统计分析,并对比了Tagxedo文字云生成器,结果表明,从文字云中比较容易获取文本的重要信息如主题模型等,挖掘效果较好。 程玉胜 梁辉关键词:文本挖掘 主题模型 统计分析 粗糙集 求解N皇后问题的片上多核并行混合遗传算法 被引量:4 2015年 遗传算法求解大规模皇后问题的耗时长、速度慢。为此,在分析现有N皇后问题求解方案和并行遗传算法的基础上,将动态规划引入到局部搜索策略中,在多核平台实现粗粒度并行遗传算法(CPGA)用于求解N皇后问题,避免传统的粗粒度并行种群迁移、通信等开销。针对并行化后多个子种群解趋同、迭代慢等问题,提出改进的面向遗传算子并行化的遗传算法(OOPGA)。实验结果表明,改进后的OOPGA算法在运行时间、加速比等方面均比CPGA算法好。 张步忠 程玉胜 王一宾关键词:遗传算法 粗粒度 N皇后问题 基于风险决策的文本语义分类算法 被引量:7 2016年 传统的文本分类多以空间向量模型为基础,采用层次分类树模型进行统计分析,该模型多数没有结合特征项语义信息,因此可能产生大量频繁语义模式,增加了分类路径。结合基本显露模式(e EP)在分类上的良好区分特性和基于最小期望风险代价的决策粗糙集模型,提出了一种阈值优化的文本语义分类算法TSCTO:在获取文档特征项频率分布表之后,首先利用粗糙集联合决策分布密度矩阵,计算最小阈值,提取满足一定阈值的高频词;然后结合语义分析与逆向文档频率方法获取基于语义类内文档频率的高频词;采用e EP分类方法获得最简模式;最后利用相似性公式和《知网》提供的语义相关度,计算文本相似性得分,利用三支决策理论对阈值进行选择。实验结果表明,TSCTO算法在文本分类的性能上有一定提升。 程玉胜 梁辉 王一宾 黎康关键词:文本分类 语义 基本显露模式