唐朝辉
- 作品数:8 被引量:23H指数:3
- 供职机构:厦门理工学院外国语学院更多>>
- 发文基金:国家自然科学基金厦门市科技计划项目国家杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 潜在语义分析的英汉口译语料库挖掘被引量:1
- 2015年
- 分析潜在语义分析的理论基础,结合英汉口译语料库的相关特点,提出了基于潜在语义分析的口译语料相似度的度量方法.基于PACCEL英汉口译语料库的实验表明,该方法的检索精度为0.79,召回率为0.59,F1为0.68,检索时间为1.124 s,在检索精度、召回率、F1值以及时间效率上均显著优于实验的参照方法.该方法能为用户提供更有效的检索推荐以及在扩展语料库时自动探析语料库存在的数据冗余,为语料库的构建和扩展提供了有效指导.
- 郑丽芳唐朝辉
- 关键词:语料库英汉口译知识挖掘潜在语义分析
- 基于粗糙集正域的手写字母识别算法被引量:3
- 2014年
- 针对手写字母识别的特点,结合粗糙集相关理论,提出了一种新的手写字母识别算法。通过对采集的样本进行正态分布假设验证,保证样本的可靠性;利用粗糙集上近似、下近似以及正域概念,对手写样本决策系统进行特征选择以简化决策系统,并进一步提炼手写分类规则。实验结果表明,新算法具有较高的识别准确率,是有效可行的。
- 唐朝辉陈玉明吴克寿
- 关键词:粗糙集正域手写识别
- 基于邻域熵的决策表约简
- 粗糙集理论是一种新的处理不精确、不确定与不完全数据的数学理论工具。针对传统粗糙集理论难以处理连续型数据的特点,提出基于邻域熵的决策表约简方法。该方法通过引入邻域关系进行信息粒化,定义邻域熵概念,用来度量连续型数据的不确定...
- 陈玉明吴克寿唐朝辉
- 关键词:粗糙集邻域关系基因表达数据
- 基于邻域关系的网络入侵检测特征选择被引量:6
- 2014年
- 入侵检测数据集具有数据量大、特征数众多、连续型数据的特点。粗糙集是一种有效处理不确定性、不一致性、海量数据的有效分类工具,其特点是保持入侵检测数据集的分类能力不变,进行特征选择。为了避免传统粗糙集特征选择方法所必需的离散化过程带来的信息损失,引入邻域粗糙集模型,提出基于邻域关系的网络入侵检测数据特征选择方法。该方法从所有特征出发,根据特征重要度逐步删除冗余的特征,最后得到关键特征组进行分类研究。在CUP99入侵检测数据集上进行特征选择,并进行了分类实验,实验结果表明该方法是有效可行的。
- 陈玉明谢斐星吴克寿唐朝辉
- 关键词:粗糙集邻域关系入侵检测
- 基于邻域熵的决策表约简
- 2014年
- 针对传统粗糙集理论难以处理数值型数据的特点,提出基于邻域熵的决策表特征约简方法.该方法通过引入邻域关系进行信息粒化,定义邻域熵概念,用来度量数值型数据的不确定性,证明邻域熵的单调性原理,提出基于邻域熵与分类精度加权的特征重要度概念,基于邻域熵单调性原理设计了两种启发式特征约简算法.理论分析与实例表明该方法是有效可行的.
- 陈玉明吴克寿唐朝辉
- 关键词:粗糙集决策表
- 融合正域及边界质量的实域属性约简方法
- 2012年
- 基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.
- 唐朝辉陈玉明吴克寿
- 关键词:邻域关系属性约简粗糙集
- 基于粗糙集正域的医疗决策表约简算法被引量:1
- 2012年
- 医学数据通常属性较多,这在很大程度上限制了信息系统对医疗数据的挖掘效率。通过分析粗糙集正域的相关思想,结合医学领域数据的特点,提出一种基于粗糙集正域的医疗决策表约简算法,并将其应用在医学诊断中。通过实例验证了该算法在医疗决策表约简中的正确性和有效性,具有一定的实用价值。
- 唐朝辉陈玉明
- 关键词:粗糙集正域决策表约简
- 邻域系统的不确定性度量方法被引量:12
- 2014年
- 针对离散型数据系统的不确定性度量方法难以有效解决邻域系统不确定性度量的问题,引入邻域粗糙集模型,提出邻域精确度、邻域知识粒度和基于邻域知识粒度的近似精度等邻域系统不确定性度量方法,进一步从理论上证明其有效性.实验结果表明,基于邻域知识粒度的近似精度具有更严格的单调性,优于邻域近似精度的邻域系统对不确定性度量的效果.
- 唐朝辉陈玉明
- 关键词:邻域系统粗糙集知识粒度