康耀红
- 作品数:96 被引量:292H指数:8
- 供职机构:海南大学信息科学技术学院更多>>
- 发文基金:海南省自然科学基金国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 潜在语义索引在文本分类中的应用被引量:4
- 2006年
- 传统的文本分类都是根据文本的外在特征进行的,最常见的就是基于向量空间模型的方法,使用空间向量表示文本,通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设,文章提出了一种基于潜在语义索引的文本分类模型,通过对大量的文本集进行统计分析,揭示了词语的上下文使用含义,通过奇异值分解有效地降低了向量空间的维数,消除了同义词、多义词的影响,从而提高了文本分类的精度。
- 伍建军康耀红
- 关键词:潜在语义索引文本分类奇异值分解
- 基于组合分类器的联机手写汉字识别被引量:1
- 2007年
- 提出一种基于二级组合分类器的汉字手写体识别方法,首先提取汉字的整字特征和笔划特征;进行单字识别的过程中,GA-BP笔划分类器起着对汉字识别的主导作用,当写入汉字出现连笔、字形变化导致系统产生拒识情况时,采用隐马尔可夫整字分类器作为辅助去提高整体的识别率.
- 郑桢康耀红
- 关键词:整字笔划GA-BP网络隐马尔可夫模型
- 关于文本分类中特征选择方式的研究
- 文本分类的一个关键点就是如何对高维的特征集进行降维。而特征降维的一般方法就是特征选择。介绍了几种常见的特征选择方法,并结合K-近邻分类算法对这四种特征选择方法进行了分类测试,最后通过测试分析,提出了一些改进的、可行的互信...
- 伍建军康耀红
- 关键词:文本分类K近邻法
- 文献传递
- 基于嵌入式技术的实验数据网络监测系统
- 2006年
- 随着测控技术与网络技术日益紧密的结合,嵌入式系统的发展和应用已经渗透到日常生活的各个方面.笔者结合近年的实践教学,利用嵌入式技术实现开放实验室的教学管理以及学生实验数据的网上监测,分析了整个系统的功能、特点、基本结构以及实现方法.
- 杜育宽康耀红
- 关键词:嵌入式技术以太网TCP/IP协议串口通信实践教学
- 关于广义向量空间模型中布尔运算的修正
- 本文对广义向量模型进行了全面系统的介绍,对其存在的问题和不足进行了认真的讨论和分析,通过对该模型中交运算的重新定义建立了修正的广义向量空间模型,并从理论上证明了新的模型能够克服传统广义向量空间模型存在的主要问题.
- 石敏康耀红
- 关键词:信息检索
- 文献传递
- 基于颜色特征图像检索方法的研究被引量:4
- 2008年
- 对颜色特征进行了分析,对颜色空间的选取,颜色的量化,颜色相似度进行了描述,论述了基于颜色特征图像检索的主要方法直方图相交法,主要颜色表示法,基于参考颜色表方法,基于区域的颜色法及其它们的改进方法,并作出了相应的比较。
- 高进乐康耀红伍小芹
- 关键词:图像检索颜色直方图
- 基于文本挖掘的科研项目管理研究
- 林明才吴洪丽张诚一康耀红桂占吉刘家宁张学平李德育周瑞琼莫状坚符策群
- 该项目将文本聚类技术引入到科研项目立项管理中,以科研项目申请书为研究对象,研究科研文本特征项的选择及科研文本的表示,文本聚类技术在科研立项管理的应用方法,并结合科研文本特点,提出一种新的面向科研立项管理应用的模糊聚类算法...
- 关键词:
- 关键词:知识管理平台
- 基于改进的互信息特征选择的文本分类被引量:10
- 2006年
- 使用传统的互信息评估函数进行特征选择方法,得到的分类精度并不高。提出了一种考虑词频作用的互信息评估函数,并采用了K-近邻算法进行文本分类测试,通过分析测试结果,使用改进的互信息评估函数进行特征选择,提高了文本分类的精度。
- 伍建军康耀红
- 关键词:互信息K-近邻法文本分类
- Web新闻自动采集发布系统的设计与实现被引量:7
- 2009年
- 针对新闻网站通过人工方式采集发布来自其它网站的Web新闻费时费力、易重采与漏采这一问题,综合运用Web信息采集技术、网页去噪技术、文本文档消重技术以及文本自动分类技术设计并实现了一种基于网络爬虫的Web新闻自动采集发布系统。在给出系统总体结构的基础上,对其各个模块的功能、设计与实现方法进行了详细介绍。实验表明,该系统设计合理,具有采集效率高、消重准确、集成方便、运行费用低等优点,可作为新闻网站的采编工具加以推广使用。
- 张春元康耀红伍小芹
- 关键词:网络爬虫网页去噪
- Web信息检索排序算法研究被引量:2
- 2009年
- 系统地研究了Web信息检索常用排序算法,即基于Web页面内容的排序算法、基于Web页面链接分析的排序算法和基于检索用户的排序算法,并对其优缺点进行了分析.在此基础上,对Web信息检索排序算法的发展趋势进行了展望.
- 张春元康耀红伍小芹
- 关键词:WEB信息检索网页排序算法