您的位置: 专家智库 > >

康健

作品数:4 被引量:28H指数:3
供职机构:西南交通大学信息科学与技术学院更多>>
发文基金:教育部人文社会科学研究基金中央高校基本科研业务费专项资金中国博士后科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 4篇聚类
  • 3篇群体智能
  • 2篇文本聚类
  • 2篇聚类算法
  • 2篇半结构化
  • 2篇藏文
  • 2篇藏文文本
  • 1篇舆情
  • 1篇舆情分析
  • 1篇网络舆情
  • 1篇聚类分析
  • 1篇聚类技术
  • 1篇聚类模型
  • 1篇类模型
  • 1篇架构
  • 1篇分布式
  • 1篇分布式架构
  • 1篇MULTI-...

机构

  • 4篇西南交通大学
  • 3篇西藏大学
  • 1篇广西师范学院
  • 1篇电子科技大学
  • 1篇华东师范大学
  • 1篇成都信息工程...
  • 1篇四川大学
  • 1篇浙江大学

作者

  • 4篇康健
  • 3篇韩楠
  • 2篇乔少杰
  • 2篇格桑多吉
  • 1篇李天瑞
  • 1篇杨燕
  • 1篇张小松
  • 1篇高云君
  • 1篇元昌安
  • 1篇洪西进
  • 1篇唐常杰
  • 1篇尼玛扎西
  • 1篇范小刚

传媒

  • 1篇模式识别与人...
  • 1篇计算机学报
  • 1篇电子科技大学...

年份

  • 1篇2018
  • 1篇2015
  • 1篇2014
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
基于Single-Pass的网络舆情热点发现算法被引量:16
2015年
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。
格桑多吉乔少杰韩楠张小松杨燕元昌安康健
关键词:舆情分析文本聚类
基于群体智能的半结构化藏文文本聚类算法
为了将群体智能技术应用于半结构化的藏文Web文本聚类中,提出了基于群体智能的半结构化藏文Web文本聚类算法SCAST (A Semi-structured Tibetan Text Clustering Algorith...
康健乔少杰格桑多吉韩楠尼玛扎西范晓刚
关键词:群体智能藏文聚类技术
基于Multi-Agent的分布式文本聚类模型被引量:5
2018年
Internet网络大数据与日俱增,当前亟需设计出能够处理大规模半结构化和无结构化文本数据的新型聚类方法.现有工作的不足体现在:应用的文本集较为单一,对半结构和无结构的Web文本进行聚类的准确性较低,当文档规模较大时聚类的时效性无法得到保证.针对上述不足,提出新的基于群体智能的文本聚类模型Switch(a Swarm intelligence based text clustering algorithm),支持包括藏文、汉文、英文等多语言的文本聚类.基本思想为:构建文本的向量空间模型,借助自然语言处理和数据预处理技术得到由特征向量构成的文本集合;对群体智能文本聚类算法的参数进行初始化,不同智能体可以在二维文本空间上任意移动,计算其所在网格区域文本与其他样本的相似度,利用概率转换函数求取智能体拿起和放下样本的概率,进而实现文本聚类.提出分布式动态文本流聚类的multi-agent架构,将这一架构应用于群体智能文本聚类算法中,分布式工作环境被设计成相互通信的软agents集合,设计了相似度计算,智能体状态感知,文本解析三类智能体.通过解决智能体状态同步、处理器负载均衡和处理器之间通信的代价问题,将计算任务分成不同子任务,在多处理器上分布执行.此外,阐述了基于multi-agent的分布式群体智能文本聚类方法的工作原理,给出一种分布式通信架构,各种智能体相互通信,相互协作完成文本聚类工作.基于multi-agent通过JADE(Java Agent Development Framework)中间件实现集群上的分布式文本聚类,优势在于:分布式计算和大内存处理较单机具有更好的处理能力,借助JADE中间件能够使智能体间相互通信及协作,实现高效的文本聚类.在大量真实的半结构化包含藏文、汉文和英文多语言的Web文本数据集上进行实验,以藏文为例,实验结果表明:相比于k-means和单节点上的群体智能聚类算法,提出的分布式�
乔少杰韩楠金澈清高云君李天瑞唐常杰康健
关键词:MULTI-AGENT分布式架构群体智能文本聚类
基于群体智能的半结构化藏文文本聚类算法被引量:7
2014年
将群体智能技术应用于半结构化的藏文Web文本聚类,提出基于群体智能的半结构化藏文Web文本聚类算法(SCAST).充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响,SCAST算法首先运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机放置于一个文本向量空间中.然后智能蚂蚁随机选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本.最后通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明,相较于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约8.0%.
康健乔少杰格桑多吉韩楠洪西进尼玛扎西范小刚
关键词:群体智能藏文聚类分析
共1页<1>
聚类工具0