2025年2月1日
星期六
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
张晓楠
作品数:
1
被引量:9
H指数:1
供职机构:
北京科技大学东凌经济管理学院
更多>>
发文基金:
中央高校基本科研业务费专项资金
国家教育部博士点基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
冯小东
北京科技大学东凌经济管理学院
杨杰
北京科技大学东凌经济管理学院
武森
北京科技大学东凌经济管理学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
云计算
1篇
文本聚类
1篇
相似度
1篇
聚类
1篇
MAPRED...
1篇
并行化
机构
1篇
北京科技大学
作者
1篇
武森
1篇
张晓楠
1篇
杨杰
1篇
冯小东
传媒
1篇
北京科技大学...
年份
1篇
2014
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于MapReduce的大规模文本聚类并行化
被引量:9
2014年
建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性.
武森
冯小东
杨杰
张晓楠
关键词:
云计算
聚类
相似度
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张