曾志勇
- 作品数:43 被引量:178H指数:6
- 供职机构:云南财经大学信息学院更多>>
- 发文基金:云南省教育厅科学研究基金教育部人文社会科学研究基金云南省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学社会学更多>>
- 微博用户影响力模型研究
- 2015年
- 本文建立的算法可用于在微博中寻找影响力大的用户,并为控制虚假新闻的传播提供有效的途径。笔者在分析微博用户的影响力中,发现本文提出的算法相对原始的PageRank算法更具有合理性;通过分析原始的PageRank与改进的PageRank的基础上,我们考虑引进用户内在影响力建立偏随机游走的PageRank算法;基于偏随机游走的PageRank对用户的影响力具有更好的分析性。本文没考虑到地域性的差异,怎么结合地域的特点来建立模型也是下一步研究的重点。如果能较好地结合时间性与地域性的特点,那么我们能更好地预测重点舆论爆发的时问,并且有效地进行控制。
- 毕秋敏倪明明曾志勇
- 关键词:PAGERANK主题模型
- 一种主动学习和协同训练相结合的半监督微博情感分类方法被引量:5
- 2015年
- 【目的】针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法。【方法】在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类。【结果】使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高。特别是在已标注样本占40%的情况下,提升5%左右。【局限】在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件。【结论】引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率。
- 毕秋敏李明曾志勇
- 关键词:情感分类
- 大学生手机阅读满意度调查与分析被引量:5
- 2015年
- 本文利用李克特量表式问卷对昆明高校600个大学生样本进行手机阅读满意度调查。调查发现手机阅读、电脑阅读与纸质阅读,大学生各有偏好。大学生手机阅读的总体满意程度表现为中等水平,满意度情况整体积极,但对内容、版面设计、网速等方面的满意度相对较低。目前的阅读资源满足读者阅读需求方面尚有较大的提升空间。
- 毕秋敏曾志勇陈楠
- 关键词:大学生手机阅读满意度
- 并行k均值聚类算法的完备性证明与实现被引量:6
- 2010年
- 对经典k均值算法进行分析,证明如何在减少节点间通信代价的情况下,从局部聚类信息生成完备的全局聚类信息,使聚类质量等价于相应串行算法,并具有较高的执行效率,在此基础上给出可信的基于消息传递接口的并行k均值算法。实验结果表明,该算法是高效的和可行的。
- 陶冶曾志勇余建坤冯涛
- 关键词:聚类K均值算法消息传递接口
- 高性能数据挖掘研究
- 2007年
- 高性能数据挖掘是大数据量数据挖掘的必然解决方案,本文首先介绍了高性能数据挖掘的必要性和方法,然后系统地阐述了高性能数据挖掘的国内外研究现状,最后对其未来的研究方向及其面临的挑战进行了总结和展望。
- 曾志勇
- 关键词:数据挖掘并行计算机群
- 优秀政务微博应用特征研究被引量:4
- 2012年
- 政务微博越来越受到政府重视,已成为各地政府应用新媒体贴近民生民意的平台。而如何提高政务微博应用水准,充分发挥其服务群众服务社会的作用,是当前值得深入探讨的一个重要课题。"上海发布"、"成都发布"等领先全国的优秀政务微博在应用方式上体现出的集群化、多样化、规范化的特征和强烈的服务意识,为各地广泛应用政务微博提供了可借鉴的经验和效仿的范本。
- 毕秋敏曾志勇
- 关键词:集群化
- 基于信息熵的软件开发风险度量模型被引量:2
- 2009年
- 给出一个定量的基于信息熵的软件开发风险度量模型,该模型考虑了由于风险因素带来的损失及其发生概率,实践表明该模型能有效地综合度量软件开发风险。
- 姜茸廖鸿志张新明曾志勇
- 关键词:信息熵软件开发软件工程
- 基于成本利润的电信流失客户挽留策略研究
- 2020年
- 在全球电信市场竞争激烈的情况下,电信运营企业普遍都存在客户流失率居高不下的问题。如何做好客户流失预警工作,降低用户离网率,对将要流失的客户采取相应的挽回措施,都是电信运营企业为降低企业营销成本、提高经营绩效必须要解决的问题。客户流失预警作为一种有效的客户流失管理方法,通过构建预警模型,可以减少客户流失,减少企业损失。本文结合美国DUKE大学TERADATA客户关系管理中心的100 000条虚拟客户数据,通过构建模型对通信客户的潜在流失行为进行识别,结合成本利润模型实现对潜在流失客户的挽回,实现企业成本最小化,利润最大化。
- 刘光榕刘梦婷曾志勇
- 关键词:客户流失预测客户忠诚度粒子群优化算法
- 基于星型模型的关联规则挖掘方法被引量:1
- 2007年
- 星型模型是数据仓库中最常用的数据组织方式,对星型模型进行数据挖掘具有实际的意义。在单维Apriori算法和前人工作的基础上,介绍了对带有时态约束的星型模型进行多维关联规则挖掘的方法,并举例说明。
- 曾志勇
- 关键词:数据仓库星型模型关联规则
- 负载均衡的FP-growth并行算法研究被引量:11
- 2010年
- 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。
- 曾志勇杨呈智陶冶
- 关键词:数据挖掘