湖南省哲学社会科学基金(13YBA302)
- 作品数:7 被引量:38H指数:4
- 相关作者:陈雪刚张家录李东晖廖晓兰程杰仁更多>>
- 相关机构:湘南学院湖南农业大学海南大学更多>>
- 发文基金:湖南省哲学社会科学基金教育部人文社会科学研究基金湖南省科技计划项目更多>>
- 相关领域:文化科学自动化与计算机技术理学社会学更多>>
- 大数据价值及其在网络舆情挖掘中的应用被引量:4
- 2017年
- 在线网络已成为思想文化信息的集散地,缺乏有效监控将对社会发展产生不良影响,利用现有数据挖掘技术对大数据环境下的在线网络舆情的发展与演化进行研判和预测是有限的.本文从不同的学科角度论述了在线网络舆情研究现状,揭示出大数据对在线网络舆情研究的重要性,并从政府、学术研究界和企业界方面论述了大数据的战略价值,介绍了大数据技术以及在网络舆情中的应用,对大数据在网络舆情研究的发展方向进行了展望,为大数据在网络舆情中应用研究提供指导.
- 陈雪刚张家录程杰仁
- 关键词:大数据舆情数据挖掘
- 一种新的随机模糊属性的最小知识约简被引量:1
- 2014年
- 针对信息系统随机模糊属性的约简问题,提出一种新的关于随机模糊属性的知识约简方法。该方法在传统信息系统知识约简基础上,提出了随机模糊信息系统及相关概念,引入了模糊信任测度和似然测度,然后给出并证明了随机模糊信息系统上的知识约简理论。在这些理论的基础上,提出基于模糊信任测度和似然测度的约简方法并分析该算法的时间复杂性。理论分析和例证分析表明,该方法能快速并有效地实现知识约简。
- 李东晖陈雪刚廖晓兰张家录程杰仁
- 关键词:信任测度核属性最小约简
- 经典命题逻辑的概率语义及其应用被引量:8
- 2014年
- 文中将经典命题逻辑的赋值域由二值({0,1})推广到概率空间,引进了命题公式的概率赋值并建立命题逻辑的概率语义,证明了一个命题公式为重言式当且仅当其在每个概率赋值下的值都等于1.引入了命题公式的概率真度、不确定度、Λ-概率真度、Λ-不确定度等概念,并说明了Λ-概率真度是已有的二值命题逻辑各种真度概念的推广,通过讨论Λ-概率真度的性质,表明Λ-概率真度在全体公式集F(S)上满足Kolmogorov公理.证明在形式推演的一个有效推理中,结论的Λ-不确定度不超过各前提的Λ-不确定度与其必要度的乘积之和.利用公式的Λ-不确定度引进公式间的Λ-相似度和Λ-伪距离,证明了在一定条件下所建立的Λ-伪距离空间没有孤立点且通常的逻辑运算关于Λ-伪距离是连续的.在Λ-伪距离空间中,提出了F(S)上的两种不同近似推理模式,并通过实际应用例子说明所提出的近似推理模式是有效的.
- 张家录陈雪刚赵晓东
- 关键词:概率逻辑
- 从师资培训角度谈网络工程专业应用型人才培养方案改革被引量:2
- 2015年
- 师资力量培训是网络工程专业应用型人才培养模式改革的重要组成部分,通过校企合作,提升教师的项目应用能力,挖掘开发更优的师资力量,旨在更好地培养学生工程应用能力。从师资培训必要性,师资培训对专业理论、专业技能的提升等方面着手论述了网络工程培训中的一些心得,并由此提出了网络工程专业应用型人才培养实践改革措施。
- 陈雪刚段盛龚德良刘平
- 关键词:网络工程校企合作师资培训
- 一种主题知识自增长的聚焦网络爬虫被引量:9
- 2014年
- 聚焦网络爬虫是各类因特网文本挖掘和信息检索应用必需的处理步骤。现有聚焦网络爬虫面临着知识描述困难、误差易被放大等挑战。发现网页中主题知识存在的若干性质,提出一种主题知识自增长的聚焦网络爬虫KAG-Crawler,在网页爬取过程中采用一种无监督的学习技术不断扩展主题知识,从而使爬虫在一个简单的初始主题描述条件下,能够以较高正确率爬取大量网页。同时为便于主题知识的扩展,还提出一种新的主题表示模型,并基于该模型构建了新的网页主题和URL主题相关度方法。最后在真实环境下的实验表明,KAG-Crawler的性能显著高于传统基于文本相似度的聚焦网络爬虫。
- 李东晖廖晓兰范辅桥黄九鸣陈雪刚
- 关键词:无监督学习知识扩展主题相关度
- 基于云计算的网络舆情藤蔓式串并行聚类方法研究被引量:2
- 2017年
- [目的/意义]针对目前在线网络海量信息难以快速获取其舆情的问题,为有效提升舆情获取速度,提出一种基于云计算的网络舆情藤蔓式串并行聚类方法。[方法/过程]首先构建舆情文本相似性度量模型,并设计确定舆情最佳聚类阈值的方法,以度量舆情信息间的相似性及确定舆情最佳聚类阈值;然后构建舆情藤蔓式串并行聚类模型,以一个舆情主题为聚类起始,之后如藤蔓的主干自动分支和延伸样,自主扩展舆情聚类主题,并根据舆情信息间的相似性和聚类阈值聚类同主题的舆情信息;最后在舆情藤蔓式串并行聚类模型的基础上,利用云计算的并行计算能力,快速、准确地聚类各主题的舆情信息。[结果/结论]实验结果表明:该方法能快速获取网络舆情,且具有较高的舆情聚类准确度,可为在线网络舆情实时监控提供一定的方法支持。
- 陈雪刚
- 关键词:云计算
- 基于大数据技术的微博舆情快速自聚类方法研究被引量:12
- 2017年
- [目的/意义]针对海量的微博舆情信息及微博在网络舆论场中的重要作用,如何快速、准确地获取微博舆情,是提升网络舆情实时监测及分析能力的关键课题之一。目前已能以较高的准确度获取微博舆情,但仍存在舆情获取耗时长问题,为较有效地解决该问题,提出一种基于大数据技术的微博舆情快速自聚类方法。[方法/过程]该方法首先利用大数据技术抓取和处理海量的微博舆情信息,而后根据构建的微博文本相似度速算模型和文本自主聚类模型快速自主聚类微博舆情。文本相似度速算模型通过两文本间同名的特征词数与其特征词数量较小值的比值来度量文本相似度;而文本自主聚类模型以一个主题为聚类起始,自主自适应扩展聚类主题,并将文本相似度大于设定阈值的文本直接聚为一类。[结果/结论]实验结果表明:提出的微博舆情快速自聚类方法能快速、准确地获取微博舆情,且具有较低的舆情误报率和漏报率,可为网络舆情实时监测及分析能力的提升提供一定的方法支持。
- 陈雪刚
- 关键词:文本相似度特征词