教育部人文社会科学研究基金(08JC740011)
- 作品数:6 被引量:34H指数:4
- 相关作者:谌志群程肖陆蓓王小华吴潇泽更多>>
- 相关机构:杭州电子科技大学更多>>
- 发文基金:教育部人文社会科学研究基金浙江省科技厅重点资助项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于改进蚁群聚类的热点主题发现算法研究被引量:4
- 2010年
- 针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。
- 陆蓓程肖谌志群
- 关键词:网络舆情蚁群聚类主题
- 互联网舆情挖掘研究述略被引量:19
- 2010年
- 文章首先提出互联网舆情挖掘研究的框架层次结构,详细介绍各个层次所涉及的相关研究和关键技术,为网络舆情监控和预警综合系统的构建提供参考;然后通过对现有舆情监测系统进行比较分析,从整体上了解我国的互联网舆情研究和实践应用;最后探讨互联网舆情挖掘研究中存在的问题,并对互联网舆情关键技术的研究提出解决思路。
- 陆蓓程肖谌志群
- 关键词:网络舆情评价指标
- 基于共词分析的科技文献趋势挖掘被引量:4
- 2011年
- 采用共词分析方法对中文信息学报2000-2009年所发表的文献进行研究和分析,借助多元统计学中的聚类法,绘制出每两年为一时间段的主题战略坐标图,研究结果揭示了各时间段的研究热点分布以及主题演变情况,总结出新兴学科研究主题发展的一般规律,并探讨了中文信息处理领域的主题发展趋势。
- 吴潇泽王小华谌志群
- 关键词:共词分析聚类分析战略坐标图
- 热点主题词提取方法研究被引量:5
- 2010年
- 针对热点主题词的提取,在候选主题词的多级过滤中,尝试通过对大规模数据处理,分析其在时间标签基础上的统计规律来确定噪音词,提出联合方差的概念。基于多特征的融合提出热点主题词权重计算方法,构造出热点主题词判断公式HK,实现对热点主题词的提取。实验结果表明,该方法对热点主题词的提取有一定的效果。
- 程肖陆蓓谌志群
- 关键词:网络舆情中文分词
- 文本趋势挖掘综述被引量:3
- 2010年
- 文本趋势挖掘是文本挖掘新的研究热点,具有广阔应用前景。本文首先对文本趋势挖掘进行了概述,讨论了文本趋势挖掘的应用领域。然后综述了文本趋势挖掘的国内外研究现状,详细介绍了文本趋势挖掘的主流方法与技术,并分析了现有方法存在的主要问题。最后指出了文本趋势挖掘未来的发展方向。
- 谌志群
- 关键词:文本挖掘文本主题
- 视频聊天预警系统核心模块的设计与实现
- 2012年
- 该文针对互联网视频聊天中可能存在的色情内容,设计并实现了一个基于普通二进制分类树的判别系统,构成视频聊天预警系统的核心模块。该判别系统结合了相似性,肤色,人脸等特征,通过对视频截图的敏感性判别,将结果反馈给管理者,达到安全预警的目的。实验表明,系统在截图敏感性判别时可以达到90%以上的召回率和85%以上的正检率,具有较高的实用性和应用前景。
- 汪澄王小华姚金良
- 关键词:肤色检测人脸检测