徐波
- 作品数:3 被引量:3H指数:1
- 供职机构:复旦大学计算机科学技术学院更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于事务日志的社会网络抽取被引量:2
- 2015年
- 社会网络分析(social network analysis,SNA)是数据挖掘领域的一个重要研究方向,社会网络数据的质量和规模对研究十分重要.在当前的社会网络分析研究中,大多数是基于社交网站生成的社会网络,社交网站生成的在线社会网络只是对真实社会网络近似模拟,其现象、结论无法代表真实社会网络;少数基于真实社会网络的研究中,由于数据采集难度较大,往往只能使用规模有限的社会网络,从而降低了分析结果的可信程度.现代软件系统产生大量的事务日志让构建基于真实环境的社会网络成为可能.以高校学生卡管理系统产生的事务日志为例,探索如何从海量事务日志中抽取社会网络.根据事务日志的特征,建立以共现(co-occurrence)特征为基础的网络抽取模型,抽取出所有可能构成这个社会网络的边;定义了一个基于边的权重和Jaccard相关性系数的边存在系数,识别网络中的噪音边,筛选噪音边;最后,通过同班级比率分析和网络拓扑结构分析,对抽取的网络进行验证.实验结果表明,所抽取的网络具有很高的同班级比率,该抽取模型具有较好效果,同时该网络具有小世界网络(small-world)特征和满足无标度(scale-free)度分布,符合常见社会网络特征.
- 陈创徐波肖仰华施佺汪卫
- 关键词:社会网络分析事务日志共现剪枝
- 一种基于URL枚举的网络实体爬取方法研究
- 互联网上的信息呈爆炸式增长,如何从海量的网页中爬取大量网络实体成为一个重要的研究课题.而现有的网络实体爬取策略存在不少的缺点.基于枚举的网络实体爬取策略具有许多优点,但其使用范围狭窄.在上述策略的基础上,通过研究网络实体...
- 张俊骏肖仰华徐波汪卫
- 基于Web社会网络的节点间关系多样性分析被引量:1
- 2011年
- 多样性是描述社会网络中节点行为的一个重要特性,通过对典型的大规模Web社会网络DBLP数据源提取,构建了一个大型SCN(科研合作网络),针对该网络节点间的关系进行建模与量化分析,利用节点度的累积分布、相关性、结构洞、聚类系数等网络结构特征参数,实证分析得出真实社会网络中的节点间关系具有多样化的特性,其多样性指标分布呈指数或高斯方式的衰减,具有结构洞特性的节点(作者)比其他节点更具竞争力,关系多样性强的节点倾向于彼此之间保持的联系。因此,对刻画社会网络中节点重要性具有重要意义,对实体搜索排名、广告营销等具有较好的应用价值。
- 王辉施佺徐波徐晓旻
- 关键词:社会网络多样性