高洁
- 作品数:3 被引量:1H指数:1
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于语义相似度的Web社区主题发现
- 针对Web社区的真实性和有效性的自动评估的关键技术开展研究,在社区发现技术的基础之上,结合了信息检索技术以及语义信息,深入研究了社区主题词提取的方法。根据网页的DOM信息对页面进行处理与过滤,去除导航块、广告块;然后提取...
- 薛鸿鹄高洁刘秀德杨楠
- 关键词:WEB社区网页信息提取WORDNET
- 文献传递
- Web紧密核的抽取和评价方法(英文)被引量:1
- 2008年
- 针对web社区的发现和链接分析技术的一些关键问题,基于面向主题的技术,重点研究了二分图的特征,引入了x二分核集来更为明确地定义抽取的方法.通过扫描主题子图构造x二分图,对该子图的(i,j)裁剪后得到x二分核集,这也是社区的最小元素.最后,对所抽取的所有x二分核集应用层次聚类的方法得到社区内部结构的树状图,证明了构造和裁剪方法的正确性并设计了算法.实验采用HITS(hyperlink-induced topic search)算法中的典型数据集获取方法,选择了10个主题和4个搜索引擎并综合返回的结果.采用社会网中测量社区结构强度的模块化度量来验证所提方法的有效性,实验结果表明所提方法是有效并可行的.
- 杨楠高洁薛鸿鹄刘秀德
- 关键词:链接分析层次聚类
- 基于WordNet语义相似度的HITS算法
- 本文对HITS算法及其改进算法进行分析.针对HITS算法及其改进算法的不足,提出一种新颖的计算语义相似度的方法——利用WordNet计算文本的语义相似度,并将其引入链接权重矩阵中,对原有HITS算法进行改进.实验表明,本...
- 刘秀德高洁薛鸿鹄杨楠
- 关键词:WORDNET语义相似度
- 文献传递