您的位置: 专家智库 > >

庞观松

作品数:14 被引量:163H指数:6
供职机构:广东外语外贸大学国际工商管理学院更多>>
发文基金:国家自然科学基金广东省自然科学基金广东省高等学校自然科学研究重点项目更多>>
相关领域:自动化与计算机技术文化科学经济管理机械工程更多>>

文献类型

  • 12篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 11篇自动化与计算...
  • 5篇文化科学
  • 1篇经济管理
  • 1篇机械工程

主题

  • 8篇聚类
  • 4篇信息检索
  • 3篇文本分类
  • 2篇学术
  • 2篇学术搜索
  • 2篇语言
  • 2篇搜索
  • 2篇文本聚类
  • 2篇结果聚类
  • 2篇聚类算法
  • 2篇跨语言
  • 2篇跨语言信息检...
  • 2篇会议征文
  • 2篇个性化推荐
  • 2篇个性化信息
  • 2篇个性化信息检...
  • 1篇短语
  • 1篇信息可信度
  • 1篇信息挖掘
  • 1篇信息挖掘技术

机构

  • 14篇广东外语外贸...
  • 2篇卡迪夫大学
  • 1篇中国人民解放...
  • 1篇澳大利亚莫纳...

作者

  • 14篇庞观松
  • 13篇蒋盛益
  • 5篇张黎莎
  • 4篇王连喜
  • 4篇吴美玲
  • 3篇陈东沂
  • 2篇洪杰
  • 1篇张建军
  • 1篇邝丽敏
  • 1篇赖旭明
  • 1篇区雄发
  • 1篇麦智凯

传媒

  • 3篇图书情报工作
  • 2篇情报学报
  • 2篇情报理论与实...
  • 2篇山东大学学报...
  • 1篇情报杂志
  • 1篇小型微型计算...
  • 1篇山东大学学报...
  • 1篇2012全国...

年份

  • 2篇2014
  • 2篇2013
  • 4篇2012
  • 4篇2011
  • 2篇2010
14 条 记 录,以下是 1-10
排序方式:
基于CFP的学科研究热点检测
  学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点检测方法,并借助CNKI学术趋势对其进行评估。实验结果表明该...
蒋盛益洪杰庞观松
关键词:混合聚类
文献传递网络资源链接
个性化跨语言学术搜索技术研究被引量:4
2011年
学术搜索引擎是一种行业化的搜索引擎,但因其缺乏个性化的服务,使得用户的学术文献检索效率低下,海量的数字学术资源得不到充分利用。本文使用Google翻译,研究基于机器翻译的中、英、俄、法和西班牙等五个语种跨语言学术检索。在跨语言学术搜索的基础上研究个性化检索技术,提出一种基于聚类的个性化信息检索方法:通过观察用户对搜索结果聚类的点击行为,生成并更新用户实时兴趣模型,采用余弦夹角公式计算用户实时兴趣模型与搜索返回结果的相似度,根据相似度大小,为用户提供个性化重排序的搜索返回结果。实验结果证明了提出方法的有效性。
庞观松张黎莎蒋盛益
关键词:跨语言信息检索个性化信息检索学术搜索
一种基于名词短语的检索结果多层聚类方法被引量:3
2010年
对检索结果聚类可以方便用户快速浏览搜索引擎返回结果。为了提取主题表达能力和可读性强的类别标签,获取高质量的聚类结果,提出基于名词短语的检索结果多层聚类方法:提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与基于命名实体的方法、STC和Lingo算法的对比实验表明:提出方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。
庞观松张黎莎蒋盛益邝丽敏吴美玲
关键词:信息检索检索结果聚类文本聚类
Chameleon算法的改进被引量:11
2010年
结合Chameleon算法可以发现高质量的任意形状、大小和密度的自然簇及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进Chameleon算法,使之可以处理含分类属性的数据;进而提出一种两阶段聚类算法.第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用改进的Chameleon算法归并初始划分而得到最终聚类.在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的.
蒋盛益庞观松张黎莎
跨语言智能学术搜索系统设计与实现被引量:5
2011年
学术搜索是一种行业化的搜索引擎,因其缺乏个性化、智能化的服务,使得用户的学术文献检索效率低下,海量的数字学术资源得不到充分利用。本研究跨语言智能学术搜索系统的设计与实现,旨在让用户可以在尽可能短的时间内找到所需学术资源。系统的几个关键技术包括:研究混合语种文本的分词技术;研究基于机器翻译的跨语言信息检索;研究搜索结果聚类算法在不同语言文本上的性能差异问题;研究基于聚类的个性化信息检索方法以及交互式查询扩展技术。实验测试结果表明:系统具有较好的扩展性,能为用户提供良好的学术检索服务。
庞观松张黎莎蒋盛益
关键词:跨语言信息检索搜索结果聚类个性化信息检索查询扩展学术搜索
Web搜索结果多层聚类方法研究被引量:1
2011年
为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短语作为候选关键词,综合考虑每个候选关键词的词频、出现位置、长度和文本长度设置加权函数来计算其权重,不需要人工干预以及语料库的协助,自动提取权重最大的候选关键词作为类别关键词。在收集的百度、ODP语料以及公开测试的实验结果表明本文提出方法的有效性。
庞观松蒋盛益张黎莎区雄发赖旭明
关键词:文本聚类加权函数
微博信息可信度分析研究综述被引量:42
2013年
简述微博信息可信度研究的背景和意义,并对微博信息可信度分析等相关概念进行界定;对微博信息可信度的研究成果进行梳理,指出这些研究的不足,并认为微博信息可信度分析的关键问题是微博信息特征的提取和可信度分析方法的设计;结合微博信息的特点及已有研究成果,指出微博信息可信度分析的核心技术包括自然语言处理、社会网络分析、机器学习与数据挖掘等;最后总结全文,对微博信息可信度分析的未来发展方向进行展望,为进一步研究提供参考。
蒋盛益陈东沂庞观松吴美玲王连喜
关键词:信息可信度自然语言处理社会网络分析
基于文本分类技术的微博平台潜在客户挖掘
微博(Microblog)、Facebook和YouTube等社会化媒体的快速发展已经深刻地改变了企业与客户、客户与客户之间的沟通互动方式,在这种新兴媒体上,客户在产品或服务交易市场上发挥着空前主动的角色。社会化媒体具有...
庞观松
关键词:社会关系文本分类
文献传递
微博用户关系挖掘研究综述被引量:27
2012年
Web2.0的广泛应用和新型社会化网络媒体的盛行,促使网络服务从以数据为主导开始转变为以用户或用户关系为核心。微博作为当下最流行的社会化网络服务媒体,其用户关系挖掘研究正是在这一背景下迅速兴起的一个新兴研究课题,并且逐渐受到人们越来越多的重视。首先依据微博用户的特点对微博用户关系挖掘的概念进行了阐释;然后,以微博用户关系挖掘的两个重要研究内容为主线,分别对微博用户社群分析和关键用户识别做细致的介绍和分析;最后总结了对微博用户关系挖掘的研究内容,并对未来的研究方向进行了展望。
王连喜蒋盛益庞观松吴美玲
关键词:用户关系个性化推荐
文本自动分类技术研究综述被引量:32
2012年
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。
庞观松蒋盛益
关键词:文本分类文本处理
共2页<12>
聚类工具0