您的位置: 专家智库 > >

浙江省科技计划项目(2006c11108)

作品数:6 被引量:8H指数:2
相关作者:陈刚吴羽寿黎但江锦华盛振华更多>>
相关机构:浙江大学工商银行更多>>
发文基金:国家自然科学基金浙江省科技计划项目浙江省重大国际科技合作项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 3篇会议论文

领域

  • 9篇自动化与计算...

主题

  • 2篇搜索
  • 2篇细粒度
  • 2篇聚类
  • 2篇聚类算法
  • 2篇WEB对象
  • 2篇查询
  • 1篇对象缓存
  • 1篇引擎
  • 1篇隐私
  • 1篇隐私保护
  • 1篇隐私保护方法
  • 1篇用户
  • 1篇用户兴趣
  • 1篇用户兴趣模型
  • 1篇实时搜索
  • 1篇树模型
  • 1篇搜索引擎
  • 1篇索引
  • 1篇网络
  • 1篇维数

机构

  • 9篇浙江大学
  • 1篇工商银行

作者

  • 8篇陈刚
  • 5篇吴羽
  • 4篇寿黎但
  • 4篇江锦华
  • 3篇盛振华
  • 3篇陈珂
  • 1篇邵峰
  • 1篇陶然
  • 1篇张晓龙
  • 1篇李晓燕
  • 1篇董金祥
  • 1篇汤天亮
  • 1篇皮俊波
  • 1篇周佳庆
  • 1篇郑耀
  • 1篇王金德
  • 1篇陈刚

传媒

  • 5篇浙江大学学报...
  • 1篇计算机研究与...
  • 1篇第26届中国...

年份

  • 2篇2011
  • 3篇2010
  • 4篇2009
6 条 记 录,以下是 1-9
排序方式:
InfoSigs:一种面向WEB对象的细粒度聚类算法
面向WEB对象的细粒度聚类已经成为学术界研究的热点。然而现有大多数聚类模型只关注如何对文本内容或文章主题进行聚类,聚类结果粒度较粗,无法满足大规模网络信息检索的质量要求.针对上述挑战,本文挖掘WEB文档中词汇间的树状概率...
盛振华吴羽江锦华寿黎但陈刚
文献传递
实时垂直搜索引擎对象缓存优化策略被引量:2
2011年
针对实时垂直搜索引擎搜索对象热门度多变和数据抓取由查询驱动等问题,提出一种全新的实时垂直搜索引擎对象缓存优化策略.基于对象及属性间的关联设计热门对象预测模型,预测热门对象的变化趋势;基于用户查询及对象变化符合泊松过程的特点,推导最大化数据新鲜度的计算方法,从理论上给出资源分配和动态平衡的最优策略.大量的对比实验验证了新的缓存优化策略在较少开销增长的前提下,用户查询结果平均新鲜度和准确率均明显优于传统固定频率的缓存策略.
周佳庆吴羽江锦华陈刚董轶
关键词:缓存策略实时搜索垂直搜索搜索引擎
基于树合并的Deep Web查询接口集成
随着在线数据库应用的流行,整个互联网已经被迅速"深化".对于某一特定领域的deep Web,不同的站点往往会提供不同查询能力的查询接口.为了能够集成同一领域内的各个数据源,首先要解决的问题就是查询接口的集成.但是面对数量...
陶然江锦华吴羽陈刚
关键词:查询接口集成树模型
文献传递
InfoSigs:一种面向Web对象的细粒度聚类算法被引量:5
2010年
面向Web对象的细粒度聚类已经成为学术界研究的热点.然而现有大多数聚类模型只关注如何对文本内容或文章主题进行聚类,聚类结果粒度较粗,无法满足大规模网络信息检索的质量要求.针对上述挑战,充分挖掘Web文档中词汇间的树状概率层次关系,提出一种以词汇信息分布作为特征标志的聚类算法InfoSigs,实现对Web对象的细粒度聚类.算法构建一个信息传递有向无环图,根据词汇在图中信息分布的集中度赋予其合理的权重,产生更具代表性的特征向量;同时算法提出了一个自适应的记录合并模型,有效提高记录簇中记录间的相似度,减少噪音对合并过程的影响.实验结果表明,InfoSigs算法比传统聚类算法—I-Match和Shingling—在F-Measure值上平均约有21.3%的提高,可以有效地运用到多领域Web对象的聚类问题.
盛振华吴羽江锦华寿黎但陈刚
关键词:WEB对象
TrigSigs:一种有效的非结构化记录关联合并算法
2010年
为了解决从网络数据源提取的非结构化数据的处理问题,提出一种基于触发对的聚类算法TrigSigs,利用触发对挖掘非结构化数据中隐含属性间的关联关系作为辨别实体的标志.该算法能够聚集对辨别实体起到关键作用的特征组合,过滤噪音词汇,并且根据辨别实体的分辨力,为每个特征词汇赋予合理的权重,使记录的特征向量对辨别实体更具代表性,最终提高聚类结果的细粒度,很好地解决了非结构化数据的记录关联合并问题.实验结果表明:该算法可以过滤绝大部分噪音词汇,并且根据词汇的分辨力合理分配权重,使最终聚类结果的准确率有很大的提升.
吴羽盛振华寿黎但陈刚
关键词:非结构化数据
一种高效的P2P环境中的窗口查询算法
随着多媒体以及P2P网络的发展,针对高维数据基于属性的窗口查询已经成为一个重要研究课题.提出了一种在超级节点P2P网络中有效解决高维数据的窗口查询算法,在每个单独的网络节点上,数据通过一种降维算法映射到一维空间,在超级节...
汤天亮张晓龙陈珂陈刚
关键词:降维算法高维数据
XML结构化匹配中的位图过滤加速法
2009年
针对可扩展标记语言(XML)数据查询中的结构化匹配问题,提出一种位图过滤加速法,该算法能有效地提高XML结构化匹配效率.通过预先为每个XML节点建立标签位图,该加速法在XML结构化匹配中,能以位图比较形式过滤大部分未匹配节点,从而达到加速效果.研究位图过滤加速法与几类XML结构化匹配算法的集成问题,提出了低代价的融合方法.实验证明,集成位图过滤加速法的XML结构化匹配算法在查询效率方面明显优于原有算法.
陈珂邵峰陈刚郑耀
关键词:可扩展标记语言
基于用户兴趣模型两段式排序的隐私保护方法被引量:1
2010年
针对现今个性化搜索中用户兴趣模型隐私的保护需要,提出一种基于服务器和客户端协作的用户兴趣模型两段式排序方法.利用基于上下层次结构的树状用户兴趣模型,对其分段在服务器与客户端对搜索结果进行排序,不仅提高了个性化搜索服务质量,而且通过用户可控的开放隐私程度调节,有效地达到了隐私保护的目的;此外,该模型采用动态目录结构,实现了用户兴趣数据的反馈更新,从而使得用户兴趣模型的信息更加精确.实验结果表明:该模型的个性化搜索质量优于Google原始排序结果,这种差距随着用户隐私开放控制程度的提升逐渐变小;在服务器两段排序对中间排序结果的裁剪过程中,只要恰当地选择数据的范围,不仅不会影响个性化搜索服务质量,而且能提高系统运行效率.
皮俊波陈珂陈刚董金祥
关键词:用户兴趣模型个性化搜索隐私保护
基于多重分割捆绑特征的目标图像检索
2011年
针对基于目标的图像检索(OBIR)领域中,传统的视觉关键词方法忽略了局部特征之间的空间关系信息,导致检索准确度不高的问题,提出一种基于多重分割捆绑特征的目标图像检索方法.通过对图像进行多重分割,各分割区块用它所包含的尺度不变特征变换(SIFT)特征集合来描述,生成包含空间关系信息的捆绑特征;根据视觉关键词词库匹配捆绑特征,并提出一种改进的相似性度量方法计算捆绑特征相似度,再将该相似度作为权重融入到视觉关键词方法的向量空间模型中,计算图像相似度并进行排序.结果表明,该方法能够有效利用局部特征之间的空间关系信息,在保证检索效率的同时,显著提高检索准确度.
王金德寿黎但李晓燕陈刚
关键词:尺度不变特征变换
共1页<1>
聚类工具0