您的位置: 专家智库 > >

国家高技术研究发展计划(2009AA01Z149)

作品数:5 被引量:28H指数:3
相关作者:王珊李建中高宏王晓玲沙朝锋更多>>
相关机构:上海市智能信息处理重点实验室中国人民大学哈尔滨工业大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇会议论文
  • 5篇期刊文章

领域

  • 12篇自动化与计算...

主题

  • 4篇查询
  • 3篇聚类
  • 2篇索引
  • 2篇朴素贝叶斯
  • 2篇贝叶斯
  • 2篇XML
  • 2篇XML压缩
  • 2篇KL距离
  • 2篇LOGIST...
  • 2篇层次聚类
  • 2篇查询处理
  • 1篇多媒体
  • 1篇学习算法
  • 1篇用户
  • 1篇用户自定义
  • 1篇用户自定义函...
  • 1篇视频
  • 1篇视频监控
  • 1篇数据管理
  • 1篇数据索引

机构

  • 5篇哈尔滨工业大...
  • 5篇中国人民大学
  • 4篇教育部
  • 4篇上海市智能信...
  • 2篇复旦大学
  • 2篇华东师范大学
  • 1篇西门子中国研...

作者

  • 4篇高宏
  • 4篇李建中
  • 2篇王珊
  • 2篇许震
  • 2篇张孝
  • 2篇于利胜
  • 2篇骆吉洲
  • 2篇赵明
  • 2篇王宏志
  • 1篇张延松
  • 1篇琚星星
  • 1篇孙新云
  • 1篇王占伟
  • 1篇周傲英
  • 1篇李晖
  • 1篇沙朝锋
  • 1篇黄伟
  • 1篇王晓玲
  • 1篇刘科研
  • 1篇张倩

传媒

  • 4篇计算机研究与...
  • 2篇NDBC20...
  • 1篇黑龙江大学自...
  • 1篇第26届中国...

年份

  • 1篇2011
  • 8篇2010
  • 3篇2009
5 条 记 录,以下是 1-10
排序方式:
UHS:基于视频监控数据的不间断客服助手系统
监控视频可用于安全目的的视频记录,还可用于实时商务智能等领域.提出一个超市场景中的不间断客服助手系统(Uninterrupted Helper System,UHS),它可以在实时和历史视频监控数据上进行连续分析查询,分...
李晖张孝王珊琚星星孙新云张建梅谢湘伟
关键词:用户自定义函数视频监控
文献传递
myBUD中多媒体数据索引CFTree的研究和实现
2011年
图片、音频、视频、网页等非结构化数据的高速增长使得如何高效管理它们成为一大挑战.提出的多媒体数据索引CFTree*是非结构化数据管理系统平台myBUD中对多媒体数据进行管理的具体研究和实现.CFTree*是基于簇特征树的层次树索引结构,可用于基于内容的近似kNN查询.实验表明,基于CFTree*索引结构的近似kNN查询性能比基于顺序扫描的kNN查询有60%左右的提高.与精确kNN相比,基于CFTree*索引的近似kNN查询结果与查询对象的平均相似度略低于精确kNN结果,但结果的多样性则优于精确kNN结果.
张孝孙新云刘科研琚星星王珊
关键词:非结构化数据管理聚类算法
XCluster:基于聚类支持查询的XML多文档压缩方法被引量:4
2010年
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.
赵明骆吉洲李建中高宏
关键词:XML压缩层次聚类查询处理
LiPU:一种基于KL距离的主动分类算法
在实际应用中,由于各种原因,时常无法直接获得反例,导致传统分类方法的暂时失灵,所以,基于正例和未标识集的主动分类问题顿时成为了理论界的焦点。为了解决这一难题,理论界相继提出了许多不同的解决方案,然而,这些方法不能有效处理...
许震沙朝锋王晓玲周傲英
关键词:过抽样KL距离朴素贝叶斯LOGISTIC回归
文献传递
基于2-hop优化的子图模式匹配算法被引量:1
2010年
讨论大图上有效可达标记2-hop编码,及其构造的图结构信息数据结构在判定两点之间可达性的高效性,基于这些高效结构,提出一种基于栈的DAG全局图模式匹配算法,该算法结合了栈在匹配过程中线性空间开销的优势。实验结果表明,相对于目前主流的图模式匹配算法,该算法具有中间结果小,时间高效的优势。
张航王宏志李建中高宏
基于KL距离的非平衡数据半监督学习算法被引量:13
2010年
在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当隐匿反例非常少或训练集中的实例分布不均匀时.因此,提出了一种基于KL距离的半监督分类算法——LiKL:依次挖掘出未标识集中的最可靠正例和反例,接着使用训练好的增强型分类器来分类.与其他方法相比,不仅提高了分类的查准率和查全率,而且具有鲁棒性.
许震沙朝锋王晓玲周傲英
关键词:半监督学习KL距离朴素贝叶斯LOGISTIC回归
可扩展并行内存数据库系统:ScaMMDBⅡ
面对OLAP海量数据查询处理的请求与单机内存容量有限的矛盾,设计了ScaMMDBⅡ系统.ScaMMDBⅡ系统将在单一节点上进行的包含可分布式聚集函数的海量数据OLAP查询操作转换为在多个节点子CUBE上并行执行的OLAP...
黄伟王占伟孙妍王会举张延松王珊
关键词:聚集函数
文献传递
基于行存储模型的模拟列存储策略研究被引量:10
2010年
列存储模型在只读的数据仓库应用中表现出非常好的性能,很多研究表明对于典型的OLAP查询,列存储数据库的性能大大优于行存储数据库.根据列存储模型的特性及数据处理特点,在传统的行存储模型关系数据库中模拟列存储的存储模式及数据处理过程,并通过优化的基于聚类的列存储模型、全索引模型与典型的行存储方式进行类比性能测试.实验结果显示,采用传统行存储模型模拟的列存储模型针对OLAP类查询具有很高的数据访问速度及查询性能,整体性能介于行存储数据库与列存储数据库之间.对于实际应用系统来说,该方案减少了整体系统部署代价,而且无需为提高OLAP查询的性能增加额外系统(列存储)投入,从而为OLAP应用提供了良好的性能支持.
于利胜张延松王珊张倩
XCluster:基于聚类支持查询的XML多文档压缩方法
XML已成为各种网络应用中数据存储和数据交换的标准。XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价。对XML文档进行压缩可以在一定程度上解决这个问题。但...
赵明骆吉洲李建中高宏
关键词:XML压缩层次聚类查询处理
文献传递
具有质量保证的XML数据模式转换
随着网络的普及,数据越来越多地出现在了互联网上.由于XML(Extensible Markup Language)语言的易用性,更多的数据被组织成为XML文档格式,同样由于XML的灵活性,数据多种多样的组织形式给数据的管...
边旭王宏志李建中高宏
关键词:XML
文献传递
共2页<12>
聚类工具0