琚星星 作品数:4 被引量:3 H指数:1 供职机构: 中国人民大学信息学院 更多>> 发文基金: 国家自然科学基金 国家科技重大专项 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 更多>>
myBUD中多媒体数据索引CFTree的研究和实现 2011年 图片、音频、视频、网页等非结构化数据的高速增长使得如何高效管理它们成为一大挑战.提出的多媒体数据索引CFTree*是非结构化数据管理系统平台myBUD中对多媒体数据进行管理的具体研究和实现.CFTree*是基于簇特征树的层次树索引结构,可用于基于内容的近似kNN查询.实验表明,基于CFTree*索引结构的近似kNN查询性能比基于顺序扫描的kNN查询有60%左右的提高.与精确kNN相比,基于CFTree*索引的近似kNN查询结果与查询对象的平均相似度略低于精确kNN结果,但结果的多样性则优于精确kNN结果. 张孝 孙新云 刘科研 琚星星 王珊关键词:非结构化数据管理 聚类算法 UHS:基于视频监控数据的不间断客服助手系统 监控视频可用于安全目的的视频记录,还可用于实时商务智能等领域。提出一个超市场景中的不间断客服助手系统(UHS),它可以在实时和历史视频监控数据上进行连续分析查询,分析顾客的购物行为,并在必要时提示销售人员对顾客提供个性化... 李晖 张孝 王珊 琚星星 孙新云 张建梅 谢湘伟关键词:用户自定义函数 文献传递 myBUD中多媒体数据索引CFTree*的研究和实现 图片、音频、视频、网页等非结构化数据的高速增长使得如何高效管理它们成为一大挑战。提出的多媒体数据索引CFTree*是非结构化数据管理系统平台myBUD中对多媒体数据进行管理的具体研究和实现。CFTree*是基于簇特征树的... 张孝 孙新云 刘科研 琚星星 王珊关键词:多媒体数据库 数据管理系统 聚类算法 索引技术 MyBUD自适应分布式存储管理的设计与实现 被引量:3 2012年 面对日益增长的非结构化数据管理需求,实现了基于"自由表"数据模型和BUD(bank of unstructured data)参考体系模型的非结构化数据管理平台MyBUD系统。提出了一种能够根据非结构化数据的类型和访问特点自适应地选择分布式存储子系统的方法,同时也对MyBUD进行了TPCC测试和非结构化数据存取实验。结果表明,这种自适应的数据存储方法为MyBUD系统提供了高效的可扩展存储层,为采用数据库方法实现对结构化和非结构化数据统一管理的进一步研究工作奠定了基础。 周宁南 张孝 孙新云 琚星星 刘奎呈 杜小勇 王珊关键词:非结构化数据管理 自适应算法 分布式存储系统 面向服务架构