朱青
- 作品数:28 被引量:145H指数:6
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金中国人民大学科学研究基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向查询服务的数据隐私保护算法
- 个性化信息服务提高了Web查询精度,但同时也带来数据隐私保护的问题。尤其在面向服务的架构(SOA)中,部署个性化应用时,如何解决隐私保护,这对于个性化服务是一个挑战。随着隐私安全成为微数据发布过程中越来越重要的问题,好的...
- 朱青赵桐王珊
- 关键词:查询服务个性化信息服务
- 文献传递
- HyDB:集成MapReduce和数据库的高效SaaS架构被引量:6
- 2012年
- 随着数据的快速增长和云计算的兴起,软件作为服务(SaaS)标志着计算机系统按需服务的应用的兴起.高效经济SaaS使得许多企业将大规模数据分析服务从部署在并行数据库的高端服务器转移至更便宜的无共享体系结构的低端服务器集群上.论文提出了集成MapReduce和数据库的高效经济SaaS架构—HyDB系统,解决海量结构化,半结构化与非结构化数据的高效查询服务,通过对数据的存储模型和查询模型进行研究,提出了完整的数据存储和查询服务方案,给出基于队列的作业调度算法,并支持针对简约数据查询的快速响应模式.最后通过可扩展实验,证明了该系统架构具有良好的加载性能、查询性能和容错能力,可以为用户提供优质的数据服务.
- 覃左言朱青李伏
- 关键词:MAPREDUCE数据库作业调度
- 网格数据查询优化中的缓存管理研究被引量:1
- 2007年
- 鉴于缓存管理在分布式系统中可以减少网络流量,提高系统响应速度,尤其在网格计算环境中可以克服网络连接的带宽瓶颈,提出了一个用于优化网格信息查询的缓存管理模型.网格搜索引擎进行信息检索时,依据用户的查询需求,从网格异地异构数据库中查询并自动抽取信息,进行查询集成并存储在高速缓存中;根据缓存调度算法合理地组织中间结果;按照打分函数的控制,在生成的评分表下进行Top-K排序,合并生成最终结果;在保证网格查询准确性的同时,提高网格异构数据源查询速度.实验表明此方法是有效的.
- 朱青王珊王韵婷杜小勇
- 关键词:网格计算缓存管理数据集成查询处理
- C4S2-512:基于云计算SaaS的高效资源选择策略
- 信息技术的快速发展,传统的数据中心正在向云计算环境下的数据中心转变,有代表的云计算数据中心,例如亚马逊公司的弹性公共云计算,IBM 的蓝色企业云计算,微软公司的Azure 云计算,还有开源的小型云系统等等.这些云计算系统...
- 李鹏朱青李伏
- 关键词:云计算资源分配作业调度
- 基于高效多属性再聚类的匿名算法
- 现有的隐私保护匿名技术主要针对准标识符属性进行操作,没有考虑到敏感属性的不同取值之间的特定联系,导致个人隐私信息的泄露。本文针对敏感属性取值之间的关联进行详细研究,继承了有损连接对原始数据进行保护的思想,针对L-dive...
- 李宁朱青
- 关键词:计算机网络数据安全隐私保护
- 支持短语识别的关系数据库关键词查询算法
- 互联网上的信息与日俱增,随着信息检索技术的发展,用户已经能够通过Google,Yahoo,Baidu等搜索引擎提供和查询接口查询互联网中大量的文本数据库而得到一部分用户所需要得到的信息。然而,互联网上的更多信息是包含在网...
- 李鹏朱青任安建胡伟杜小勇
- 关键词:信息检索关键词查询关系数据库短语识别查询算法
- 文献传递
- 大数据模式分解的隐私保护研究被引量:4
- 2012年
- 现有的大多数隐私保护技术往往忽略了敏感属性不同取值和准标识符属性之间存在的特殊关联,并且各领域对数据隐私保护的多方面要求,使得发布的匿名数据需要满足复合隐私约束。对近似敏感属性值和复合隐私约束进行分析,提出了基于大数据模式分解和聚类分析的隐私保护算法。给出了聚类敏感属性值保护相似值方法,设置不同权重的敏感属性,保留重要的属性。使用三维不规则结构矩阵的效用矩阵,来获取精度较高的匿名数据,实现匿名数据的模式分解。在真实数据集上的大量实验结果表明,该算法的数据精确率、数据纠错率都有明显提升,近似攻击率降低。
- 李宁朱青
- 关键词:属性聚类
- 基于语义相似度的Web信息可信分析被引量:6
- 2013年
- 互联网上的虚假事实陈述严重影响人们有效地获取信息,如何判定事实陈述是否可信成为一个亟待解决的问题.文中提出了一种针对事实陈述的可信判定模型MFSV.该模型针对事实陈述的特点,从互联网上搜集与待判定事实陈述相关的文本信息,度量其与对应事实陈述的语义相似度;同时,该模型考虑了相关文本信息在可信度上的差别,从受欢迎程度和重要程度两个方面度量了相关文本信息来源的可信度,并获取了相关文本信息的可信度排序;根据语义相似度以及可信度排序,衡量了相关文本信息对对应事实陈述可信判定所做出的贡献,并以此为基础实现了待判定事实陈述的可信判定.一系列的实验验证了该模型的合理性及可信判定的准确性.
- 王腾朱青王珊
- 关键词:语义相似度
- 基于概率学习导航的分布式信息查询
- 资源定位机制是Peer-to-Peer系统的关键技术,它的主要功能是返回请求资源的定位信息.本文提出了一种基于概率学习的路由搜索技术.应用机器学习的方法提高资源定位机制的效率。学习算法是用历史查询和结果反馈信息预测成功p...
- 朱青王珊常利军
- 关键词:信息检索搜索算法资源定位
- 文献传递
- SuperRank:基于评论分析的智能推荐系统
- 随着网上商城购物方式的兴起,对同一商品的不同网上商城之间的优劣进行推荐的重要性日益凸显.借助多属性决策的手段,提出智能网上商城推荐系统SuperRank的框架,并结合自然语言处理技术,整合各网上商城的用户评论进行情感分析...
- 田超覃左言朱青李鹏
- 关键词:自然语言处理多属性决策情感分析
- 文献传递