蒋瑜 作品数:7 被引量:59 H指数:3 供职机构: 中国人民大学 更多>> 发文基金: 教育部科学技术研究重点项目 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 社会学 经济管理 更多>>
XML数据库技术研究 孟小峰 罗道锋 蒋瑜 张新 由于XML文档本身的结构特性,使得在应用关系系统管理XML数据的时候面临着数据冗余、查询效率低下等问题。对此,我们以构建Native XML数据库为目标,从XML数据的存储、编码、索引、查询代数及优化等方面进行了系统深入...关键词:关键词:XML 数据库 OreintXA:一种有效的XQuery查询代数 被引量:22 2004年 XQuery是XML查询语言的推荐标准.现有的XQuery处理策略有两种方法,一种是基于核心语法一次一结点的方法,另一种是基于查询代数的一次一集合的方法.单独使用这两种方法都不能很好地处理XQuery查询.一方面,基于核心语法树的方法效率低,而且很难优化,而现有基于代数的方法又不能很好地满足XQuery的过程化查询语言的特性.描述了一个有效的XQuery代数系统棗OrientXA.它是在总结现有的基于代数的XQuery查询工作、分析未解决的问题,并吸收了前述的两种策略的思想的基础上提出来的.它第一次提出了构造模式树的概念,其中的构造操作符能体现XQuery的灵活特征.由于操作符具有很强的表达能力,OrientXA能够表达W3C的用例和XMark测试集的所有查询. 孟小峰 罗道锋 蒋瑜 王宇关键词:XML 查询处理 XQUERY 代数 XML数据扩展前序编码的更新方法 被引量:30 2005年 大部分XML查询技术都是基于某种对XML树的编码方法.对XML树的编码,是指按照某种规则对XML树的每一个结点分配唯一的编码,目的是通过任意两个结点的编码,能够直接判断两个结点之间是否具有祖先后代关系.最常用的编码方法是区域编码方法(region based numbering scheme).然而,XML数据也会面临插入删除等更新问题.数据一旦更新,区域编码也要作相应的调整,才能保证基于这个编码的各种索引和查询算法的正确性.在编码的更新方面,目前研究得还不多.主要研究区域编码的更新问题,采用预留编码空间的方法,针对不同特征的XML数据和应用环境提出了一整套预留算法和编码更新算法,并做了大量的实验,检验这些算法的有效性. 罗道锋 孟小峰 蒋瑜关键词:可扩展标记语言 预留 OrientX:一个Native XML数据库系统的实现策略 1.引言Internet作为一个全世界信息发布和交流的中心,正在改变人们对信息处理的传统观念。Internet中的数据浩如烟海,结构千变万化,内容丰富,如果没有统一的描述方法,保证信息流通的顺畅几乎是不可能的。XML具有... 孟小峰 王宇 罗道峰 陆世潮 安靖 陈妍 蒋瑜 欧建波关键词:XML 文献传递 复杂Twig Query查询技术研究 XML查询技术一直是国际和国内很多研究所关注的热点,随着Web应用的快速增长,XML数据逐渐成为数据存储的一种新的标准,由于XML数据半结构化和有序性的特点,针对XML数据的复杂Twig Query(CTQ)的应用也越来... 蒋瑜关键词:数据挖掘 韦博英语教学质量管理的研究 蒋瑜关键词:课程体系 教学质量 F-Index:一种加速Twig查询处理的扁平结构索引 被引量:10 2007年 如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查询无关的元素,在处理深度嵌套的复杂结构XML文档时具有很大的优势.提出一种新的查询算法,能够有效处理过滤后剩余元素的匹配问题.基于不同数据集的实验表明,使用F-Index进行过滤可以极大地提高查询处理的性能. 周军锋 孟小峰 蒋瑜 谢敏关键词:查询优化 TWIG查询 结构索引