张佳程 作品数:6 被引量:45 H指数:4 供职机构: 清华大学信息科学技术学院计算机科学与技术系 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 北京市科委项目 更多>> 相关领域: 自动化与计算机技术 更多>>
一种结合SSD特征的分布式文件系统元数据优化技术 被引量:7 2018年 分布式文件系统的元数据性能是制约系统整体性能的关键瓶颈.尽管固态盘(Solid State Drive,SSD)提供高速的数据访问,但是由于元数据呈现粒度小、更新频繁的特征,SSD的性能表现仍然较差,同时导致寿命损耗加速.基于SSD存储介质的写入特性,提出了面向分布式文件系统元数据的数据管理机制和更新方法,包括元数据内存页面的重新组织和管理、多次变化数据的迭代更新、元数据写入方式的进一步优化等.所提方法减少了元数据更新的写入频次和实际写入量,减少了随机写操作,提高了元数据写入性能. 罗圣美 陆游游 秦雄军 杨洪章 张佳程 舒继武关键词:固态盘 分布式文件系统 元数据 数据管理 PELF:基于并行机群的大数据实体识别算法 数据清洗中很重要的一步是实体识别,实体识别要做到将数据与实际物体一一对应但其中有2个问题:一个是同一个物体可能具有不同或者相似的名字,这会造成有大量重复的数据需要清理;另一个是同一个名字可能代表着不同的物体即为重名现象,... 李明达 王宏志 张佳程 李建中 高宏关键词:大数据 TiStor:基于策略引擎的分级存储系统 被引量:1 2015年 分级存储系统是把存储设备依据价格、性能或其他属性区分为多种不同的类别,而将数据依据其访问活动或者其它特性,动态的在不同类别的存储设备间迁移.设计实现了一种基于策略引擎的分级存储系统Ti Stor,通过类SQL策略语言,管理员可制定不同的数据管理策略对数据进行控制和管理;通过通用数据管理接口DMAPI,在用户空间实现对用户和应用程序透明的分级存储管理;通过降级文件时更新机制、增量更新机制,显著降低由于文件状态更新所带来的文件系统性能和网络带宽开销.测试结果表明,Ti Stor具有较高的在线数据访问性能和快速响应时间. 罗圣美 张佳程 周扬 程舒晗关键词:数据迁移 数据管理 一种基于裸闪存的Key-Value数据库优化方法 被引量:6 2017年 近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂.设计并实现了一种基于裸闪存的keyvalue数据管理架构Flashkv,通过用户态下的管理单元进行空间管理和垃圾回收,充分利用了闪存设备内部的并发特性,并简化了垃圾回收过程,去除了传统文件系统和FTL中的冗余功能,缩短了I/O路径.提出了基于闪存特点的I/O调度技术,优化了闪存的读写延迟,提高了吞吐率;提出了用户态缓存管理技术,降低了数据写入量和频繁系统调用所带来的开销.测试结果表明,Flashkv性能是levelDB的1.9~2.2倍,写入量减少60%~65%. 秦雄军 张佳程 陆游游 舒继武关键词:闪存 裸设备 数据存储 使用寿命 PEIF:基于并行机群的大数据实体识别算法 被引量:4 2013年 数据清洗中很重要的一步是实体识别,实体识别要做到将数据与实际物体一一对应.但其中有2个问题:一个是同一个物体可能具有不同或者相似的名字,这会造成有大量重复的数据需要清理;另一个是同一个名字可能代表着不同的物体即为重名现象,这会给清洗工作带来阻碍需要识别并避免.而现有的算法大多只是解决了第1个问题,只有在EIF系统中同时解决两个问题.可是EIF系统又不适宜解决数据量较大的问题且其中的解决同一物体不同名字问题的算法有待提高.因此利用并行处理平台Hyracks设计并行算法,提出了PEIF:基于并行机群的大数据实体识别算法.此算法借助n-Gram算法辅助解决同一物体有不同名字的问题,在较短的时间内高效地对大数据进行实体识别.理论分析和实验结果表明提出的算法可以快速有效地对大数据进行实体识别. 李明达 王宏志 张佳程 李建中 高宏关键词:大数据 基于非易失性存储器的存储系统技术研究进展 被引量:27 2016年 非易失性存储器(NVM)主要包括两类,即适用于外存的、块寻址的闪存和适用于内存的、字节寻址的持久性内存。相比于传统磁盘,闪存具有性能高、能耗低和体积小等优势;相比于DRAM(动态随机存储器),持久性内存如PCM(相变存储器)、RRAM(阻变存储器)等,具有非易失、存储密度高以及同等面积/内存插槽下能给多核环境的CPU提供更多的数据等优点,这些都为存储系统的高效构建带来了巨大的机遇。然而,传统存储系统的构建方式不适用于非易失性存储器,阻碍了其优势的发挥。为此,分析了基于非易失性存储器构建存储系统的挑战,从闪存、持久性内存两个层次分别综述了它们在存储体系结构、系统软件以及分布式协议方面的变革,总结了基于非易失性存储器构建存储系统的主要研究方向。 舒继武 陆游游 张佳程 郑纬民关键词:非易失性存储器 闪存