您的位置: 专家智库 > >

国家自然科学基金(61003138)

作品数:5 被引量:4H指数:1
相关作者:黎建辉周园春邵靖陈之端郑黎晓更多>>
相关机构:中国科学院中国科学院大学中国科学院植物研究所更多>>
发文基金:国家自然科学基金国家科技基础条件平台建设计划中国科学院知识创新工程更多>>
相关领域:自动化与计算机技术生物学更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...
  • 2篇生物学

主题

  • 1篇约简方法
  • 1篇植物
  • 1篇植物进化
  • 1篇生命
  • 1篇生命之树
  • 1篇生物进化
  • 1篇视图
  • 1篇数据集
  • 1篇数据质量
  • 1篇鸟类
  • 1篇鸟类迁徙
  • 1篇栖息
  • 1篇栖息地
  • 1篇迁徙
  • 1篇自测
  • 1篇系统发育
  • 1篇进化
  • 1篇聚类
  • 1篇基因序列
  • 1篇候鸟

机构

  • 5篇中国科学院
  • 2篇华侨大学
  • 2篇中国科学院植...
  • 2篇中国科学院大...
  • 1篇中国科学院研...

作者

  • 3篇周园春
  • 3篇黎建辉
  • 2篇邵靖
  • 2篇孟珍
  • 2篇常青玲
  • 2篇张寿洲
  • 2篇郑黎晓
  • 2篇陈之端
  • 1篇刘奇
  • 1篇张海明
  • 1篇张景博
  • 1篇董慧
  • 1篇鲁丽敏
  • 1篇崔鹏
  • 1篇罗泽
  • 1篇曹巍
  • 1篇李洪雷
  • 1篇林立
  • 1篇胡良霖
  • 1篇阎保平

传媒

  • 2篇科研信息化技...
  • 1篇小型微型计算...
  • 1篇计算机工程与...
  • 1篇中国科学数据...

年份

  • 1篇2017
  • 2篇2014
  • 1篇2012
  • 1篇2010
5 条 记 录,以下是 1-5
排序方式:
一种利用模式信息的XPath测试集约简方法被引量:1
2014年
软件测试是保证软件质量的一种重要手段,测试数据的数量和质量决定着测试的成本和效率.在基于范畴划分的XPath测试中,存在着测试数据集规模过大、测试开销过高的问题.为此,提出一种利用XM L模式信息有效约简XPath测试集的方法.该方法首先计算XML模式中的结构约束信息,例如元素允许出现的次数、元素之间的父子关系、兄弟关系等;然后利用这些信息去除范畴划分时产生的无效选择和选择的无效组合,从而减少最终测试集中的无效XML文档.理论分析和实验表明,在揭错能力较强的两种范畴划分覆盖准则下,该方法能有效减小测试集规模,从而降低测试成本、提高测试效率.
郑黎晓常青玲
关键词:XPATHXML模式测试集
面向青海湖区域候鸟迁徙行为数据挖掘算法的研究与实现被引量:2
2010年
候鸟迁徙行为过程主要中涉及到栖息地发现、迁徙路线追踪以及栖息地之间的活动关系等。如何寻找候鸟迁徙过程的栖息地、追踪候鸟的迁徙路线、挖掘栖息地之间的强关联关系对候鸟和生态环境的保护、禽流感等疾病传播和防治的研究具有重要的意义。针对目前对于候鸟迁徙的卫星跟踪数据处于人工处理的现状,本论文结合生物学研究的需要,研究数据挖掘中的相关聚类、序列挖掘,并将相关算法运用到青海湖鸟类迁徙的卫星跟踪数据中。在论文中提出了基于密度的层次聚类算法发现栖息地;基于聚类结果的关联规则与序列挖掘方法发现追踪候鸟迁徙的路线。挖掘的结果为禽流感传播路线的分析以及鸟类栖息地的保护,以及生态与动物学家的进一步的研究提供基础。
周园春唐明洁崔鹏张海明张海明邵靖侯元生黎建辉雷富民罗泽
关键词:聚类鸟类迁徙栖息地
视图确定性问题及其研究进展
2014年
基于视图的查询回答问题在数据管理方面有广泛的应用。为了形式化地描述一组视图V是否含有足够的信息来回答用户提出的一个查询Q,研究人员近期提出了"视图确定性"的概念。介绍了视图确定性相关的研究问题,对比其与查询重写之间的关系,分析出问题的主要研究维度,总结已有的研究成果并指出存在的问题。同时,对未来的研究趋势进行了展望。
郑黎晓常青玲徐世廷
关键词:复杂度查询语言
一种基因序列测序数据质量控制方案
2012年
生物分子数据的爆炸增长对数据挖掘结果有效性提出挑战,本文分析了当前生物数据尤其是基因序列数据在学科发展中的特点,综合数据规则和标准的研究以及数据清洗、质量控制工具的研究现状,结合具体项目实践中的特点和应用,初步提出了针对基因序列数据的质量控制方案。在方案设计上,本文从公共数据的数据抽提部分和私有数据的质量控制部分进行阐述。前者主要涉及到对大量数据检索、序列比对和模型匹配等问题,后者主要涉及基因序列数据精度的计算、stop codons(终止密码子)和contaminants(污染序列段)的排除以及trace file数据质量的计算及系列相似性比较等。同时,该方案面对海量数据的处理,结合数据密集型计算特点进行了基于MapReduce的并行应用设计。
孟珍黎建辉周园春董慧胡良霖陈之端张寿洲
关键词:基因序列系统发育
用于生命之树重建的数据集被引量:1
2017年
由中国科学院计算机网络信息中心、中国科学院植物研究所、深圳市中国科学院仙湖植物园“三方两地”共同合作研究建设的“达尔文树”——分子数据分析应用环境(DarwinTree——Molecular Data Analysis and Application Environment),从中国陆地植物发育系统框架的研究出发,逐步推动解决生命之树构建过程中存在的技术难题,探索利用基因和基因组信息构建生命之树的策略和方法,研究和开发DNA序列信息自动采集和生命之树自动生成技术(Automatic Reconstruction of The Tree of Life),建立生命之树信息平台及其利用体系,为最终在我国建立具有国际影响的,能很好地兼容物种分类、地理分布、形态性状、化石信息以及DNA信息的物种库(Species Bank)创造条件。DarwinTree旨在为科研人员提供数据和分析并举的工作平台,该平台将承担数据汇集和面向实际科研工作应用的双重作用。本文发布的数据集包括:(1)DarwinTree基础数据集:来自国际公共序列数据的标记处理得到的分子标记数据及其与任意阶元物种分类名称对应的统计数据集;(2)DarwinTree自测序数据集:面向中国陆地植物研究的补充测序序列数据;(3)DarwinTree中国维管植物进化数据集:已构建的中国维管植物属系统发育树的数据(Generic tree of Chinese vascular plants)。
孟珍杨拓刘红梅黎建辉曹巍刘勇杲艳平刘奇林小光何星邵靖郑波王学志周园春陈之端林立苏俊霞孙苗董晓宇李洪雷鲁丽敏张景博朱新宇李勇张寿洲董慧廖一颖杨蕾蕾万涛
关键词:生物进化分子序列
共1页<1>
聚类工具0