李乡儒 作品数:36 被引量:197 H指数:5 供职机构: 华南师范大学 更多>> 发文基金: 国家自然科学基金 广东省自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 天文地球 电子电信 自动化与计算机技术 交通运输工程 更多>>
中国虚拟天文台的核心功能需求调查分析 2020年 经过十余年的不断建设和发展,中国虚拟天文台(China-VO)已成为支撑天文学观测、研究、教学的重要技术和资源平台。随着多信使天文学和时域天文学时代的到来,虚拟天文台也需要升级自身的核心能力,给天文工作者提供更精准的服务和技术支撑。为此,中国虚拟天文台团队结合天文学的发展方向和信息技术发展趋势梳理了一份核心技术需求清单,并以问卷的形式针对领域内专家和用户开展了调研。通过对调研结果的统计分析,中国虚拟天文台团队明确了未来一段时期的主要努力方向和目标,计划采用平台化开发模式,并开放第三方开发接口,以吸引更多感兴趣的开发者基于虚拟天文台资源做出实用的工具,更好地实现资源与技术向服务的快速转换。 许允飞 樊东卫 崔辰州 何勃亮 李长华 于策 肖健 李珊珊 米琳莹 韩军 陶一寒 王传军 王传军 张海龙 刘梁 李正 韩叙 杨丝丝 和兰 张磊 张磊 王川中 苏丽颖 陈力 苏丽颖 陈力 乔翠兰 许谦 李乡儒 杨海峰 曹子皇 白春海 周卫红 强振平 柏正尧 周卫红 袁国武 柏正尧 李冀 孙继先 和寿圣 赵永恒关键词:虚拟天文台 RVM有监督特征提取与Seyfert光谱分类 被引量:4 2009年 特征提取是光谱自动识别中的一个基本问题,它决定着光谱识别系统的性能和复杂度。目前的天体光谱自动分类研究主要使用的是基于以线性主成分分析(PCA)、小波变换(Wavelet transform)、人工神经网络(ANN)等为代表的非监督特征提取方法,而它们在特征提取时没有考虑到训练数据中的类别信息,并非按照分类能力进行特征选择和降维。文章研究了相关向量机(RVM)有监督特征提取方法及其在Seyfert光谱细分类中的应用。RVM是机器学习领域在近几年提出的一种Bayesian学习方法,它能有效地融合已有的先验知识、对问题的信念、训练数据和相应的类别信息,并按照分类能力提取特征,在理论上具有很大的潜在优势。另外,初步的实验结果表明,基于RVM的有监督特征提取方法在Seyfert光谱细分类中具有较好的性能。 李乡儒 胡占义 赵永恒 李晓明关键词:相关向量机 光谱数据挖掘中的特征提取方法 被引量:5 2012年 特征提取是对光谱测量数据成分的分解、重组和选择的过程,它是光谱数据挖掘中的一个关键环节,不仅决定着后续处理的质量、效率、系统复杂度和稳健性,也关系到能够挖掘到什么知识和处理结果物理意义的可解释性。按照特征表达方式将已有方法分为3类:统计约简法,特征谱法和谱线法,并对这些方法的基本原理、适用性、优缺点及其在光谱数据挖掘中的应用作了综述和分析。另外,亦从方法的"时"、"频"分析能力方面探讨了不同方法的特点,例如,物理意义的易解释性、对波长定标畸变和流量定标畸变的敏感性等。 李乡儒关键词:光谱 数据挖掘 特征提取 巡天光谱分类前的预处理——流量标准化 被引量:1 2007年 由于噪声、畸变、观测环境和观测设备、以及流量未定标等因素的影响,对天体光谱进行自动识别之前,需要对它进行相应的标准化/预处理。文章研究了对巡天光谱自动分类前的预处理——光谱流量的标准化问题。通过分析光谱流量的干扰因素及其特点,提出了流量数量级变化的基本模型,并给出了相应的流量标准化方法。通过对正常星系和类星体的分类实验,表明文章所给基本模型的正确性,以及所给流量标准化方法良好的性能。并且从理论上分析、比较、解释了上述方法在性能上的差异。特别需要指出的是,研究表明文献中通常采用的流量标准化方法的效果较差。该研究结果对于大型光谱巡天所产生的海量数据的其它自动处理研究(例如,红移测量,天体表面有效温度,和化学丰度估计等)也具有重要的指导意义。 李乡儒 刘中田 胡占义 吴福朝 赵永恒关键词:光谱分类 预处理 类星体 主成分分析 QSO与Galaxy光谱识别中的特征提取 李乡儒光谱流量标准化的高效计算 2012年 流量标准化是光谱数据挖掘中的一个基本环节,他对挖掘结果的精度和系统的效率均有重要影响,常用方法存在效率较低的问题,为此研究了光谱数据挖掘中流量标准化的算法设计和效率比较问题。首先,探讨了光谱流量标准化技术不同实现方案的渐进效率,给出了实现高效计算的算法,并分析了它们的时间复杂度和空间复杂度。然后,通过SDSS(sloan digital sky survey)的实测光谱数据,横向比较了不同流量标准化算法的效率差异。在光谱流量标准化算法的纵向理论研究中,主要考虑的是计算效率随数据规模增长的变化规律,是在极限意义下进行探讨。在横向实验比较中,考虑重点是不同算法中基本操作时间复杂度的差异及其对算法效率的影响。理论研究和实验结果表明,虽然四种标准化方法Smax,Smedian,Smean和Sunit的渐进效率的类型相同,但对常见的观测规模光谱数据来说,Smax和Smean的效率远远高于Sunit和Smedian,且常用的Sunit标准化方法效率最低。该研究对于在光谱数据挖掘和开发中,如何根据数据的规模,具体需求,从整体上考虑精度和效率的折衷,以确定合适的流量标准化方法有重要的参考价值。 李乡儒几个学习算法及其在星系光谱分类中的应用 LAMOST建成后,预计能同时观测4000个目标天体,它将产生大量的光谱数据。这些海量数据的自动处理速度和质量是能否有效发挥天文望远镜潜力和实现科学目标的主要瓶颈之一。本论文工作的主要目标是为LAMOST星系观测光谱的识... 李乡儒关键词:数据预处理 分类器设计 相关向量机 恒星大气物理参数估计中的稀疏特征提取 2014年 随着斯隆数字巡天项目(SDSS)、欧空局GAIA和我国大天区面积多目标光纤光谱天文望远镜(LAMOST)等项目的相继实施,拥有的恒星光谱数据量急速增加,由此导致基于光谱的恒星大气物理参数自动测量方法的研究成为天文光谱分析的重要课题之一[1]。探讨了恒星光谱特征提取的方法(Haar+lasso),其基本思想是首先使用Haar小波包对原始光谱进行多尺度分解,去除高频系数,选取低频系数作为光谱信息的描述;再采用lasso算法提取最优的特征;最后将最优特征输入非参数回归模型中对恒星大气参数进行自动测量。Haar小波可以较好地去除原始光谱信号中的高频噪声,对全频谱数据进行降维。lasso算法可以进一步剔除数据冗余,提取与物理参数相关度较强的特征。Haar+lasso方法提高了物理参数自动测量的准确性和运行效率。我们采用本文方案对SLOAN发布的40 000个恒星子样本的物理参数进行测量,三个物理参数的平均绝对误差为:log Teff:0.007 1dex,log g:0.225 2dex和[Fe/H]:0.199 6dex。同现有相关文献的实验结果相比,该方案可以获得更准确的物理参数。 卢瑜 李乡儒 杨坦 王永俊关键词:恒星 HAAR小波 非参数回归模型 物理参数 序贯散列近邻法及其在光谱识别中的应用 2012年 基于近邻的方法是海量光谱数据获取、自动处理和挖掘中的一类重要方法,在应用中它们的主要问题是效率较低,为此文中提出了基于序贯计算的散列近邻法(SHNN)。在SHNN中,首先使用PCA方法对光谱数据进行正交变换,使数据按照各成分的散列能力进行组织;然后在PCA空间中快速查找待识别光谱的近邻数据,在此过程中通过散列思想快速约减搜索空间,并用序贯计算法高效地排除非近邻光谱数据,提高计算效率。文中主要贡献是,提出了SHNN算法,并研究了该算法在恒星光谱、正常星系光谱和类星体光谱识别中的应用。SDSS光谱实验研究表明,SHNN效率提高约96%以上,速度提高26.45倍以上。由于近邻法的广泛适用性,文中研究结果不仅对恒星光谱、正常星系光谱和类星体光谱的识别研究有重要的参考意义和一定的实用价值,亦对恒星大气参量的估计和基于光谱的红移测量有一定的参考意义。 李乡儒均值漂移算法的收敛性 被引量:127 2005年 均值漂移是一种有效的统计迭代算法,已广泛应用于聚类分析、跟踪、图像分割、图像平滑、滤波、图像边缘提取和信息融合等方面.但是,其收敛性仍没有得到严格的证明,而收敛性是任何迭代算法的必要前提.推广并严格证明了该算法的收敛性.首先将均值漂移算法做了以下推广:反映不同样本点处局部空间结构的差异及其各向异性.然后,在推广的条件下从数学上严格证明了均值漂移算法的收敛性.最后,探讨了均值漂移算法中参数的自适应选择方法.从而为该算法的应用奠定了理论基础. 李乡儒 吴福朝 胡占义关键词:均值漂移 收敛性 聚类分析 图像处理