崔文泉
- 作品数:26 被引量:22H指数:3
- 供职机构:中国科学技术大学管理学院统计与金融系更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金机械工业技术发展基金更多>>
- 相关领域:理学自动化与计算机技术金属学及工艺机械工程更多>>
- 对球面工件的一种新测量方法的最优设计研究被引量:1
- 1999年
- 崔文泉、李娟.对球面工件的一种新测量方法的最优设计研究.本文针对一种新的适用于车间在线测量的球面工件测量方法———气动方式的多测头、多测点的方法进行了布点最优设计的研究,给出了布点设计的最优性条件、使被测球半径达到最大精度的设计等。
- 崔文泉李娟
- 关键词:测量方法最优设计
- 基于Reptile的个性化联邦学习算法
- 2022年
- 在联邦学习背景下,由于行业竞争、隐私保护等壁垒,用户数据保留在本地,无法集中在一处训练.为充分利用用户的数据和算力,用户可通过中央服务器协同训练模型,训练得到的公共模型为用户共享,但公共模型对于不同用户会产生相同输出,难以适应用户数据是异质的常见情形.针对该问题,提出一种基于元学习方法Reptile的新算法,为用户学习个性化联邦学习模型.Reptile可高效学习多任务的模型初始化参数,在新任务到来时,仅需几步梯度下降就能收敛到良好的模型参数.利用这一优势,将Reptile与联邦平均(federated averaging,FedAvg)相结合,用户终端利用Reptile处理多任务并更新参数,之后中央服务器将用户更新的参数进行平均聚合,迭代学习更好的模型初始化参数,最后将其应用于各用户数据后仅需几步梯度下降即可获得个性化模型.实验中使用模拟数据和真实数据设置了联邦学习场景,实验表明该算法相比其他算法能够更快收敛,具有更好的个性化学习能力.
- 夏雨崔文泉
- 关键词:元学习个性化学习梯度下降隐私保护
- 基于联邦学习和重要性加权的疾病得分预测
- 2022年
- 在考虑用户隐私的保护多源域数据背景下预测疾病得分的问题中,来自不同源域的数据分散存储无法合并,且可能服从不同的分布,因此传统的机器学习方法无法合理地利用源域数据的信息.本文结合联邦学习的思想和基于样本的迁移学习方法,提出了联邦重要性加权方法,通过将源域的样本重用于目标域的预测任务,而且不需要进行源域之间的数据共享,实现了在保护源域的数据隐私的情况下利用分布不同的多源域的信息提升目标域预测的精度.并且基于提出的方法,本文构造了一种加权模型并提供了一个简洁通用的算法用于求解目标域的预测模型.数值模拟以及实证结果表明,相对于未考虑分布迁移的传统方法,联邦重要性加权方法可以有效地利用多源域数据的信息,在目标域的预测精度上具有优势,以及在帕金森疾病数据中做出精准的疾病得分预测.
- 许亚倩崔文泉程浩洋
- 关键词:隐私保护
- 一种生存数据非线性充分降维子空间估计的新方法被引量:1
- 2015年
- 给出了一种估计生存数据非线性充分降维子空间的新方法.利用再生核Hilbert空间性质以及双切片思想,建立广义特征谱分解问题与获得充分降维子空间的联系,以此估计生存时间和删失时间的联合非线性降维中心子空间.进一步结合SDR中心子空间的性质,通过联合SDR中心子空间来估计权重函数,在算法实现过程中,利用迭代思想,达到提高估计效率的目的.最后通过数值模拟来说明该方法的优良性.
- 崔文泉吴成龙
- 关键词:再生核HILBERT空间
- 一种基于RKHS及半参数理论的非线性充分降维方法
- 2016年
- 提出了一种基于再生核Hilbert空间(reproducing kernel Hilbert space,RKHS)及半参数理论的非线性充分降维新方法——广义半参数核切片逆回归(generalized semiparametric kernel sliced inverse regression,generalized semi-KSIR或GSKSIR).该方法将经典的半参数方法拓展至感兴趣参数为无穷维的广义半参数方法,将半参数模型推广到不仅冗余参数为无穷维而且感兴趣参数也可为无穷维的广义半参数模型情形,推导出相应的广义冗余切平面之正交补空间,进而构造了降维方向的估计方程,并由RKHS理论及正则化方法完成相应目标函数的求解,求得具有优良性质的非线性充分降维子空间的估计,并且新方法不需要切片逆回归(SIR)与核切片逆回归(KSIR)等方法所要求的基本的线性设计条件(linear design condition,LDC),适用性较广.最后进行了统计模拟研究,显示了新方法在有限样本下具有良好表现.
- 崔文泉刘波
- 关键词:再生核
- Cauchy-Schwarz不等式的推广被引量:4
- 2006年
- 在非负定矩阵的偏序意义下讨论了对Cauchy-Schwarz不等式的推广,将随机变量情形下的Cauchy-Schwarz不等式推广到随机向量情形,而且两个随机向量的维数不要求相等,一个是随机变量另一个是随机向量是其中的一个特殊情形,另外还研究了有限维空间中的向量情形的Cauchy-Schwarz不等式在矩阵情形下的推广,得到一个十分简明的结果,并将此结果用于讨论一类随机向量簇的协方差阵的下界,不仅得到下界的具体表达式,而且给出能达到该下界的充分必要条件.
- 李娟崔文泉
- 关键词:CAUCHY-SCHWARZ不等式偏序随机向量协方差阵投影算子
- 数据量少情形下的一种回归预测模型的建立方法被引量:2
- 1998年
- 本文讨论了数据量少情形下的建立回归预测模型的方法,并对文献[1]中的应用实例进行了处理。
- 崔文泉
- 关键词:SWEEP
- 不均衡数据情形的基于聚焦损失的CGAN的集成分类方法
- 2020年
- 针对非均衡数据的情形,基于条件生成对抗网络(conditional generative adversarial networks,CGAN),利用梯度提升树研究了聚焦损失的CGAN的集成分类方法.该方法首先通过CGAN降低不均衡率,通过聚焦损失的权值均衡结合GBDT算法,适当增加对少数类样本的关注度进而进一步提升分类器的分类性能.对方法的性质进行了研究,获得了若干理论成果.证明了:在一定条件下,由CGAN产生的经验条件分布收敛于相应总体的条件分布;聚集损失的CGAN方法其经验风险收敛到期望风险;该方法的估计量会收敛到使得期望风险最小化的函数.实验结果显示了聚焦损失的CGAN方法具有良好的表现.
- 崔文泉余厚莹侯晓天
- 关键词:非均衡数据
- 极径法球面测量的加权 最小二乘估计和布点设计被引量:6
- 2000年
- 本文给出了基于极径法球面测量的加权最小二乘估计模型,并依据该模型进行测量采样点布局的优化设计。最后,对模型和布点设计进行了统计数据仿真测试。
- 赵前程邓善熙王会生崔文泉
- 一种预测高频价格的端到端双目标多任务方法
- 2021年
- 高频价格变动预测是预测价格在短时间内(比如1 min内)的变化方向(上涨、不变或下跌).用历史的高频交易数据去预测价格变化是一个比较困难的任务,这是因为二者之间的关系是高噪声、非线性和复杂的.为提高高频价格预测准确率,提出了一个端到端的双目标多任务方法.该方法引进了一个辅助目标(高频价格变化率),它和主目标(高频价格变化方向)是高度相关的并且能够提高主目标的预测准确率.此外,每一个任务都有一个基于循环神经网络和卷积神经网络的特征提取模块,它可以学习出历史交易数据和两个目标之间的高噪声、非线性和复杂的时空相依关系.为了缓解多任务方法的潜在的负迁移问题,每个任务的任务间共享部分和任务特有部分被显式地分开.而且,通过一种梯度平衡方法利用两个目标之间的高相关性过滤掉从不一致性中学到的噪声的同时保留从一致性中学到的相依规律,从而提高高频价格变化方向预测准确率.在真实数据集上的实验结果表明:所提方法能够利用高度相关的辅助目标帮助主任务的特征提取模块去学习出更有泛化能力的时空相依规律,最终提高高频价格变化方向预测准确率.此外,辅助目标(高频价格变化率)不仅能够提高特征提取模块的总体效果,而且也提高特征提取模块的不同部分的效果.
- 马玉莲崔文泉
- 关键词:多任务学习共享方法负迁移