教育部人文社会科学重点研究基地度重大研究项目(05JJD910001)
- 作品数:28 被引量:272H指数:7
- 相关作者:吴喜之陈凯魏传华李育安吴孟书更多>>
- 相关机构:中国人民大学中央民族大学中国人民武装警察部队学院更多>>
- 发文基金:教育部人文社会科学重点研究基地度重大研究项目国家自然科学基金全国统计科学研究计划项目更多>>
- 相关领域:理学经济管理自动化与计算机技术环境科学与工程更多>>
- 基于遗传算法的投影寻踪聚类被引量:4
- 2008年
- 传统的投影寻踪聚类算法PROCLUS是一种有效的处理高维数据聚类的算法,但此算法是利用爬山法(Hill climbing)对各类中心点进行循环迭代、选取最优的过程,由于爬山法是一种局部搜索(local search)方法,得到的最优解可能仅仅是局部最优。针对上述缺陷,提出一种改进的投影寻踪聚类算法,即利用遗传算法(Genetic Algorithm)对各类中心点进行循环迭代,寻找到全局最优解。仿真实验结果证明了新算法的可行性和有效性。
- 吴孟书吴喜之
- 关键词:投影寻踪聚类算法遗传算法
- 分位数回归及应用简介被引量:88
- 2006年
- 文章介绍了分位数回归法的概念、算法及主流统计软件R和SAS计算时的语法,并通过实例与以普通最小二乘法为基础的线性回归进行了对比,展现了分位数回归的巨大魅力。
- 李育安
- 关键词:最小二乘法分位数回归恩格尔曲线
- 基于模糊的投影寻踪算法在中医证候分类中的应用被引量:9
- 2009年
- 本文提出一种新的聚类算法-基于模糊的投影寻踪算法,可以有效的处理医学中常常遇到的高维混合数据的模糊聚类问题.并将其应用在慢性肾衰的辩证分析问题中,为已有的慢性肾衰证候的分型标准提供科学支持.本文的研究方法为中医辩证的现代化研究开拓了新的思路,值得进一步深入探讨。
- 吴孟书吴喜之
- 关键词:模糊聚类
- 非参数协方差分析基于变系数模型的统计推断被引量:1
- 2006年
- 对于一类协方差分析模型,本文基于变系数模型的角度,提出了约束局部加权核估计方法,并构造了相应的检验统计量,给出了计算检验p-值的精确方法.最后通过数值模拟验证了所提检验方法的有效性.
- 魏传华吴喜之
- 关键词:变系数模型
- 基于关联规则的个体化推荐在传统商业中的应用被引量:2
- 2007年
- 随着互联网与电子商务的发展,个性化网页的设计应运而生。本文从多产品(包括服务)提供商角度出发,以数据挖掘关联规则理论为基础,总结了“个性化推荐”在多产品提供商中的应用。推荐计算过程主要有四步:构建知识集;基于客户已知信息的筛选规则;对每个候选产品计算总评分;选择最终推荐产品。并指出:知识集不仅包括历史数据关联规则集,也包括业务知识集;评分可以根据具体业务选择合适的规则度量(置信度、lift值等);按照某些准则得到各候选产品的总评分;这些准则包括加权平均、最大值、最小值等;根据一些诸如评分大小等标准确定最终推荐产品。从一个例子,本文描述了个性化推荐过程。
- 吴喜之闫洁苏立民钟云飞
- 关键词:关联规则个性化推荐
- 混合地理加权回归模型的统计诊断被引量:6
- 2009年
- 混合地理加权回归模型作为一类能简单有效解决空间非平稳问题的数据分析方法已经得到了广泛的应用。在利用该模型分析实际数据时,一个或多个特殊观测点的存在能导致估计结果发生较大改变。为了能有效检测出异常点,系统研究这类半参数模型的统计诊断与影响分析。首先基于数据删除模型定义了参数分量对应的Cook统计量,其次,基于均值漂移模型讨论了异常点的检验问题,构造了相应的检验统计量。
- 魏传华吴喜之
- 关键词:COOK距离均值漂移模型
- 两变量相关关系的度量被引量:2
- 2007年
- 阐明了刻画变量间的相关关系的各种相关系数的计算方法和应用条件。指出要正确的分析相关关系,就一定要找准合适的计算相关系数的方法。
- 姚宝玺李育安曹维芳
- 关键词:相关系数
- 一种基于差异思想的选择性Bagging Trees集成算法研究
- 2008年
- 本文通过对鸢尾花数据的研究,提出了一种基于分类器的分类效果差异而进行快速选择的一种改进的Bagging Trees集成算法。并通过同其他统计机器学习方法,如:CART、Bagging Trees、Random Forest以及目前流行的基于遗传算法的选择性集成算法GASEN等比较得出,该算法对于分类问题而言,具有较高的准确率,而且与GASEN算法相比,运行的效率也得到了较大的提高。
- 陈凯朱钰王征
- 关键词:决策树自助法
- 基于随机波动模型的沪深股市波动分析--以06,07年度沪深股指为例被引量:5
- 2008年
- 基于马尔科夫链蒙特卡罗(MCMC)模拟的贝叶斯(Bayes)分析方法,应用随机波动(SV)模型实证分析06、07年度中国股票市场指数的波动性,并对比沪市与深市的股指,对不同形式的SV模型的参数进行估计,对结论作出合理的解释.
- 马国栋吴喜之
- 部分线性变系数模型的Profile Lagrange乘子检验被引量:13
- 2008年
- 对于部分线性变系数模型附有约束条件时的估计与检验问题,基于Profile最小二乘方法给出了参数部分以及非参数部分的约束估计并研究了它们的渐近性质,并针对约束条件构造了Profile Lagrange乘子检验统计量,证明了该统计量在原假设下的渐近分布为X^2分布,从而将Langrange乘子检验方法推广到了半参数模型上.
- 魏传华吴喜之
- 关键词:PROFILE