您的位置: 专家智库 > >

郭宇红

作品数:13 被引量:62H指数:4
供职机构:国际关系学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 10篇期刊文章
  • 2篇专利
  • 1篇学位论文

领域

  • 10篇自动化与计算...
  • 2篇文化科学

主题

  • 7篇隐私
  • 7篇隐私保护
  • 3篇数据库
  • 3篇频繁模式挖掘
  • 3篇频繁项
  • 3篇频繁项集
  • 3篇项集
  • 3篇决策树
  • 2篇知识
  • 2篇知识隐藏
  • 2篇时间序列
  • 2篇时间序列预测
  • 2篇数据处理
  • 2篇数据处理技术
  • 2篇数据挖掘
  • 2篇随机化
  • 2篇随机化回答
  • 2篇特征信息
  • 2篇频繁项集挖掘
  • 2篇借阅

机构

  • 10篇国际关系学院
  • 7篇北京大学

作者

  • 13篇郭宇红
  • 3篇唐世渭
  • 3篇童云海
  • 2篇杨冬青
  • 2篇毛玉琪
  • 1篇王路宁

传媒

  • 4篇软件学报
  • 1篇计算机时代
  • 1篇华侨大学学报...
  • 1篇中国科技信息
  • 1篇南京邮电大学...
  • 1篇软件工程
  • 1篇数据分析与知...

年份

  • 3篇2023
  • 1篇2021
  • 1篇2020
  • 1篇2019
  • 1篇2015
  • 2篇2014
  • 1篇2011
  • 2篇2008
  • 1篇2007
13 条 记 录,以下是 1-10
排序方式:
基于FP-Tree的反向频繁项集挖掘被引量:22
2008年
在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集.
郭宇红童云海唐世渭杨冬青
关键词:FP树频繁项集隐私保护知识隐藏
隐私保护频繁项集挖掘中的细粒度随机化模型被引量:1
2019年
已有的随机化回答模型调控的数据范围宽、粒度粗,对隐私数据的保护粒度缺乏灵活性,无法实现精细化、个性化、差异化的隐私保护。提出三类多参数随机化回答模型,包括行多参、复合多参、分组多参共11种随机化回答模型,给出了模型的分类框架和分类层次。细粒度多参数随机化模型可实现精细化、个性化、差异化的隐私保护效果。
郭宇红童云海
关键词:随机化回答隐私保护频繁项集
SPSS Clementine决策树建模在图书馆中的应用被引量:6
2014年
分析影响读者借阅量的因素,确定不同读者的借阅需求,进而依据需求定制差异化的借阅权限和服务。利用SPSS Clementine挖掘工具,采用C5.0决策树算法,对国际关系学院图书馆的读者借阅数据进行挖掘,建立读者决策树分类模型,将读者按借阅频度分为活跃读者、一般读者和沉默读者。结果表明,读者身份、专业、年级和性别对借阅量有重要影响,本科大三学生借阅需求较大,大四学生借阅需求小。决策树分类能对图书馆读者进行细分,可为调整读者借阅权限提供理论依据。
郭宇红王路宁毛玉琪
关键词:决策树图书馆CLEMENTINE借阅权限
融合XGBoost计算特征权重的时间序列预测方法
本发明提供一种融合XGBoost计算特征权重的时间序列预测方法,属于数据处理技术领域,该方法包括:从数据库中获取与所预测时间序列变量相关的多个类型的特征信息;根据时间序列变量、特征信息和XGBoost模型,学习得到各个决...
郭宇红马海森
一种基于AHP的智能电影推荐方法被引量:5
2015年
电影网站提供了十分丰富的电影资源,然而用户必须花费大量时间搜索自己感兴趣的资源,如何帮助用户快速找到其想要的资源成为大型电影网站的重要需求。智能推荐技术的提出使满足这个需求成为可能。文中提出一种基于AHP(Analytic Hierarchy Process)层次分析法的智能电影推荐方法,综合考虑电影印象、故事、表演、导演、画面、音乐和类型等因素,通过用户对各因素两两比较、权重计算,生成个性化推荐列表。基于时光网的多个用户实证研究表明,结合AHP的智能电影推荐方法简单、有效,大部分推荐结果满足用户喜好。
郭宇红杨金然
关键词:层次分析法电影推荐
分组随机化隐私保护频繁模式挖掘被引量:1
2021年
已有的隐私保护频繁模式挖掘随机化方法不考虑隐私保护需求差异性,对所有个体运用统一的随机化参数,实施同等的保护,无法满足个体对隐私的偏好.提出基于分组随机化的隐私保护频繁模式挖掘方法(grouping-based randomization for privacy preserving frequent pattern mining,简称GR-PPFM).该方法根据不同个体的隐私保护要求进行分组,为每一组数据设置不同的隐私保护级别和与之相适应的随机化参数.在合成数据和真实数据中的实验结果表明:相对于统一单参数随机化mask,分组多参数随机化GR-PPFM不仅能够满足不同群体多样化的隐私保护需求,还能在整体隐私保护度相同情况下提高挖掘结果的准确性.
郭宇红童云海苏燕青
关键词:随机化个性化隐私保护频繁模式挖掘
融合Motif结构高阶相似度的文献推荐算法
2023年
【目的】将协同过滤方法应用到文献推荐领域,融入用户余弦相似度网络中Motif结构反映出的高阶相似特征,提高推荐的质量。【方法】通过用户收藏文献的行为信息和文献间的引用关系构建用户对文献的偏好数据;在基于用户-文献收藏行为信息的用户余弦相似度网络中,利用网络中的子图——Motif结构捕获高阶相似度;最后将用户余弦相似度和基于Motif结构的高阶相似度融入矩阵分解推荐算法中,预测用户对文献的偏好。【结果】相较于传统的矩阵分解推荐算法,本文算法在RMSE和MAE指标上分别降低0.0482和0.0379。【局限】未考虑文献的时间衰减性。【结论】本文算法降低了用户偏好预测误差,提高了推荐质量。
陈柳郭宇红
关键词:MOTIF矩阵分解
带学习的同步隐私保护频繁模式挖掘被引量:4
2011年
为了提高挖掘结果的准确性,提出基于样例学习和项集同步随机化的隐私保护频繁模式挖掘方法(learning and synchronized privacy preserving frequent pattern mining,简称LS-PPFM).该方法充分利用不需要隐私保护的个体数据,首先对不需要保护的数据学习,得到样例数据中蕴涵的强关联项,然后在对数据随机化时,将强关联项绑定在一起作同步随机化变换,以保持项与项之间的潜在关联性.实验结果表明,相对于项独立随机化,LS-PPFM能够在略微牺牲一定的隐私保护性的情况下,显著提高频繁模式挖掘结果的准确性.
郭宇红童云海唐世渭吴冷冬
关键词:随机化隐私保护频繁模式挖掘
融合XGBoost计算特征权重的时间序列预测方法
本发明提供一种融合XGBoost计算特征权重的时间序列预测方法,属于数据处理技术领域,该方法包括:从数据库中获取与所预测时间序列变量相关的多个类型的特征信息;根据时间序列变量、特征信息和XGBoost模型,学习得到各个决...
郭宇红马海森
频繁模式挖掘中的隐私保护方法研究
频繁模式挖掘是许多数据挖掘问题的核心任务,并有广泛的应用。人们对数据隐私和信息安全的关注,往往限制和阻碍正常的挖掘任务。如何在基于隐私和安全考虑的环境中,很好地实施频繁模式的挖掘任务和各种应用,是频繁模式挖掘和信息安全领...
郭宇红
关键词:频繁模式挖掘隐私保护信息安全样例学习
共2页<12>
聚类工具0