杨先娣 作品数:25 被引量:94 H指数:4 供职机构: 武汉大学计算机学院 更多>> 发文基金: 国家自然科学基金 湖南省自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
Deep Web信息按需集成研究综述 被引量:2 2009年 Deep Web信息按需集成研究的是如何根据用户的需求从海量的Web数据库中获取所需的信息.本文在对近10年来该领域研究进行综述的基础上,提出Deep Web信息按需集成框架,它包括Deep Web搜索引擎、接口集成、数据源描述、查询执行等4个方面内容.同时,围绕用户的个性化、查询结果的用户满意度和查询效率等评价指标,对Deep Web按需集成的未来发展方向进行展望. 崔晓军 彭智勇 杨先娣 张莹关键词:搜索引擎 接口集成 个性化 用户满意度 一种基于层次注意力机制的群组推荐方法 本发明公开了一种层次注意力机制的群组推荐方法,首先根据对用户、项目进行嵌入编码,将高维度的编码转换为低维度的嵌入向量。采用层次注意力机制进行群组偏好融合,使用两层注意力神经网络,第一层注意力网络用于捕捉成员之间的影响,第... 彭智勇 林南州 宋伟 杨先娣信息集成研究综述 被引量:53 2006年 信息集成所要解决的问题是把位于不同的异构信息源上的数据合并起来,以便为用户提供一个这些数据的统一视图。在当前的实际应用中,设计信息集成系统很重要,并且已经成为数据库领域的研究热点。本文对这一领域的研究做了综述,包括信息集成的方法、逻辑框架、查询处理,以及Web上半结构化数据的集成。最后,对将来的研究主题进行了展望。 杨先娣 彭智勇 刘君强 李旭辉关键词:信息集成 异构 LAV 半结构化数据 一种基于群体学习行为特征的知识追踪方法 本发明公开了一种基于群体学习行为特征的知识追踪方法,首先根据用户要学习的新领域收集该领域的历史答题数据,采用DKVMN模型提取每个学生对每个知识点的学习过程,即学生个人知识点的学习特征;然后,利用改进的K‑Means方法... 彭智勇 李标 宋伟 杨先娣文献传递 基于本体的语义信息集成方法研究 杨先娣关键词:语义WEB 信息集成 本体映射 范畴论 可信云数据管理关键技术及应用 彭智勇 宋伟 廖巍 余鹏飞 杨先娣 程芳权 崔一辉 申远 任毅 何镝 谢格 聂孜析 王占兵 湛昭豪 史成良 随着网络大数据时代的来临,人们对大数据存储、管理和分析的需求日益迫切。云计算作为一种高效的数据外包服务模式已经得到广泛应用,但是云计算的发展仍面临许多不可回避的挑战,其中尤以安全问题最为突出。与传统服务模式不同,云环境下...关键词:关键词:云计算系统 数据库系统 基于树结构的多策略本体映射算法 被引量:3 2008年 针对语义Web中的本体异构问题,提出了一种基于树结构的多策略本体映射算法,该算法的特点在于:按照数据类型分类进行映射,并采用启发式规则,提高了映射效率;同时考虑了概念的语言相似性、实例相似性和结构相似性,提高了相似度计算的准确性;采用迭代矫正,最终得到正确而完整的映射对.实验结果表明,该算法的查准率和查全率均优于GLUE算法,能有效完成本体间的映射. 杨先娣 彭智勇 吴黎兵 刘君强关键词:本体集成 本体映射 语义WEB 一种基于关联周期注意力机制的行为预测方法 本发明公开了一种基于关联周期注意力机制的行为预测方法,首先根据日志记录收集用户的学习行为数据,通过独热向量实现离散特征连续化,再通过降维进行学习者行为特征构建;然后利用信息熵检测学习者行为周期为后面预测阶段服务;行为预测... 彭智勇 吴璠 宋伟 杨先娣文献传递 一种支持用户身份认证的群组密钥管理方法 本发明公开了一种支持用户身份认证的群组密钥管理方法,本发明包括信息发送者、信息接收者以及参与身份验证与密钥管理的可信第三方;可信第三方负责构建整个密钥系统并管理用户的身份信息;信息发送者向可信第三方请求获取数据接受者公开... 宋伟 湛昭豪 彭智勇 杨先娣基于差分隐私的多源数据关联规则挖掘方法 被引量:11 2018年 随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安全性问题,现有研究更多地关注访问控制、密文检索和结果验证,虽然可以保证用户数据本身的安全性,但是无法挖掘出所保护数据的潜在价值。如何既能保护用户的数据安全又能挖掘数据的潜在价值,是亟需解决的关键问题之一。文中提出了一种基于差分隐私保护的关联规则挖掘方法,数据拥有者使用拉普拉斯机制和指数机制在数据发布的过程中对用户数据进行保护,数据分析者在差分隐私的FP-tree上进行关联规则挖掘。其中的安全性假设是:攻击者即使掌握了除攻击目标以外的所有元组数据信息的背景知识,仍旧无法获得攻击目标的信息,因此具有极高的安全性。所提方法是兼顾安全性、性能和准确性,以牺牲部分精确率为代价,大幅增加了用户数据的安全性和处理性能。实验结果表明,所提方法的精确性损失在可接受的范围内,性能优于已有算法的性能。 崔一辉 宋伟 彭智勇 杨先娣