庞亮
- 作品数:18 被引量:122H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划西藏自治区科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 平台经济中的数据与算法安全被引量:13
- 2022年
- 人工智能、大数据技术正快速推动着平台经济的发展。互联网平台在以“数据+算法”双轮机制为用户提供个性化、精准化信息服务的同时,也因平台的“生态垄断”、算法的应用不规范等行为对国家网络安全、市场公平竞争和用户合法利益等造成了威胁,给政府监管和平台治理带来了严峻挑战。在此背景下,探讨了平台经济中数据和算法安全的内涵、外延和研究现状,梳理了在保障安全的前提下影响平台创新发展的关键问题,并从体系架构构建、监管体系完善、核心技术突破、平台模式创新4个方面给出了促进平台经济生态创新发展的建议。
- 郑婷一庞亮靳小龙
- 关键词:平台经济数据安全
- 因果机器学习的前沿进展综述被引量:17
- 2023年
- 机器学习是实现人工智能的重要技术手段之一,在计算机视觉、自然语言处理、搜索引擎与推荐系统等领域有着重要应用.现有的机器学习方法往往注重数据中的相关关系而忽视其中的因果关系,而随着应用需求的提高,其弊端也逐渐开始显现,在可解释性、可迁移性、鲁棒性和公平性等方面面临一系列亟待解决的问题.为了解决这些问题,研究者们开始重新审视因果关系建模的必要性,相关方法也成为近期的研究热点之一.在此对近年来在机器学习领域中应用因果技术和思想解决实际问题的工作进行整理和总结,梳理出这一新兴研究方向的发展脉络.首先对与机器学习紧密相关的因果理论做简要介绍;然后以机器学习中的不同问题需求为划分依据对各工作进行分类介绍,从求解思路和技术手段的视角阐释其区别与联系;最后对因果机器学习的现状进行总结,并对未来发展趋势做出预测和展望.
- 李家宁熊睿彬兰艳艳庞亮郭嘉丰程学旗
- 关键词:因果关系因果推断人工智能
- 多跳式文本阅读理解方法综述被引量:1
- 2022年
- 多跳阅读理解成为近年来自然语言理解领域的研究热点,与简单阅读理解相比,它更加复杂,需要面对如下挑战:①结合多处内容线索,如多文档阅读等;②具有可解释性,如给出推理路径等。为应对这些挑战,出现了各类不同的工作。因此该文综述了多跳式文本阅读理解这一复杂阅读理解任务,首先给出了多跳文本阅读理解任务的定义;由于推理是多跳阅读理解模型的基础能力,根据推理方式的不同,多跳阅读理解模型可以分为三类:基于结构化推理的多跳阅读理解模型、基于线索抽取的多跳阅读理解模型、基于问题拆分的多跳阅读理解模型,该文接下来比较分析了各类模型在常见多跳阅读理解模型任务数据集上的实验结果,发现这三类模型之间各有优劣。最后探讨了未来的研究方向。
- 倪艺函兰艳艳庞亮程学旗
- 一种对社交平台上的媒体账号进行画像的方法和系统
- 本发明实施例提供了一种对社交平台上的媒体账号进行画像的方法和系统,该方法包括:获取社交平台的账号信息,识别其中符合第一筛选条件的媒体账号以构建第一集合,采集第一集合内的媒体账号的属性数据和历史贴文数据并存储于数据库,第一...
- 王永庆史铂深沈华伟高金华庞亮程学旗
- 文献传递
- 故事启发大语言模型的时序知识图谱预测
- 2024年
- 时序知识图谱海量稀疏,实体的长尾分布导致对分布外实体的推理泛化性较差,历史交互低频导致对未来事件的预测偏差较大.为此,文中提出故事启发大语言模型的时序知识图谱预测方法,利用大语言模型的世界知识储备和复杂语义推理能力,增强对分布外实体的理解和交互稀疏事件的关联.首先,根据时序知识图谱中时间和结构的特性筛选“关键事件树”,通过历史事件筛选策略提炼最具代表性的事件,并摘要当前查询相关的历史信息,减少数据输入量并保留最重要的信息.然后,微调大语言模型生成器,生成时序语义关联且符合逻辑的“关键事件树”叙事故事,作为非结构化输入.在生成过程中,特别关注事件之间的因果关系和时间顺序,确保生成的故事具有连贯性和合理性.最后,利用大语言模型推理器推理缺失的时序实体.在3个公开数据集上的实验表明,文中方法可充分发挥大模型的能力,完成精准的时序实体推理.
- 陈娟赵新潮隋京言祁麟田辰庞亮方金云
- 文本内容的衍生方法、装置、计算机可读介质及电子设备
- 本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括:获取原始文本内容,基于原始文本内容以及与原始条件相对应的反事实条件,从原始结尾中识别出与原始条件相关的因果内容;基于原...
- 庞亮郝长盈王琰兰艳艳沈华伟史树明程学旗
- 文献传递
- 多段落中文阅读理解模型被引量:1
- 2019年
- 解决多段落中文阅读理解任务需要考虑证据段落的稀疏性、中文语义的多样性和答案片段的有效性.基于此种情况,文中设计多段落中文阅读理解模型,利用数据增强的方式学习不包含答案的段落,利用字级别编码和中文词性标注丰富中文的语义表示,通过答案片段的特征训练答案有效性验证模型.将文中模型应用到CIPS-SOGOU事实类问答数据中,实验表明,完全匹配率和F1分数的平均分均有所提高.
- 赵峻瑶庞亮苏立新兰艳艳郭嘉丰程学旗
- 基于细粒度匹配信号的文本相关性度量方法和系统
- 本发明涉及一种基于细粒度匹配信号的文本相关性度量方法和系统,包括:获取待语义匹配的两段文本,将该文本中每一个词映射为词向量,根据其中一段文本中每一个词的词向量,与另一段文本中每一个词向量的语义相似度,将所有该语义相似度集...
- 程学旗庞亮兰艳艳郭嘉丰沈华伟陈丽娟张海楠曾玮李家宁赵峻瑶倪艺函
- 文献传递
- 一种基于社交平台元数据的文本主题建模方法及系统
- 本发明提出一种基于社交平台元数据的文本主题建模方法和系统,包括基于文本数据的关键词,构建文本数据的词袋表示;基于文本数据的元数据类别,训练对应类别的属性值预测任务,以微调预训练语义提取模型,得到目标语义提取模型,使用目标...
- 高金华赵鑫沈华伟王永庆庞亮孟剑程学旗
- 语言模型攻击性的自动评价方法被引量:2
- 2022年
- 基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现。然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本。这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型。因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题。针对该问题,该文提出了一种语言模型攻击性的自动评估方法。它分为诱导和评估两个阶段。在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的可能性。在评估阶段,利用训练好的文本分类模型的判别能力,估计诱导产生的攻击性文本的占比,用以评估语言模型的攻击性。实验评估了不同设置下的预训练模型的攻击性水平,结果表明该方法能够自动且有效地评估语言模型的攻击性,并进一步分析了语言模型的攻击性与模型参数规模、训练语料以及前置单词之间的关系。
- 侯丹阳庞亮丁汉星兰艳艳兰艳艳
- 关键词:语言模型