万怀宇 作品数:93 被引量:201 H指数:6 供职机构: 北京交通大学 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 电子电信 更多>>
基于自然语言增强的签到轨迹与用户匹配方法 2025年 随着定位技术和传感器的高速发展,用户移动轨迹数据日渐丰富,但大多分散在不同平台上。为了全面利用这些数据并准确反映用户的真实行为,对轨迹用户匹配的研究变得至关重要。该任务旨在从海量签到轨迹数据中精准关联用户身份。近年来,研究者们尝试运用循环神经网络、注意力机制等方法深入挖掘轨迹数据。然而,当前方法在处理用户签到轨迹时面临两大挑战:一是签到数据中有限的时空特征不足以从主观和客观两个角度全面地建模签到点信息,二是用户的签到轨迹往往围绕着一个特定的主题。针对这两点挑战,提出了一种基于自然语言增强的轨迹用户匹配模型(Natural Language Augmented Trajectory User Link,NLATUL)。首先,设计了一套自然语言模板与软提示令牌来描述签到轨迹,并使用语言模型来理解签到点中的主观意图,融合用户的时空状态,提供了一种充分从主观与客观两个方面建模签到点的方法;在此基础上,通过提示学习的方法推理签到轨迹的主题,并对建模的签到点表示的轨迹进行双向编码,通过签到轨迹主题与签到轨迹编码的结合实现对用户签到轨迹的准确理解。在两个真实世界签到数据集上验证的实验结果表明,NLATUL能够更准确地匹配签到轨迹与其对应的用户。 王天一 林友芳 贡乐天 陈炜 郭晟楠 万怀宇关键词:时空数据挖掘 语言模型 一种基于K近邻的自定义协议应用层的网络报文匹配方法 本发明提供了一种基于K近邻的自定义协议应用层的网络报文匹配方法,属于数据传输领域。所述方法包括:根据历史网络报文构建协议类型存储结构并按时间戳进行顺序编号,获得每种协议类型的结构特征值与取值数组,再基于K近邻模型获取K个... 韩升 林友芳 万怀宇 王晶 董兴业 武志昊 吕凯 张硕 曹端鑫特征驱动的关键词提取算法综述 被引量:36 2018年 面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取3个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法. 常耀成 张宇翔 王红 万怀宇 肖春景关键词:关键词提取 一种睡眠呼吸暂停自动检测方法和装置 本发明提供了一种睡眠呼吸暂停自动检测方法及装置,属于睡眠监测领域。所述方法采集睡眠时心电图信号,生成心跳间期时间序列;使用包含两个不同结构残差网络的双残差神经网络模型对所述心跳间期时间序列进行特征提取,转变为两个相同维度... 王晶 林友芳 韩升 万怀宇 张宏钧一种基于心跳间期的睡眠呼吸暂停自动检测方法及装置 本发明提供了一种基于心跳间期的睡眠呼吸暂停自动检测方法和装置,用于解决现有技术中睡眠呼吸暂停检测不准确、精度不高的问题。所述睡眠呼吸暂停自动检测方法首先采集睡眠时的心跳间期信息,再通过残差神经网络对所述心跳间期信息自动提... 王晶 林友芳 韩升 万怀宇 武志昊 董兴业 张硕文献传递 社会网络中的链接稳定性预测问题研究 被引量:5 2009年 社会网络是一个由对象和链接所构成的复杂关系型数据集.给定一个社会网络的快照,能否预测在下一个较短的时间段内其中哪些链接将会继续存在而哪些链接将会消失,这是社会网络中链接挖掘的一项新的任务.这一任务可以形式化为链接稳定性预测(Link Stability Prediction).提出了通过打分的方法来度量链接的稳定性,并讨论了几种基于邻近度度量的链接稳定性预测方法.在一个大型的电话通信网络上进行了实验,并设计了一种用来评价链接稳定性预测准确性的机制.实验结果表明,链接的稳定性信息在一定程度上是可以通过基于邻近度度量的方法从社会网络的拓扑结构中提取出来的,其中有两三种较精炼的预测方法展现出了良好的性能.但是,这些静态的链接稳定性预测方法也有其局限性,更多动态的预测方法亟待研究. 万怀宇 林友芳 黄厚宽关键词:社会网络 链接挖掘 链接预测 一种关键性能指标数据的时序异常检测方法及系统 本发明提供了一种关键性能指标数据的时序异常检测方法,用以解决现有技术中时序数据异常检测效率低、准确率低的问题。所述时序异常检测方法,先对采集的时序数据中缺失值及异常值进行修正,再提取特征对数据进行拼接,将拼接数据划分为训... 王晶 林友芳 万怀宇 武志昊 韩升 董兴业 张硕文献传递 结合注意力机制与双向LSTM的中文事件检测方法 被引量:11 2019年 事件检测是信息抽取领域的重要任务之一。已有的方法大多高度依赖复杂的语言特征工程和自然语言处理工具,中文事件检测还存在由分词带来的触发词分割问题。该文将中文事件检测视为一个序列标注而非分类问题,提出了一种结合注意力机制与长短期记忆神经网络的中文事件检测模型ATT-BiLSTM,利用注意力机制来更好地捕获全局特征,并通过两个双向LSTM层更有效地捕获句子序列特征,从而提高中文事件检测的效果。在ACE 2005中文数据集上的实验表明,该文提出的方法与其他现有的中文事件检测方法相比性能得到明显提升。 沈兰奔 武志昊 纪宇泽 林友芳 万怀宇一种基于司法裁判文书的人员社交关系抽取方法 本发明提供了一种基于司法裁判文书的人员社交关系抽取方法,用以解决司法裁判文书中人员社交关系数据处理的问题。所述基于司法裁判文书的人员社交关系抽取方法,对裁判文书进行数据清洗、中文分词以及去停用词,构建基于预训练语言模型的... 万怀宇 林友芳 武志昊 韩升 王晶 张硕文献传递 一种基于移动终端信令数据的城市主干道路连接方法 本发明提供了一种基于移动终端信令数据的城市主干道路连接方法。该装置包括:根据原始路网数据的基础路段方向和端点的经纬度数据、以分岔路口为端点对基础路段进行初步连接,计算初步连接后的路段的关联基站。根据用户的移动终端信令数据... 万怀宇 林友芳 韩升文献传递