搜索到1573篇“ 主题信息“的相关文章
一种基于主题信息增强的大模型实体共指消解方法
本发明涉及一种基于主题信息增强的大模型实体共指消解方法,包括:提取输入文档中所有mention和所述mention的上下文;将所述mention的上下文输入到TSECR模型,获取主题结构,将所述输入文档、所述主题结构和提...
刘小明吴彦博许进忠杨关杨华吴佳昊
一种结合主题信息的并行双通道医疗咨询监管检测方法及模型
本发明公开了一种结合主题信息的并行双通道医疗咨询监管检测方法及模型。该模型首先利用BERT生成词向量,准确捕捉医疗专业语境中的词义细节与上下文,并结合CTM生成的主题向量,以理解文本核心主题。这一融合策略既增强了对冒犯性...
郭亨长白书臣曹涛李云
一种融合主题信息的关键词生成方法
本发明涉及自然语言处理和关键词提取技术领域,公开了一种融合主题信息的关键词生成方法,对语料库C进行预处理得到向量模型;采用word2vec对X<Sub>bow</Sub>预训练得到词向量X<Sub>seq</Sub>;将...
马甲林 成洁怡 魏丹丹 焦英杰李翔朱全银 赵春晓
一种融合主题信息的电力数据推荐方法
本发明公开了一种融合主题信息的电力数据推荐方法。该方法包括:利用LDA模型对电力文本以及检索文本进行学习,得到文档的主题分布,每个主题包含一组相关的词汇,将主题分布表示为固定长度的向量,每个维度对应一个主题;将LDA模型...
张希翔艾徐华陈昭利韦宗慧张丽媛黄依婷银源刘凯杰董贇蒙琦
融合主题信息的篇章级神经机器翻译方法
本发明涉及融合主题信息的篇章级神经机器翻译方法,属自然语言处理领域。先对篇章级平行语料进行预处理并进行BPE分词;再利用词嵌入主题模型训练源语言篇章主题,对篇章文本进行向量化表征,得到文本中每个单词的词嵌入,后在神经机器...
余正涛陈玺文高盛祥
一种融合主题信息和词向量提取文本特征的新闻分类方法
本发明涉及一种融合主题信息和词向量提取文本特征的新闻分类方法。本发明所述的一种融合主题信息和词向量提取文本特征的新闻分类方法包括:使用Word2vec和LDA模型分别在语料库中训练词向量,word2vec经过TF‑IDF...
冼广铭王鲁栋李楚彬张鑫
基于主题信息增强的弱监督方面类别检测方法
本发明涉及基于主题信息增强的弱监督方面类别检测方法,属于自然语言处理技术领域。面向产品评论的方面类别检测,需要人工映射方面词与方面类别之间的关系,人工的介入极大的影响了方面识别的性能,对此本发明利用主题聚类自动选取句子向...
相艳刘威余正涛施敬磊
一种融合了主题信息的多意图识别方法和系统
本发明涉及自然语言处理和深度学习技术领域,为了提高多意图识别的准确度,提供了一种融合了主题信息的多意图识别方法,包括:1、获取用户的输入文本并对其进行规范化处理得到处理文本;2、获取处理文本中基于句子的主题信息和基于词的...
饶璐孙锐展华益
融入类别标签和主题信息的用户兴趣识别方法被引量:1
2024年
社交网络用户兴趣发现对信息过载缓解、个性化推荐和信息传播正向引导等方面具有重要意义。目前已有的兴趣识别研究未能同时考虑文本主题信息及其对应的类别标签信息对模型学习文本特征的帮助,文中提出了一种融入类别标签和主题信息的用户兴趣识别方法。首先,利用BERT预训练模型、BiLSTM模型和多头自注意力机制分别获取文本和标签序列的语义特征;其次,引入标签注意力机制,使模型更加关注文本与其类别标签更相关的词语信息;然后,利用LDA主题模型和Word2Vec模型得到文本主题特征;接着,设计门控机制进行特征融合,使模型能够自适应地融合多种特征,进而实现微博文本兴趣类别分类;最后,统计用户发表的所有文本在各个兴趣类别上的数量,将数量最多的兴趣类别确定为用户兴趣识别结果。为验证所提方法的有效性,文中构建了一个微博兴趣识别数据集。实验结果表明,该模型在微博文本兴趣类别分类和用户兴趣识别任务中均取得了最优性能。
康智勇李弼程林煌
关键词:社交网络主题模型
融合主题信息的关键词生成式文本摘要模型研究
2024年
现有基于Seq2Seq框架的文本摘要模型在解决未登录词、文本重复生成等问题取得了较大进展,但在文本生成过程中依然存在关键信息缺失的问题。基于此,文章提出了主题信息关键词增强指针生成器网络(Thematic Keyword Enhancement Pointer Generator Networks,TKE-PGN)模型。该模型以指针生成器网络(Pointer-Generator Network,PGN)作为基线模型,引入关键词上下文向量对摘要生成进行指导。首先,在关键词提取阶段,使用线性判断分析(Linear Discriminant Analysis,LDA)方法对原文进行主题信息的提取,以此作为预训练语言模型BERT进行关键词提取时的信息补充。然后,在解码阶段融入主题关键词信息,以确保关键信息在解码阶段不会被遗漏或缺失。在CNN/Daily Mail数据集上的实验结果表明,提出的模型在ROUGE指标上对比基线模型有所提升,证明了该模型的有效性。
宋卓儒
关键词:关键词提取LDA

相关作者

余正涛
作品数:871被引量:1,246H指数:15
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
相艳
作品数:234被引量:250H指数:9
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 注意力 情感分析 抽取方法
线岩团
作品数:219被引量:239H指数:8
供职机构:昆明理工大学
研究主题:越南语 自然语言处理技术 文本 新闻文本 语料
肖刚
作品数:621被引量:825H指数:14
供职机构:浙江工业大学
研究主题:图像 电梯 WEB服务 车牌 向量表示
陆佳炜
作品数:358被引量:225H指数:8
供职机构:浙江工业大学
研究主题:WEB服务 向量表示 语义 聚类方法 图像