搜索到683篇“ 主题识别“的相关文章
一种对话文本的主题识别方法
本发明提出一种对话文本的主题识别方法,包括以下步骤:S1,在原有电力领域本体词典和通用词典的基础上进行对话文本预处理,包括分词、词性标注和词频特征提取;S2,在原有电力领域本体词典和通用词典的基础上,新增属性条目,包括电...
陈杭升李建红吴向宏韩翊陈耀军姜炯挺孙灵林昊翁张力张湘
面向国防科技前沿的开源信息主题识别
2024年
面向国防科技前沿细颗粒领域主题出现的不平衡数据分类问题,提出一种基于融合特征的国防科技前沿主题识别与分类模型。该模型在基于Sentence-BERT预训练模型提取的语义特征基础上,融合基于命名实体识别技术提取的实体特征,实现面向国防科技前沿领域特定专题的追踪、监测能力构建。实验结果表明,融合特征主题识别与分类模型有较好的模型指标。该模型已在具体实践中取得一定成效。
刘任烨于凯
关键词:主题识别语义相似度命名实体识别
基于BERT-LDA模型的文本主题识别方法
本发明提供了一种基于BERT‑LDA模型的文本主题识别方法,涉及主题识别领域。本发明提供的技术方案首先借助BERT模型,将BERT模型提取出的语义词向量与LDA模型提取出的主题词向量进行连接,并使用K‑means算法对连...
张彦李姚矿苗永明
一种语音数据主题识别的方法及装置
本发明公开了一种语音数据主题识别的方法及装置,该方法包括获取待识别的语音数据的数据集,对数据集中的语音数据进行识别,得到各语音数据对应的语音文本,将数据集中的语音数据以及语音数据对应的语音文本输入到语音主题模型中进行训练...
宋元峰
数据中台的低价值数据主题识别方法
本发明涉及数据处理技术领域,具体为数据中台的低价值数据主题识别方法,包括根据所有数据主题的读写访问记录,基于预设格式获取包括各数据主题中所有主题子表的清单数据列表;基于所有数据主题的读写访问记录获取各数据主题的平衡指数和...
杨艳丽王晓云耿永玲宁志刚孙贞蒋雪苹关宇晗武继龙
基于三维主题特征测度的新兴主题识别研究被引量:1
2024年
识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表示,构建基于时间、引用和关联的三维主题特征指标框架,用于新兴主题识别;并以文本分类领域为例,验证本文方法的可行性与有效性。研究发现,以文献为基本单位表示主题能辅助主题深入挖掘,三维主题特征指标框架具有较好的适应性与扩展性,本文提出的新兴主题识别方法存在泛化应用的参考价值。在理论层面,能为新兴主题识别的相关研究提供一种可参考的方法和思路;在实践层面,可作为一种参考工具应用于科技情报分析、领域发展态势分析等场景。
郑德俊程为
关键词:主题建模文本分类
一种基于LDA模型的新兴主题识别与探测方法被引量:2
2024年
新兴主题识别是科技研究领域识别新兴技术的重要方式,高效精准地识别新兴主题是早期辨识新兴技术研究方向的前提.提出一种基于LDA模型的新兴主题识别与趋势预测方法,通过LDA模型提取科技文献中的研究主题,构建主题强度、主题新颖度和复合主题关注度的指标体系识别新兴主题,采用Prophet模型预测新兴主题主题强度,探测未来发展趋势.以智慧农业领域最近14年的科研文献为数据集,对提出的识别和探测方法进行验证,识别出了5个新兴主题,并预测了未来3年的发展趋势,同时验证所提方法的有效性.
吴东雪沈桂兰
关键词:主题识别
使用自然语言处理的基于上下文的主题识别
本发明涉及使用自然语言处理的基于上下文的主题识别。一种用于书面对话中主题识别的方法、系统和计算机程序产品,包括由一个或多个处理器从用户使用的协作消息传递系统(collaborative messaging system)...
A·吉多蒂M·维拉尼
我国ChatGPT研究领域热点主题识别与演化路径分析被引量:2
2024年
文章采用信息计量法与内容分析法,运用VOSviewer可视化分析工具构建我国ChatGPT研究领域的科学知识图谱,全面剖析ChatGPT研究领域的研究特征、热点主题分布以及演化路径,并提出研究展望,为ChatGPT理论研究和应用发展提供学理依据及实践指导。研究结果表明,国内ChatGPT研究主要围绕AIGC、教育变革、学术研究、媒介传播、图书馆服务、风险与治理、信息资源管理服务以及数字中国发展8个热点主题开展,形成以ChatGPT为代表的涵盖社会发展变革、应用场景开发、风险问题研判、知识信息生产传播、赋能数字化转型5条路径的多主体发展问题研究路径。
王海蓓潘辉
多模态自适应融合的主题识别方法及系统
本发明提供一种多模态自适应融合的主题识别方法及系统,涉及自然语言处理技术领域,包括:步骤S1:针对主题识别任务构建主题识别数据集;步骤S2:利用不同的预训练模型分别提取文本信息的语义特征和视觉特征向量;步骤S3:获取规则...
冯卫强张友豪闫文杰

相关作者

许海云
作品数:107被引量:1,195H指数:20
供职机构:中国科学技术信息研究所
研究主题:主题识别 评价指标 学科 可视化 引文分析
白如江
作品数:123被引量:1,066H指数:18
供职机构:山东理工大学
研究主题:可视化 主题识别 文本分类 大数据 主题
王效岳
作品数:140被引量:998H指数:18
供职机构:山东理工大学
研究主题:机器人 文本分类 切削加工机器人 可视化 主题识别
冷伏海
作品数:161被引量:1,967H指数:22
供职机构:中国科学院科技战略咨询研究院
研究主题:知识发现 情报研究 中小企业 引文 共词分析
董坤
作品数:53被引量:478H指数:14
供职机构:山东理工大学
研究主题:主题识别 创新链 影响因素 高校专利 互动模式