钱跃
- 作品数:5 被引量:4H指数:1
- 供职机构:大连理工大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向复杂文本挖掘的特征融合方法
- 文本在人类已产生的数据中占有极为重要的地位,如何从文本中自动发现知识是一个有着长久历史的经典问题。随着人工智能和数据科学的进步,机器学习与数据挖掘技术成为文本知识挖掘的主流。但是,已有模型通常只能表达数据的部分结构特征,...
- 钱跃
- 关键词:文本挖掘非负矩阵分解主题发现文本聚类
- 基于全局图注意力和局部图注意力的论文摘要生成方法
- 一种基于全局图注意力和局部图注意力的论文摘要生成方法,从输入的知识图中,通过全局图注意力和局部图注意力提取图结构特征,应用于指导论文摘要生成,该方法可以更好抓住各个实体间的关系,提高论文摘要生成效果。该方法主要包括:图结...
- 刘宇姚远钱跃 谭雄阳单世民 赵哲焕徐秀娟 刘熠
- 基于全局图注意力和局部图注意力的论文摘要生成方法
- 一种基于全局图注意力和局部图注意力的论文摘要生成方法,从输入的知识图中,通过全局图注意力和局部图注意力提取图结构特征,应用于指导论文摘要生成,该方法可以更好抓住各个实体间的关系,提高论文摘要生成效果。该方法主要包括:图结...
- 刘宇姚远钱跃 谭雄阳单世民 赵哲焕徐秀娟 刘熠
- 基于文本挖掘的学者简历自动生成
- 用户的简历信息是社交网络构建的基础,自动构建用户简历将为社交网站的建设和推广带来极大的便利。本文以学术社交网站LinkScholar为应用背景,以PDF格式论文和学术期刊网站为信息来源,通过信息抽取,获取国内学者信息,应...
- 钱跃
- 关键词:信息抽取双序列比对
- 文献传递
- 基于字典匹配和支持向量机的中文科技论文元数据抽取被引量:3
- 2012年
- 针对中文PDF格式论文元数据抽取问题,对大量中文科技论文进行分析归纳,总结出中文论文元数据的互不包含性、排它性、重复性、顺序性和部分确定性,并据此定义简单元数据和复杂元数据的概念,应用字典匹配和支持向量机模型抽取中文科技论文元数据.实验结果表明,该模型的综合性能指标在96%以上,优于条件随机场模型和隐马尔科夫模型.
- 刘宇钱跃
- 关键词:元数据抽取抽取模型支持向量机