您的位置: 专家智库 > >

张晓宇

作品数:12 被引量:70H指数:3
供职机构:中国科学技术信息研究所更多>>
发文基金:中央级公益性科研院所基本科研业务费专项国家自然科学基金中央级公益性科研院所基本科研业务费专项资金项目更多>>
相关领域:自动化与计算机技术文化科学电气工程更多>>

文献类型

  • 11篇期刊文章
  • 1篇专利

领域

  • 6篇自动化与计算...
  • 4篇文化科学
  • 1篇电气工程

主题

  • 3篇文本挖掘
  • 2篇网络
  • 2篇半监督学习
  • 1篇电池
  • 1篇电池技术
  • 1篇多分类器
  • 1篇多分类器融合
  • 1篇多模态融合
  • 1篇信息挖掘
  • 1篇引文
  • 1篇引文分析
  • 1篇用户
  • 1篇用户体验
  • 1篇语境
  • 1篇语义标注
  • 1篇语义相关
  • 1篇语义相关性
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇上下文

机构

  • 12篇中国科学技术...

作者

  • 12篇张晓宇
  • 4篇胡阿沛
  • 4篇张静
  • 2篇雷孝平
  • 1篇黄东流
  • 1篇张满年
  • 1篇龚春红

传媒

  • 4篇高技术通讯
  • 1篇情报科学
  • 1篇现代情报
  • 1篇情报杂志
  • 1篇计算机应用研...
  • 1篇情报理论与实...
  • 1篇全球科技经济...
  • 1篇计算机科学

年份

  • 1篇2014
  • 6篇2013
  • 4篇2012
  • 1篇2011
12 条 记 录,以下是 1-10
排序方式:
基于浏览记录挖掘的个性化偏好建模
2013年
为提高个性化信息检索性能,提出了一种基于浏览记录挖掘的偏好建模算法。该算法从浏览记录出发,深入挖掘用户在域和域值这两个维度上的偏好,从而自动构建并累积更新偏好模型,对检索结果进行个性化优化;给定查询,相关结果能够自动根据现有浏览记录进行偏好建模以实现个性化排序,无需任何额外的用户操作。讨论了关键参数的优化,以进一步提升算法性能,使其更加符合实际应用的需求,从而在精确刻画用户偏好的同时有效提升了用户体验。实验结果表明,基于浏览记录挖掘的个性化偏好建模算法能够显著提高检索性能,对于海量信息的有效获取具有重要意义。
张晓宇
关键词:个性化检索用户体验
生物燃料电池技术专利计量分析被引量:2
2013年
专利文献是科学技术的宝库,它能够反映科学技术的发展动态。以德温特专利数据库收录的生物燃料电池相关专利为分析对象,从时间、技术领域、国家和主要专利权人的角度对其进行专利计量分析,并利用社会网络分析软件Ucinet绘制合作网络图,对生物燃料电池专利的合作研发情况进一步分析,以为政府和科研机构以及企业制定生物燃料电池科技发展计划、研发计划、寻找合作伙伴、了解竞争格局以及把握产业发展趋势提供对策建议。
胡阿沛张静雷孝平张晓宇
关键词:生物燃料电池合作网络
共词网络分析中E指数的改进研究被引量:7
2014年
选择高频词进行共词网络分析会遗失信息,选择所有词又会使得共词网络结构混乱,无法分析。为解决该问题,在E指数的基础之上,提出一种改进的共词强度计算方法,根据词对共现频次,赋予共现频次高的词对的E指数较高权值,共现频次低的词对的E指数较低权值。采用该方法无需选择高频词,可直接对所有词进行共词网络分析。为验证该方法的有效性,以电动汽车动力电池专利文献为数据源进行实证对比研究。
胡阿沛张静张晓宇
关键词:共词分析
基于文本挖掘的交互式专利分类被引量:2
2013年
将文本挖掘理论应用于专利信息分析,提出了一种基于多分类器融合与主动学习的交互式专利分类算法,旨在实现高效的专利分类。该算法基于训练集,利用支持向量机,针对不同的专利类别分别训练相应的子分类器,然后通过多分类器融合对各子分类器进行有机结合,以获得性能更优的分类器和形成分类决策。在此基础上,利用主动学习选取最有信息的样本进行标引,从而通过人机交互实现分类模型的更新。针对传统批量选择性采样的缺点,还提出了动态批量选择性采样模式,通过确定度传播策略有效降低标引样本冗余度,以进一步提高主动学习的效率。实验结果表明,这种基于多分类器融合与主动学习的交互式专利分类算法的分类性能显著高于其他算法。
张晓宇
关键词:文本挖掘多分类器融合
论我国科技情报研究机构研究方向的变迁被引量:1
2012年
情报研究是我国科技情报机构的主要业务之一,是我国情报工作耳目、尖兵和参谋作用的主要承载者。在为国家经济建设、社会发展和科技进步做出重要贡献的同时,我国科技情报研究方向也在不断变化。本文从国内相关研究现状出发,以现有史料和机构调研为基础,综合采用典型科技情报研究机构实证研究、文献计量统计分析、比较研究等研究方法,对我国科技情报研究方向的变迁历程进行系统性回顾与梳理,分析发展演化的特点和规律,认识存在的不足与问题,旨在更好地促进我国科技情报研究实践,提高科技情报研究质量和服务水平。
张满年龚春红黄东流张晓宇
关键词:科技情报情报机构情报研究
基于多视角二维主动学习的多标签分类被引量:3
2011年
针对多标签图像分类问题的特点,提出了一种多视角二维主动学习(MV-2DAL)算法,以通过多视角学习与主动学习的有机结合,深入挖掘样本、标签、视角三个维度上的相关性和冗余性。此算法以样本.标签对作为基本标注单位,在每个视角内,利用二维主动学习的方法计算样本、标签维度上的不确定度;在不同视角间,通过多视角融合的方法计算跨视角的不确定度;最终,将视角内不确定度与视角间不确定度进行融合得到总不确定度,并以此衡量样本-标签对的标注价值。将MV-2DAL算法应用到图像内容理解的一个重要领域——多标签图像分类中,显著提高了信息标注的针对性,不仅有效降低了信息冗余度,同时也大幅减少了数据标注量。
张晓宇
关键词:图像分类多模态融合
基于网络信息挖掘的视频博客自动语义标注
2013年
为获得高质量的视频博客语义标注,针对视频博客的特点,提出了一种基于网络信息挖掘的自动语义标注算法,该算法首先从分析视频博客自身所包含的信息入手,从中提取基本标注;然后借助丰富而便捷的网络资源,通过深入挖掘网络信息获取在底层特征和高层语义上都相关的信息,对基本标注进行改进和完善,最终实现基于上下文的标注扩展。为了更加全面客观地评价语义标注结果,提出了一种基于分值的评价标准,该标准有效兼顾了标注的正确性和完整性这两大重要指标,从而能更加准确地反映标注质量。实验结果表明,这种基于网络信息挖掘的自动语义标注算法能够显著提高语义标注质量,对于海量视频博客的有效获取与管理具有重要意义。
张晓宇
关键词:信息挖掘语义标注
一种基于上下文语境的词的语义相关性度量方法
本发明涉及自然语言处理、文本语义分析技术领域,具体是一种基于上下文语境度量的词的语义相关性的方法。该方法旨在克服现有的语义相关性度量方法无法反映词在特定上下文语境中的含义的缺点。为此,本发明的方法包括:基于统计方法度量词...
张晓宇
文献传递
基于文本挖掘的专利技术主题分析研究综述被引量:39
2013年
为应对专利数量巨大和技术的日益复杂给专利技术主题分析带来的挑战,以及利用文本挖掘技术的专利技术主题分析近来成为研究热点。首先介绍文本挖掘的概念和其发展历史。其次,对目前基于文本挖掘的专利技术主题分析方法进行了归纳,包括主题词词频分析、共词分析、文本聚类分析和与引文聚类结合的分析方法,总结其常用的分析工具并介绍新的科学图谱分析软件——SciMAT。最后总结基于文本挖掘的专利技术主题分析方法的优点与不足,为其将来的研究提供建议。
胡阿沛张静雷孝平张晓宇
关键词:文本挖掘词频分析
基于动态可行域划分的SVM主动学习被引量:3
2012年
针对传统SVM主动学习中批量采样方法的不足,提出了动态可行域划分算法。从特征空间与参数空间的对偶关系入手,深入分析SVM主动学习的本质,将特征空间中对样本的标注视为参数空间中对可行域的划分;通过综合利用当前分类模型和先前标注样本两方面信息,动态地优化可行域划分方案,以确保选取的样本对模型改进的价值,最终实现更为高效的选择性采样。实验结果表明,基于动态可行域划分的SVM主动学习算法能够显著提高所选样本的信息量,从而能够在有限的标注代价下大幅提高其分类性能。
张晓宇
关键词:半监督学习支持向量机可行域
共2页<12>
聚类工具0