您的位置: 专家智库 > >

林海伦

作品数:28 被引量:219H指数:5
供职机构:中国科学院信息工程研究所更多>>
发文基金:国家自然科学基金北京市自然科学基金国家科技重大专项更多>>
相关领域:自动化与计算机技术交通运输工程机械工程更多>>

文献类型

  • 13篇期刊文章
  • 13篇专利
  • 1篇学位论文
  • 1篇会议论文

领域

  • 20篇自动化与计算...
  • 1篇机械工程
  • 1篇交通运输工程

主题

  • 8篇知识库
  • 4篇文本
  • 3篇网络
  • 3篇查询
  • 3篇抽取
  • 2篇用户
  • 2篇语料
  • 2篇语义表示
  • 2篇语义空间
  • 2篇知识库更新
  • 2篇时新性
  • 2篇实时监控
  • 2篇属性抽取
  • 2篇数据流
  • 2篇索引
  • 2篇匹配方法
  • 2篇重启动
  • 2篇准确率
  • 2篇资源采集
  • 2篇资源查询

机构

  • 27篇中国科学院
  • 6篇中国科学院大...
  • 5篇国家互联网应...
  • 2篇山东科技大学

作者

  • 28篇林海伦
  • 12篇程学旗
  • 11篇贾岩涛
  • 11篇王元卓
  • 10篇熊锦华
  • 9篇王伟平
  • 6篇许洪波
  • 4篇林政
  • 4篇李曼玲
  • 3篇靳小龙
  • 3篇岳银亮
  • 3篇张鹏
  • 2篇李焱
  • 2篇张永超
  • 2篇廖华明
  • 2篇孟丹
  • 2篇冯凯
  • 1篇谭建龙
  • 1篇孙永
  • 1篇徐克付

传媒

  • 3篇计算机研究与...
  • 3篇计算机科学与...
  • 2篇通信学报
  • 1篇模式识别与人...
  • 1篇计算机学报
  • 1篇软件学报
  • 1篇中文信息学报
  • 1篇现代计算机(...

年份

  • 3篇2022
  • 1篇2021
  • 1篇2020
  • 1篇2019
  • 2篇2018
  • 5篇2017
  • 2篇2016
  • 8篇2015
  • 2篇2014
  • 1篇2013
  • 1篇2012
  • 1篇2011
28 条 记 录,以下是 1-10
排序方式:
基于Cookie的网盘资源在线溯源方法
2016年
网盘作为一种基于互联网的信息传播载体,其所分享的敏感资源已经在网络流量中占有越来越多的比例,因此,获取网盘资源的分享链接对于网络安全有着重要的意义。提出了一种高效可扩展的基于Cookie的网盘资源溯源方法—Cookie Tracing。该方法通过在海量的HTTP会话中建立Cookie与HTTP会话的索引表来实现网盘资源和下载网盘资源的跳转链的关联,同时通过累计散列算法加快溯源结果的验证。实验结果表明,所提方法具有较好的性能和可扩展性。
林海伦李焱王伟平岳银亮林政
关键词:COOKIE
用户主导的个性化信息服务构造的研究
随着网络技术的飞速发展和深入应用,互联网上的信息资源给人们提供了更多的共享资源的机会。然而,人们需求的不确定性和多样性更需要在使用基于互联网的信息服务时以用户为主导的使用方式——使用户能够自主按需利用互联网上丰富的信息资...
林海伦
关键词:用户主导信息服务最终用户编程
文献传递
一种跨地域分布数据中心任务调度方法及系统
本发明提供了一种跨地域分布数据中心任务调度方法及系统,包括资源管理模块、任务调度模块、任务运行管理模块、任务执行模块和故障恢复模块。资源管理模块:采用心跳信号和集群可用资源表来记录集群运行状态和可用资源情况;任务调度模块...
刘建坤林海伦曹小波刘璐孙屹飞
文献传递
一种面向对话文本的事件抽取方法及系统
本发明涉及一种面向对话文本的事件抽取方法及系统,其方法包括:步骤S1:周期性获取对话文本集;步骤S2:对对话文本集进行两次过滤,得到事件相关对话文本集;步骤S3:创建事件模板,在事件相关对话文本集中,根据事件模板,并通过...
林海伦刘璐刘建坤周永彬
文献传递
一种面向开放网页的实体属性抽取方法和系统
本发明提供一种面向开放网页的实体属性抽取方法和系统。其中,所述方法包括:提取开放网页的文本,从中获得目标实体的候选文本集合;以及,根据目标实体属性在训练文本集合中出现的频率,选择基于规则的方式或者基于统计的方式从所述候选...
程学旗贾岩涛赵泽亚王元卓靳小龙熊锦华李曼玲林海伦许洪波
文献传递
基于领域知识抽样的深网资源采集方法被引量:2
2016年
深网资源是指隐藏在HTML表单后端的Web数据库资源,这些资源主要通过表单查询的方式访问。然而,目前的网页采集技术由于采用页面超链接的方式采集资源,所以无法有效覆盖这些资源,为此,该文提出了一种基于领域知识抽样的深网资源采集方法,该方法首先利用开源目录服务创建领域属性集合,接着基于置信度函数对属性进行赋值,然后利用领域属性集合选择查询接口并生成查询接口赋值集合,最后基于贪心选择策略选择置信度最高的查询接口赋值生成查询实例进行深网采集。实验表明,该方法能够有效地实现深网资源的采集。
林海伦熊锦华王博程学旗
关键词:深网置信度领域知识
融合页面结构与内容的在线百科实体标注方法被引量:2
2015年
在线百科实体标注目的是标注出属于特定类别(如人名、地名、机构名等)的实体。百科实体标注对大量的应用,诸如实体消歧、实体关系挖掘、知识库构建都很重要。百科实体特征可以分为结构特征(属性框、标题、类别等)和内容特征(页面正文)。现有的标注方法大多只考虑一种特征或者一种分类器,导致F1值较低,无法充分发挥两种特征的优势。因此,提出了融合页面结构特征和内容特征的在线百科实体标注方法。该方法考虑了两种特征对标注结果的影响,分别构造分类器,并且对结果进行线性组合,能够更准确地实现百科实体的实体标注。实验表明,该方法在实体标注中F1值较其他对比实验方法均有所提高。
李晓静林海伦贾岩涛王元卓程学旗
面向领域的暗网资源采集方法和系统
本发明提供了一种面向领域的暗网资源采集方法。该方法从抓取的页面中识别与指定领域相关的页面,获取有效表单集合;对于有效表单集合中的每个表单,判断其表单类型并按照不同的表单类型构造有效查询,所述表单类型为单输入项的表单或多输...
熊锦华林海伦程学旗张永超廖华明
文献传递
基于卷积神经网络和用户信息的微博话题追踪模型被引量:6
2017年
为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-User TTM分别获得较高的微博话题追踪准确率.
付鹏林政袁凤程林海伦王伟平孟丹
关键词:卷积神经网络
面向在线百科的知识库自动更新方法及系统
本发明提供一种面向在线百科的知识库自动更新的方法,该方法实时监控知识库的知识语料来源,根据知识语料更新时间和知识语料内容变化,获取新增的知识语料与内容改变的知识语料;从所获取的知识语料识别知识的变化,以及将基于所识别的知...
程学旗王元卓林海伦贾岩涛熊锦华许洪波冯凯
共3页<123>
聚类工具0