林海伦
- 作品数:28 被引量:219H指数:5
- 供职机构:中国科学院信息工程研究所更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术交通运输工程机械工程更多>>
- 基于Cookie的网盘资源在线溯源方法
- 2016年
- 网盘作为一种基于互联网的信息传播载体,其所分享的敏感资源已经在网络流量中占有越来越多的比例,因此,获取网盘资源的分享链接对于网络安全有着重要的意义。提出了一种高效可扩展的基于Cookie的网盘资源溯源方法—Cookie Tracing。该方法通过在海量的HTTP会话中建立Cookie与HTTP会话的索引表来实现网盘资源和下载网盘资源的跳转链的关联,同时通过累计散列算法加快溯源结果的验证。实验结果表明,所提方法具有较好的性能和可扩展性。
- 林海伦李焱王伟平岳银亮林政
- 关键词:COOKIE
- 用户主导的个性化信息服务构造的研究
- 随着网络技术的飞速发展和深入应用,互联网上的信息资源给人们提供了更多的共享资源的机会。然而,人们需求的不确定性和多样性更需要在使用基于互联网的信息服务时以用户为主导的使用方式——使用户能够自主按需利用互联网上丰富的信息资...
- 林海伦
- 关键词:用户主导信息服务最终用户编程
- 文献传递
- 一种跨地域分布数据中心任务调度方法及系统
- 本发明提供了一种跨地域分布数据中心任务调度方法及系统,包括资源管理模块、任务调度模块、任务运行管理模块、任务执行模块和故障恢复模块。资源管理模块:采用心跳信号和集群可用资源表来记录集群运行状态和可用资源情况;任务调度模块...
- 刘建坤林海伦曹小波刘璐孙屹飞
- 文献传递
- 一种面向对话文本的事件抽取方法及系统
- 本发明涉及一种面向对话文本的事件抽取方法及系统,其方法包括:步骤S1:周期性获取对话文本集;步骤S2:对对话文本集进行两次过滤,得到事件相关对话文本集;步骤S3:创建事件模板,在事件相关对话文本集中,根据事件模板,并通过...
- 林海伦刘璐刘建坤周永彬
- 文献传递
- 一种面向开放网页的实体属性抽取方法和系统
- 本发明提供一种面向开放网页的实体属性抽取方法和系统。其中,所述方法包括:提取开放网页的文本,从中获得目标实体的候选文本集合;以及,根据目标实体属性在训练文本集合中出现的频率,选择基于规则的方式或者基于统计的方式从所述候选...
- 程学旗贾岩涛赵泽亚王元卓靳小龙熊锦华李曼玲林海伦许洪波
- 文献传递
- 基于领域知识抽样的深网资源采集方法被引量:2
- 2016年
- 深网资源是指隐藏在HTML表单后端的Web数据库资源,这些资源主要通过表单查询的方式访问。然而,目前的网页采集技术由于采用页面超链接的方式采集资源,所以无法有效覆盖这些资源,为此,该文提出了一种基于领域知识抽样的深网资源采集方法,该方法首先利用开源目录服务创建领域属性集合,接着基于置信度函数对属性进行赋值,然后利用领域属性集合选择查询接口并生成查询接口赋值集合,最后基于贪心选择策略选择置信度最高的查询接口赋值生成查询实例进行深网采集。实验表明,该方法能够有效地实现深网资源的采集。
- 林海伦熊锦华王博程学旗
- 关键词:深网置信度领域知识
- 融合页面结构与内容的在线百科实体标注方法被引量:2
- 2015年
- 在线百科实体标注目的是标注出属于特定类别(如人名、地名、机构名等)的实体。百科实体标注对大量的应用,诸如实体消歧、实体关系挖掘、知识库构建都很重要。百科实体特征可以分为结构特征(属性框、标题、类别等)和内容特征(页面正文)。现有的标注方法大多只考虑一种特征或者一种分类器,导致F1值较低,无法充分发挥两种特征的优势。因此,提出了融合页面结构特征和内容特征的在线百科实体标注方法。该方法考虑了两种特征对标注结果的影响,分别构造分类器,并且对结果进行线性组合,能够更准确地实现百科实体的实体标注。实验表明,该方法在实体标注中F1值较其他对比实验方法均有所提高。
- 李晓静林海伦贾岩涛王元卓程学旗
- 面向领域的暗网资源采集方法和系统
- 本发明提供了一种面向领域的暗网资源采集方法。该方法从抓取的页面中识别与指定领域相关的页面,获取有效表单集合;对于有效表单集合中的每个表单,判断其表单类型并按照不同的表单类型构造有效查询,所述表单类型为单输入项的表单或多输...
- 熊锦华林海伦程学旗张永超廖华明
- 文献传递
- 基于卷积神经网络和用户信息的微博话题追踪模型被引量:6
- 2017年
- 为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-User TTM分别获得较高的微博话题追踪准确率.
- 付鹏林政袁凤程林海伦王伟平孟丹
- 关键词:卷积神经网络
- 面向在线百科的知识库自动更新方法及系统
- 本发明提供一种面向在线百科的知识库自动更新的方法,该方法实时监控知识库的知识语料来源,根据知识语料更新时间和知识语料内容变化,获取新增的知识语料与内容改变的知识语料;从所获取的知识语料识别知识的变化,以及将基于所识别的知...
- 程学旗王元卓林海伦贾岩涛熊锦华许洪波冯凯