祝官文
- 作品数:15 被引量:2H指数:1
- 供职机构:哈尔滨工程大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于主题和表单属性的深层网络数据源分类方法被引量:2
- 2013年
- 当前深层网络中蕴含着高质量的海量信息并且其数量不断地增长,由于深层网络具有分布、异构、自治等特点,用户高效、快捷地获取自己感兴趣的信息面临巨大挑战.将深层网络数据源按领域分类是解决这一挑战的基础.本文以对航空订票、图书、汽车和房地产领域的200多个数据源的统计和分析为基础,充分利用主题和表单属性信息,提出了一种新的深层网络数据源分类方法以及改进的查询接口相似性度量方法,实现深层网络数据源的自动分类.本文还提出了一种查询接口标记策略,以降低随机选择初始中心点所产生的影响.实验结果表明该方法具有较高的分类精度.
- 祝官文王念滨王红滨
- 关键词:深层网络
- 基于负载均衡和查询日志的数据空间多维索引方法
- 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和...
- 王红滨王念滨周连科祝官文王瑛琦何鸣宋奎勇
- 文献传递
- 基于语法分析的深层网络查询表单信息获取方法
- 当前深层网络数据库的数量以惊人的速度增长.查询表单是访问深层网络数据的入口,由于深层网络数据库中的数据隐藏在查询表单之后,难以获取其信息,造成大量信息资源的浪费.为集成深层网络数据,向用户查询提供方便,首要问题是理解查询...
- 祝官文王念滨王红滨
- 关键词:深层网络网络数据库
- 文献传递
- 一种用于大数据环境下可支持多格式特性的数据空间检索方法
- 本发明涉及一种用于大数据环境下可支持多格式特性的数据空间检索方法。本发明包括:用户输入查询内容;判断用户查询类型;采用前缀扫描方式读取所建立的多级索引;进行链表合并操作;重写查询;遍历多级索引;将逆序压入栈中;首先弹出栈...
- 周连科王洪滨王念滨祝官文
- 文献传递
- 基于负载均衡和查询日志的数据空间多维索引方法
- 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和...
- 王红滨王念滨周连科祝官文王瑛琦何鸣宋奎勇
- 基于表单特性的深层网络数据源分类方法研究
- 当前,Deep Web中蕴含着高质量的海量信息并且其数量还在不断地增长,由于DeepWeb具有分布、异构、自治等特点,用户高效、快捷地获取自己感兴趣的信息面临巨大挑战。然而,将Deep Web数据源按领域分类是解决这一挑...
- 祝官文
- 关键词:深层网络数据源搜索引擎
- 基于查询意图的数据空间预取方法
- 2016年
- 为在查询前预取用户可能访问的数据,提出了一种利用查询日志的数据空间预取方法。该方法从查询日志中提取意图特征,并采用聚类技术对其进行聚类,识别用户查询意图,并基于该意图预取查询结果。实验结果表明:该方法在预取准确率和查询效率方面均显著优于已有方法。
- 祝官文周连科王念滨刘丹
- 关键词:数据空间查询意图聚类查询日志查询结果查询效率
- 面向数据空间的实体分类方法
- 面向数据空间的实体分类方法,属于自然语言处理领域。演化环境下,存在无法通过假设实体为静止状态,而对实体进行分类的问题。一种面向数据空间的实体分类方法,首先,针对演化的数据空间实体,提出改进的、演化的K‑Means聚类框架...
- 王念滨王红滨周连科祝官文何鸣王瑛琦宋奎勇
- 基于语法分析的深层网络查询表单信息获取方法
- 当前深层网络数据库的数量以惊人的速度增长。查询表单是访问深层网络数据的入口,由于深层网络数据库中的数据隐藏在查询表单之后,难以获取其信息,造成大量信息资源的浪费。为集成深层网络数据,向用户查询提供方便,首要问题是理解查询...
- Zhu Guanwen祝官文Wang Nianbin王念滨Wang Hongbin王红滨
- 关键词:信息提取模式识别语法分析
- 基于上下文感知和复杂语义关联的数据空间建模方法
- 基于上下文感知和复杂语义关联的数据空间建模方法,本发明涉及数据空间建模方法。本发明的目的是为了解决现有方法存在以下缺陷:1)上下文感知性较弱;2)语义关系表达能力弱;3)语义关联推理能力弱。通过以下技术方案实现的:步骤一...
- 王念滨周连科王红滨祝官文宋奎勇何鸣王瑛琦
- 文献传递