湖北省自然科学基金(2005ABA238) 作品数:13 被引量:50 H指数:4 相关作者: 谢金晶 张艺濒 李石君 田建伟 洪辉 更多>> 相关机构: 武汉大学 新汶矿业集团职工大学 华中科技大学 更多>> 发文基金: 湖北省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 更多>>
基于语义的中文Deep Web查询接口集成 被引量:14 2008年 现在网上信息正越来越被在线数据库深化,而传统的搜索引擎对此类信息源却没有很好的获取办法,加剧了人们想得到有用知识而搜索结果并不理想的形势。本文针对这种情况,简要论述了中文Deep Web研究工作的必要性及其发展前景,探讨了中文Deep Web技术的关键问题,并基于中文语义,提出了中文Deep Web中的查询接口集成方案。实验表明该方法能使得接口之间属性匹配的正确率达到98%以上。 洪辉 李石君 余伟 田建伟关键词:深网 接口集成 基于覆盖关系的Deep Web数据源排名 Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检... 余伟 李石君 洪辉 田建伟关键词:抽样方法 文献传递 XML查询结构连接顺序选择算法分析与优化 被引量:1 2007年 如今对XML查询的优化是对XML的热点研究方向。其中的结构连接操作是XML数据库查询的主要操作。和关系数据库中的连接运算一样,结构连接顺序的选择是XML数据库查询优化的核心。文中主要通过对XML查询优化中各种选择连接顺序算法的研究,提出了一种优化的算法,在规模较大的XML查询中能够有效缩减搜索空间,提高效率。 张艺濒 谢金晶关键词:XML查询优化 动态规划 基于覆盖关系的Deep Web数据源排名 被引量:5 2007年 Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名. 余伟 李石君 洪辉 田建伟关键词:DEEP WEB 抽样方法 基于粗糙近似的Web事务聚类改进算法 被引量:1 2008年 针对现有Web使用记录挖掘方法发现的知识和规则存在不精确或不完全的问题,提出了一种改进的基于粗糙近似的Web事务聚类算法.该算法首先对原有算法得到的每个类,用关系矩阵找出在这个类中不满足传递性的对象,然后在该对象的集合(类)上用关系矩阵找出在这个类中不满足传递性的对象,再对每个类进行分割,使其满足关系R的传递性,克服了现有算法不满足关系的传递性和在某些情况下得到的结果不准确的缺点. 李石君 张瑞 卢哲延 金索哲关键词:WEB使用记录挖掘 粗糙集 聚类 通用安全Linux操作系统设计分析 被引量:2 2007年 操作系统是最底层软件系统,其安全性直接影响并决定了计算机的安全性能。通过对Linux操作系统的现有安全机制的分析,提出其可能存在的安全隐患,并运用访问控制、审计技术、最小权限原则设计出一种通用的安全操作系统模型。通过检验,该模型符合安全操作系统标准,对安全操作系统的设计有指导价值。 张艺濒 谢金晶关键词:操作系统 访问控制 审计 基于非确定有穷自动机的网络入侵容忍系统研究 被引量:4 2007年 入侵容忍技术是继防火墙、存取控制、入侵检测技术之后的网络信息安全技术。当一个网络系统遭受非法入侵后,入侵容忍系统仍能及时自我诊断、恢复和重构,并能为合法用户提供所需的全部或者降级的服务。本文依据非确定性有穷自动机理论,模拟计算机受到攻击时入侵容忍系统的工作过程,为入侵容忍技术的发展提供了一种方法。 张艺濒 谢金晶关键词:入侵容忍 有穷自动机 网络安全 非确定性 基于HTML模式代数的Web信息提取方法 被引量:10 2006年 高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采用在整个训练例子中学习表示各属性提取规则的一致模式集,再由多个模式组成的一致模式集提取数据,适用于提取具有缺省属性、多值属性、属性具有多种不同顺序的表结构网页和层次结构网页,其有效性在原型系统中通过实验得到验证. 李石君 于俊清 欧伟杰关键词:WEB信息提取 WEB挖掘 基于池技术的高效N层Web应用体系研究 2007年 对线程、内存、数据连接等宝贵资源的低效使用已成为B/S体系结构应用软件的主要性能瓶颈。而池技术正是解决这一问题的有效途径。介绍了基于池技术扩展而来的线程池、实例池、连接池的基本原理,阐述了如何将其运用于N层构架体系中相应层,优化整体的系统性能,并对存在的问题提出了改进算法。最后针对现有的池中突发的资源管理调度方法的不足,提出了基于最高效益的调度算法。 谢金晶 张艺濒关键词:线程池 连接池 调度算法 基于贝叶斯公式的最小损失垃圾邮件过滤算法 2006年 为了减少将合法邮件误判为垃圾邮件的误报率及将垃圾邮件误判为合法邮件的漏报率的损失,首先基于现有的文本特征提取评估函数:期望交叉熵及互信息提出一种新的评估函数。利用此函数可提取到更具有代表性的邮件特征向量。在此之上提出一种基于贝叶斯公式可减少损失的垃圾邮件过滤方法。经过仿真测试后,发现基于新评估函数的新方法可有效降低误报率和漏报率。 谢金晶 张艺濒关键词:贝叶斯公式 评估函数 垃圾邮件