国家社会科学基金(06BTQ024)
- 作品数:18 被引量:68H指数:5
- 相关作者:张帆胡金柱张俊丽李琼俞小娟更多>>
- 相关机构:华中师范大学南京大学湖南省第一师范学校更多>>
- 发文基金:国家社会科学基金湖北省科技攻关计划国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于SHIQ DL关系词语分类研究被引量:1
- 2007年
- 语言学中现有的两分系统和三分系统都不能满足OWL DL描写关系词语间逻辑语义关系的需要,因为它们的逻辑基础和OWL DL的逻辑基础SHIQ DL大相径庭.文中从SHIQ DL构造算子的描写能力出发,以SHIQDL逻辑层次为基础对关系词语进行分类.
- 肖升阳西述
- 关键词:DL描述逻辑
- 基于规则库和聚类分析的复句短语字段的自动识别研究被引量:9
- 2008年
- 复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.
- 胡金柱俞小娟李琼周毕吉
- 关键词:规则库聚类分析
- 改进KNN算法在垃圾邮件过滤中的应用被引量:18
- 2007年
- 提出一种改进的KNN算法,并将其用于垃圾邮件的过滤问题。经实验证明,改进的算法能够降低K值和训练文本的分布对过滤效果的影响,减少垃圾邮件的误判和漏判,具有较好的过滤性能。
- 张俊丽张帆
- 关键词:KNN垃圾邮件过滤文本分类
- 基于网格的国外搜索引擎系统的比较研究被引量:1
- 2007年
- 在详细介绍国外基于网格的搜索引擎系统的研究内容和研究方法的基础上,对这些项目的研究内容和方法进行系统的比较研究,并借鉴国外基于网格的搜索引擎系统的研究成果,对我国今后的研究方向提出建议。
- 张俊丽高劲松张帆
- 关键词:网格技术搜索引擎
- 网络文本信息过滤的意义及其模型初探被引量:10
- 2007年
- 网络文本信息过滤可根据用户的需求,通过过滤机制主动选择所需的信息,有效解决网络信息迷航的问题。文章就网络文本信息过滤的用户建模和用户匹配技术进行了初步探讨,并在阐述信息过滤一般应用模型的基础上提出网络文本信息过滤模型,分析网络文本信息过滤模型的应用特征及其组件,并着重讨论了布尔逻辑模型、概率模型和向量空间模型的基本原理与方法,最后就模型中两大技术应用存在的问题总结并提出了一些改进意见。
- 明均仁张帆
- 关键词:文本过滤向量空间模型用户模型
- 一种基于向量空间模型的信息过滤系统用户建模研究被引量:3
- 2007年
- 文章在分析信息过滤系统及用户模型相关问题的基础上,探讨了基于向量空间模型的信息过滤系统用户建模方法,提出了以系统与用户之间不断交互所形成的一系列用户阶段模型为基础,构建具有相对长期意义用户兴趣模型的方法,并采用实例阐述了所提出的建模方法,说明该法能够在一定程度上准确反映用户兴趣,提高过滤效率。
- 李爱明张帆
- 关键词:用户模型信息过滤系统信息检索系统
- KNN-FCM聚类算法在中文搜索引擎文本过滤中的应用被引量:3
- 2007年
- 目前,大多数搜索引擎都是用相关度或page-rank或HITS(Hyperlink-Induced Topic Search)算法对匹配的结果进行排序,然后以列表的方式呈现给用户。事实表明:其索引质量不高,对所收集的信息缺乏有效的分类处理,用户面对成千上万的搜索结果无法一一查看,而真正符合需要的搜索结果常常因为排在后面而被漏检,返回的结果只有极少部分得到了用户的有效利用。文章提出运用基于K近邻的模糊C均值算法(以下简称KNN-FCM)对搜索引擎的初始结果进行自动聚类,系统再针对用户作出的适时反馈进行相应的输出调整,从而方便用户查找信息。
- 张俊丽张帆
- 关键词:搜索引擎KNN模糊C均值文本过滤
- 智能搜索引擎信息过滤机制研究被引量:5
- 2007年
- 智能搜索引擎是人工智能技术和传统搜索引擎技术相结合的产物。面对信息无时无刻不在进行更替的网络环境,智能搜索引擎具有自然语言过滤智能化、多文档处理智能化、用户服务智能化等信息处理机制。为促进智能搜索引擎发展,应重视用户建模技术研究,加强基于多Agent智能搜索引擎系统的研制与实践,加大智能搜索引擎关键技术研究力度。
- 张帆林建
- 关键词:智能搜索引擎信息过滤自然语言理解人工智能
- 一种基于规则的自动信任协商模型被引量:3
- 2008年
- 自动信任协商中,访问控制策略规范了用户访问资源的行为从而保护敏感信息与资源,当策略本身就包含敏感信息时,则策略的暴露会泄露隐私信息;而对策略的敏感信息再次进行保护时,则增加了协商复杂性。针对策略保护的矛盾,提出一种基于规则的自动信任协商模型——RBAM。对策略进行分解,将非敏感策略与域约束归为一类,并使用Agent技术来协商双方的交互,从而达到降低协商复杂度、提高协商效率的目的。
- 汪应龙胡金柱
- 关键词:自动信任协商授权
- 现代汉语复句中短语字段的自动识别初探被引量:1
- 2007年
- 为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行短语字段的自动识别工作。目的是把这些字段排除在分句层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,首先通过编写的程序把所有不含动词的字段暂时统一识别为短语字段。对于虽包含动词但前后有明显形式标志的字段则通过制定相应的规则来识别。还有一部分字段只包含一个动词,但前后却没有明显的形式标志,对此,需要利用字段中的结构助词"的"来帮助识别。
- 李琼胡金柱俞小娟