赵嫣
- 作品数:6 被引量:10H指数:2
- 供职机构:山东大学更多>>
- 发文基金:高等学校骨干教师资助计划国家科技支撑计划山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 一种计算结构化文档相关度的方法
- 2007年
- 讨论了如何精确计算结构化文档相关度的理论模型和算法.首先分析了基于语义内容的文档相关度和基于文档特征的文档相似度之间的区别,提出利用树同构思想测量文档语义相关性.在计算过程中,通过为结点赋予不同权重反映匹配结点的位置重要性,对于未匹配结点则首次提出利用影响因子针对不同情况做适当区分,最后给出文档相关度计算公式.实验证明,此方法能够很好地区分信息检索中的模糊或者相近的请求及文档.
- 赵嫣马军李森
- 关键词:XML结构相似度
- 基于部分-整体匹配的文档结构相似度计算被引量:2
- 2007年
- 传统的计算数字文档之间的结构相似度(DSS)的方法是基于树的编辑距离或 Fourier 变换.本文提出利用查询问题的结构化描述树 Q 与文档元数据描述树 T 之间的部分-整体匹配求解 DSS.给出用字符串表示有向标记树的方法,并把上述树之间的相似度计算转化为对应 Q 和 T 的字符串表示之间的匹配计算,从而导出高效的DSS 算法.实验表明,对给定的结构化查询,本文算法在查全率和查准率上优于树编辑距离算法.
- 马军陈竹敏赵嫣雷景生
- 关键词:信息检索
- 济宁移动公司渠道酬金管理系统的设计与实现
- 近些年以来济宁移动公司的业务量增大,渠道酬金的工作量也急速增加,原有的系统由于未考虑到济宁移动公司的发展因此在使用起来性能差,功能不完整,工作人员出于半手工操作半网络化操作,整体工作效率下降了很多。济宁移动公司迫切需要开...
- 赵嫣
- 关键词:B/S模式软件设计
- 文献传递
- 一种计算结构化文档相关度的方法
- 讨论了如何精确计算结构化文档相关度的理论模型和算法.首先分析了基于语义内容的文档相关度和基于文档特征的文档相似度之间的区别,提出利用树同构思想测量文档语义相关性.在计算过程中,通过为结点赋予不同权重反映匹配结点的位置重要...
- 赵嫣马军李森
- 关键词:结构相似度语义内容信息检索
- 文献传递
- 信息检索中结构化文档相关度计算方法的研究
- 随着社会信息化进程的不断发展,人类对信息的需求和依赖程度越来越高,如何从海量信息资源中快速有效的获取有用信息,已经成为人们研究的焦点。早期信息检索的对象多为文本数值信息,现在图形、图像、音频、视频等新型媒体信息急剧增加,...
- 赵嫣
- 关键词:信息检索文档相似度
- 文献传递
- 对数字化科技论文的自动分类研究被引量:5
- 2006年
- 针对科技论文具有半结构化的特点,提出利用科技论文的元数据的多层次分类模型.这里元数据包含论文的标题、关键词集合和摘要等信息.实验证明,若只利用元数据,可以取得与传统的基于全文信息分类方法近似的分类精度;若基于领域知识所产生的分类法,先利用元数据进行粗分类,然后再进行全文分类,所得到的分类精度要高于已知最好算法.因元数据的尺寸远远小于论文全文的尺寸,而粗分类后每类的论文数要远远小于全体论文数,故在分类类别数目较多且分类文本分布较为平均的情况下,可极大地缩短分类的时间.
- 李森马军赵嫣雷景生
- 关键词:科技论文文本分类