李粤
- 作品数:8 被引量:36H指数:3
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学电子电信更多>>
- 泛系方法论与幻方构造被引量:1
- 2000年
- 论述了泛系方法论的精缩影模式及其对求解、建模、算法生成与理论建构的作用 ,同时用泛系方法提出并证明了 :1 递归构造 n阶幻方 (n≥ 5)的方法 ;2 已知m阶幻方和n阶幻方 (m ,n≥ 3) ,求mn阶幻方的公式 ;3 已知m阶幻方 (m ≥ 3) ,构造 2m阶幻方的方法·
- 李粤李立希吴学谋
- 关键词:泛系方法论幻方递归构造
- 一种改进的文本网页分类特征选择方法被引量:20
- 2004年
- 网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针”
- 李粤李星刘辉许静芳
- 关键词:互信息量
- 排序融合算法在校园网搜索引擎中的应用被引量:2
- 2005年
- 网页排序技术是搜索引擎的核心技术之一. 校园网搜索引擎是指以一个校园网内的Web网页为搜索内容的搜索引擎. 由于校园网相对于互联网和内联网的特殊性,各种启发式条件对校园网网页排序优化的影响及排序融合技术在校园网搜索引擎的作用是研究的重点. 实验结果表明各个启发式条件的影响和实验数据集有关,而不同启发式条件组合经过排序融合后所获得的查全率差别很大(2%~48%). 查全率大于35%的启发式条件组合至少包含4个启发式条件,即校园网搜索引擎的排序需要依据数据集综合考虑多个启发式条件的排序结果. 排序融合技术是校园网搜索引擎具有良好的查全率的必要技术之一. 基于排序融合技术的网页排序模块已经应用于清华大学校园网搜索引擎中.
- 李粤安捷李星
- 关键词:搜索引擎马尔可夫链查全率
- 多线程个人信息管理方法
- 多线程个人信息管理方法属于计算机网络技术领域,其特征在于:利用包括“时间戳、超文本链接、注释和选项”的线程来组织和管理个人在特定范畴内的信息,利用包括线程和超文本链接的视图来组织和管理信息个人不同范畴的线程;视图有不同的...
- 李星包丛笑李粤
- 文献传递
- 从搜索引擎看IPv6网络增长被引量:3
- 2002年
- 文章根据“网络指南针”IPv6搜索引擎近一年来积累的IPv6网页数据,概括了全球IPv6站点数量的增长情况,分析了IPv6站点与IPv4站点引用率的差别,最后得出关于IPv6网络增长的一些结论。
- 叶绍志刘辉李粤黄晖李星
- 关键词:站点互联网搜索引擎IPV6网络
- 引文网络的可调优先粘贴模型及其应用
- 李粤
- 关键词:引文网络参数估计
- 文献传递
- 排序融合算法在校园网搜索引擎中的应用
- 网页排序技术是搜索引擎的核心技术之一. 校园网搜索引擎是指以一个校园网内的Web网页为搜索内容的搜索引擎. 由于校园网相对于互联网和内联网的特殊性,各种启发式条件对校园网网页排序优化的影响及排序融合技术在校园网搜索引擎的...
- 李粤安捷李星
- 关键词:搜索引擎马尔可夫链查全率校园网
- 文献传递
- 信息检索中主题式词典的构建方法被引量:6
- 2005年
- 提出了一种基于用户查询日志的主题式词典的构建方法,用于中文信息检索中分词。利用互信息从用户查询日志中提取短语并与通用词典相结合构建主题式词典。该词典能提高信息检索的准确率和效率,并有助于解决未登录词问题。
- 许静芳李星李粤
- 关键词:信息检索中文分词