公共文化服务平台

李亚楠: 作品数：15 被引量：71H指数：5; 供职机构：中国科学院计算技术研究所更多>>; 发文基金：国家自然科学基金国家高技术研究发展计划北京市自然科学基金更多>>; 相关领域：自动化与计算机技术文化科学更多>>

合作作者

一种查询交互系统和方法: 本发明公开了一种查询交互系统和方法。该系统包括一实时搜索引擎平台、一互动问答平台和一查询信息处理平台，查询信息处理平台包括一收集模块、一查询信息数据库和一检索模块。收集模块用于读取实时搜索引擎平台用户和互动问答平台用户反...; 李亚楠王斌李锦涛丁凡; 文献传递

网页搜索引擎查询日志的Session划分研究被引量：18: 2009年; 搜索引擎查询日志中的session(以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于session的系统研究工作。本文针对相关研究工作的问题重新统一定义了session的概念并进行探索和比较研究,得出结论:(1)统计语言模型因数据稀疏问题不适合做session划分;(2)利用多种属性的决策树方法可以得到比较理想的结果,以session为单位进行评价,F值达到了78.6%。; 张磊李亚楠王斌李鹏蒋在帆; 关键词：计算机应用中文信息处理网络信息检索查询日志

搜索引擎查询推荐技术综述被引量：30: 2010年; 查询推荐技术,其用于找出与初始查询或关键词相关的其他查询或关键词,被广泛用于搜索引擎和广告检索系统中。作为当今搜索引擎的必备技术之一,查询推荐技术研究正受到越来越多的关注,近几年出现了很多验证查询推荐可用性及改进其算法的研究工作。为此,该文对查询推荐的发展过程、技术方法、评价体系等方面进行了归纳和总结,分析了查询推荐面临的挑战并讨论了现有解决方法及未来研究思路,希望能对相关研究人员有所帮助。; 李亚楠王斌李锦涛; 关键词：计算机应用中文信息处理查询推荐信息检索

文档检索中句法信息的有效利用研究被引量：6: 2008年; 利用词项依存关系来改进词袋模型,一直是文本检索中一个热门话题。已有的定义词项依存的方法中,有两类主要的方法:一类是词汇层次的依存关系,利用统计近邻信息来定义词项依存关系,另一类是句法层次的依存关系,由句法结构来定义词项依存关系。虽然已有的研究表明,相对于词袋模型,利用词项依存关系能够显著地提高检索性能,但这两类词项依存关系却缺乏系统的比较:在利用词项依存关系来改进文档和查询的表达上,如何有效地利用句法信息,哪些句法信息对文本检索比较有效,依然是个有待研究的问题。为此,在文档表达上,比较了利用近邻信息和句法信息定义的词项依存关系的性能;在查询表达上,对利用不同层次的句法信息所定义的词项依存关系的性能进行了比较。为了系统地比较这些词项依存关系对检索性能的影响,在语言模型基础上,以平滑为思路,提出了一个能方便融入这两类词项依存关系的检索模型。在TREC语料上的实验表明,对于文档表达来说,句法关系较统计近邻关系没有明显的差别。在查询表达上,基于名词/专有词短语的部分句法信息较其他的句法信息更加有效。; 丁凡王斌白硕刘宜轩李亚楠; 关键词：计算机应用中文信息处理信息检索句法分析

一个中文搜索引擎的查询日志分析被引量：5: 2008年; 搜索引擎用户日志分析对信息检索学术研究和搜索引擎优化都有重要意义,文章对约20G的新浪爱问搜索引擎(http://iask.com/)日志进行了系统的分析.发现了很多中文搜索的特点,并针对这些现象提出了一些问题.这些内容对于掌握用户搜索行为,完善搜索引擎系统和中文信息检索研究都具有重要的意义.该文为2008年第七期本期话题<用户查询的理解>的文章之一.; 李亚楠王斌; 关键词：信息检索搜索引擎数字图书馆

一种查询交互系统和方法: 本发明公开了一种查询交互系统和方法。该系统包括一实时搜索引擎平台、一互动问答平台和一查询信息处理平台，查询信息处理平台包括一收集模块、一查询信息数据库和一检索模块。收集模块用于读取实时搜索引擎平台用户和互动问答平台用户反...; 李亚楠王斌李锦涛丁凡; 文献传递

中文Web查询研究（英文）: 基于大规模搜索引擎系统——新浪爱问搜索引擎——的查询日志,本文统计分析了中文查询的特点。文中分析了中文查询长度、中文查询关键词词性、查询中汉字和词语的使用分布以及查询频率与查询返回结果数的关系。我们的研究支持以下观点：无...; 李亚楠王斌张森; 关键词：文本挖掘信息检索搜索引擎; 文献传递

基于加权SimRank的中文查询推荐研究被引量：16: 2010年; 查询推荐是搜索引擎系统中的一项重要技术,其通过推荐更合适的查询以提高用户的搜索体验。现有方法能够找到直接通过某种属性关联的相似查询,却忽略了具有间接关联的语义相关查询。该文将用户查询及查询间直接联系建模为查询关系图,并在图结构相似度算法SimRank的基础上提出了加权SimRank(简称WSimRank)用于查询推荐。WSimRank综合考虑了查询关系图的全局信息,因而能挖掘出查询间的间接关联和语义关系。然而,WSimRank复杂度太高而难以实用,该文将WSimRank转换为一个状态层次图的遍历和计算过程,进而采用动态规划、剪枝等策略对其进行优化从而可以实际应用。在大规模真实Web搜索日志上的实验表明,WSimRank在各项评价指标上均优于SimRank和传统查询推荐方法,其MAP指标接近0.9。; 李亚楠许晟王斌; 关键词：计算机应用中文信息处理搜索引擎查询推荐 SIMRANK

一种分类目录自动构建方法及相关系统: 本发明提供一种分类目录自动构建方法，包括：从现有数据中查找与用户提交的查询词有关的概念术语，得到与所述查询词相关的概念术语集合；计算所述概念术语集合中各个概念术语间的相关度；根据所述概念术语间的相关度，对所述概念术语集合...; 李亚楠王斌李锦涛李鹏; 文献传递

给互联网建立索引:基于词关系网络的智能查询推荐被引量：8: 2011年; 搜索引擎用户经常提交意图模糊的查询,从而导致搜索失败.为此,提出一种检索交互方式——智能查询推荐,它可以自动辨别查询是否语义明确,并对模糊查询建立体现其不同语义概念的分类目录,这个目录将帮助用户快速定位到合适查询.为了实现智能查询推荐,提出了一种基于自然语言小世界性质的查询语义识别算法——TECH(term concept hunting).TECH综合利用了物理学领域社区发现知识和计算机领域信息检索技术,给出了一种可扩展的算法框架.实验结果表明,与传统查询推荐方式相比,用户更喜欢智能查询推荐;TECH能够有效地辨识模糊查询的不同语义概念,并统计显著优于3个知名的对比系统.; 李亚楠王斌李锦涛李鹏; 关键词：信息检索查询推荐小世界网络