赵钦
- 作品数:5 被引量:25H指数:3
- 供职机构:北京工业大学更多>>
- 相关领域:自动化与计算机技术更多>>
- 并行爬行器的架构与优化策略
- 本文对并行爬行器的架构与优化策略进行了研究。文章的研究内容主要包括:分析并行爬行器现有的实现技术,包括系统框架,任务分配算法,系统内部通信方式和协作方式。以主从结构为基本模型,阐述了基于NFS的并行爬行器系统架构,协作机...
- 赵钦
- 关键词:网络搜索搜索引擎
- 文献传递
- WebSifter:个性化网络搜索辅助系统被引量:9
- 2005年
- 传统信息检索技术不能很好地满足不同兴趣、不同背景和不同时期用户的查询请求。个性化网络搜索辅助系统W ebS ifter通过提取用户相关信息对网络搜索结果进行综合、过滤和排序来克服这个问题。系统包括信息采集、行为分析、兴趣集生成、结果生成等模块;利用显性和隐性相结合的方法采集用户兴趣,用线性回归模型分析用户行为;提出了用户兴趣集的多级资源描述模型。它能够动态地抽取用户行为与用户兴趣的关系,并且通过多级资源描述有效地利用用户过去和当前的兴趣来处理搜索结果。
- 蒋宗礼肖华赵钦
- 关键词:网络搜索个性化
- WebSifter:个性化网络搜索辅助系统
- 传统信息检索技术不能很好地满足不同兴趣、不同背景和不同时期用户的查询请求.个性化网络搜索辅助系统WebSifter通过提取用户相关信息对网络搜索结果进行综合、过滤和排序来克服这个问题.系统包括信息采集、行为分析、兴趣集生...
- 蒋宗礼肖华赵钦
- 关键词:网络搜索个性化知识获取用户兴趣模型信息检索
- 文献传递
- Linux环境下的日志分析系统LASL被引量:4
- 2005年
- 日志文件是计算机系统运行轨迹的写照,是入侵检测分析中重要的数据来源.日志分析主要用于入侵事件后采取相应的应急响应措施,最大可能地减少入侵造成的损失.LASL把传统的日志分析技术和移动Agent技术相结合,实现了Linux环境下的主机日志分析系统,具有智能化、自动化和分布式的特点.
- 王全民王蕊赵钦
- 关键词:日志LINUX移动代理
- 高性能并行爬行器被引量:11
- 2006年
- 爬行器是搜索引擎的重要组成部分,它在搜索引擎中负责网络信息采集。详细介绍了Chao,一个高性能并行爬行器的设计和实现,包括它的系统框架、主要模块、运行流程、调度算法和URL检索算法。Chao的调度算法采用两次散列计算,不仅实现了负载平衡,而且在一定程度上避免了冲突;URL检索融合了树查找算法,在实现了快速检索的同时减少了存储空间需求。
- 蒋宗礼赵钦肖华王蕊
- 关键词:搜索引擎信息采集爬行器