您的位置: 专家智库 > >

王继民

作品数:100 被引量:604H指数:15
供职机构:北京大学信息管理系更多>>
发文基金:国家社会科学基金国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术文化科学理学经济管理更多>>

文献类型

  • 77篇期刊文章
  • 11篇会议论文
  • 6篇专利
  • 2篇学位论文
  • 2篇科技成果

领域

  • 41篇自动化与计算...
  • 40篇文化科学
  • 7篇理学
  • 3篇经济管理
  • 3篇天文地球
  • 2篇自然科学总论
  • 1篇建筑科学
  • 1篇环境科学与工...
  • 1篇医药卫生
  • 1篇社会学

主题

  • 18篇搜索
  • 17篇用户
  • 14篇索引
  • 13篇引擎
  • 13篇日志
  • 13篇搜索引擎
  • 11篇图书
  • 11篇图书馆
  • 10篇用户日志
  • 9篇研究论文
  • 9篇数字图
  • 9篇数字图书馆
  • 9篇统计分析
  • 9篇网络
  • 6篇中文
  • 5篇学科
  • 5篇日志挖掘
  • 5篇数据集
  • 4篇研究主题
  • 4篇用户行为

机构

  • 85篇北京大学
  • 12篇兰州大学
  • 5篇中国科学院
  • 5篇国家信息中心
  • 4篇北京外国语大...
  • 3篇北京中医药大...
  • 2篇北方工业大学
  • 1篇对外经济贸易...
  • 1篇中国人民大学
  • 1篇北京系统工程...
  • 1篇工业和信息化...
  • 1篇延世大学
  • 1篇中国科学院大...

作者

  • 98篇王继民
  • 19篇王建冬
  • 11篇郭鑫
  • 10篇孟涛
  • 10篇张鹏
  • 9篇李雷明子
  • 9篇彭波
  • 6篇闫宏飞
  • 4篇王一博
  • 4篇陈翀
  • 4篇罗鹏程
  • 4篇李廉
  • 3篇赵怡然
  • 3篇郑玉凤
  • 3篇赵常煜
  • 2篇令锋
  • 2篇张玉涛
  • 2篇胡波
  • 2篇田飞佳
  • 2篇程建军

传媒

  • 13篇数字图书馆论...
  • 12篇图书情报工作
  • 8篇情报理论与实...
  • 5篇情报学报
  • 4篇情报杂志
  • 4篇兰州大学学报...
  • 4篇现代图书情报...
  • 4篇计算机工程与...
  • 3篇甘肃科学学报
  • 3篇数据分析与知...
  • 2篇北京大学学报...
  • 2篇清华大学学报...
  • 2篇图书情报知识
  • 2篇图书馆论坛
  • 2篇华南理工大学...
  • 2篇第三届全国搜...
  • 1篇现代情报
  • 1篇中国经贸导刊
  • 1篇计算机工程
  • 1篇软件学报

年份

  • 3篇2024
  • 6篇2023
  • 7篇2022
  • 1篇2021
  • 1篇2020
  • 5篇2019
  • 3篇2018
  • 1篇2017
  • 7篇2015
  • 5篇2014
  • 7篇2013
  • 4篇2012
  • 3篇2011
  • 9篇2010
  • 2篇2008
  • 1篇2007
  • 4篇2006
  • 8篇2005
  • 4篇2004
  • 5篇2003
100 条 记 录,以下是 1-10
排序方式:
地球科学数据导航系统建设
孙成权王继民吴新年祝忠明曲建升王正兴张延敏米波
项目研究了国际地球科学数据与信息的元数据标准最新进展,提出了建立和完善我国地球科学元数据标准体系的建议,开发了数据集和数据两个层面上的元数据自动提取和检索系统。建立了可运行的地球科学数据信息导航系统,实现了对地球科学数据...
关键词:
关键词:地球科学数据信息
P-ADIC方法求解DIOPHANTINE方程
1992年
在整系数多元多项式环 Z[x_1…x_v]上很多富有成效的算法如欧氏算法不能使用.对 Z[x_1…x_v]上形如σ(x_1,…x_v)a(x_1…x_v)+τ(x_1…X_v)b(x_1,…x_v)=c(x_1…x_v)的 Diophantine 方程.本文给出了 P-adic 方法求解的符号计算算法并讨论了具体实现过程,同时也得到了解的存在性与唯一性的条件。
王继民李廉
基于深度预训练语言模型的文献学科自动分类研究被引量:25
2020年
为了支撑"一流学科"相关的情报和文献服务,本文探索利用深度预训练语言模型实现文献的教育部一级学科自动分类。通过构建基于BERT和ERNIE的文献学科分类模型,在21个人文社科一级学科近10万条期刊文献数据集上进行实验验证,并与传统机器学习方法 (朴素贝叶斯、支持向量机等)、典型深度学习方法 (卷积神经网络、循环神经网络)进行对比分析。结果显示,基于深度预训练语言模型的方法效果最好,其中ERNIE在测试集上的Top 1和Top 2准确率分别可达到75.56%、89.35%;同时使用标题、关键词和摘要作为输入的分类模型效果最优;一些学科的学科独立性强,分类效果好,如体育学F1值高达0.98;另一些学科间交叉性高,分类效果欠佳,如理论经济学和应用经济学的F1值在0.6左右。此外,本文还对学科交叉融合、模型应用场景、分类效果优化做了进一步的探讨。
罗鹏程罗鹏程王继民
关键词:文本分类
实代数数的代数表达式的符号判定被引量:2
1998年
将符号计算方法与数值计算方法结合起来应用于计算机代数领域,构造了一种判定实代数数的代数表达式的符号的算法,并在计算机数学系统上加以实现.算法的基本思想是对每一个实代数数α定义了一个二元组(I,f(x)),其中I是包含α的区间,f(x)是α所满足的多项式,并将代数数的运算转化为对应的二元组的运算,同时结合多项式的根的最短距离估计式,从而达到对代数数的代数表达式进行符号判定的目的.
程建军王继民李廉
关键词:计算机代数
数据挖掘在健康医疗领域中的应用研究综述被引量:22
2018年
健康医疗领域的数据挖掘与知识服务已成为健康医疗大数据产业发展的核心需求之一,数据挖掘作为知识提取的关键技术近年来受到较多关注。文章首先对数据挖掘常用于健康医疗领域的模型与算法进行了梳理与说明;然后分别综述了该技术在辅助完成医疗任务、合理管理医疗资源、改进健康信息服务三大方面的应用现状,并归纳了每方面涉及到的细分应用领域、算法及代表性论文;此外,数据挖掘技术在健康医疗领域中的应用局限和问题也不容忽视,文章按照数据采集、数据预处理、算法选择和结果评估的顺序对现有研究中提到的不足进行总结;最后,提出了数据来源多样化,电子病历挖掘语义化,与云计算、人工智能等领域共同发展的三个未来研究方向。
王若佳魏思仪赵怡然王继民
关键词:数据挖掘医疗资源健康信息服务
国内云计算研究领域核心作者群知识结构及演化路径分析被引量:7
2013年
基于海量数据可视化分析方法,对云计算的出现背景和发展历史进行计量分析。首先确定一批云计算研究领域核心作者,基于这一作者群近十余年来发表文献的题录数据,构建云计算核心作者群的研究共词网络。引入社群结构抽样算法和G-N聚类算法,对领域研究总体分布情况进行分析。引入概念团队隶属度算法,对重点学科团队研究特色进行比较分析。从时间维度分析云计算核心作者群进入该领域前后研究兴趣点的迁移轨迹,并对国内云计算领域演化发展的基本阶段进行划分。
王建冬刘洋王继民
关键词:云计算
多重集上序的若干性质
1996年
本文研究多重集及其在多重集上序的若干性质,其中包括:并与交的恒等式,线性序及其Well-founded的充要条件。
王继民令锋
关键词:偏序拟序集合论
互联网上FTP文件的分布特征及启示被引量:12
2004年
北京大学网络实验室的“天网”文件搜索引擎是国内自主开发的一个海量(FTP和HTTP)文件搜索引擎系统,它的数据库维护着1千多万的FTP文件与目录信息,索引了国内大部分匿名FTP站点。该文对“天网”的海量FTP文件目录信息的分布特征进行了研究,并分析了其对文件搜索引擎设计以及FTP服务器分类管理等方面的某些重要启示。该文的研究成果将增强人们对互联网上文件分布特征的了解,对于设计和优化一个大规模的文件搜索引擎系统具有积极的指导作用。
陈华王继民韩近强谢欣
关键词:搜索引擎数据挖掘
网页变化与增量搜集技术被引量:34
2006年
互联网络中信息量的快速增长使得增量搜集技术成为网上信息获取的一种有效手段,它可以避免因重复搜集未曾变化的网页而带来的时间和资源上的浪费.网页变化规律的发现和利用是增量搜集技术的一个关键.它用来预测网页的下次变化时间甚至变化程度;在此基础上,增量搜集系统还需要考虑网页的变化频率、变化程度和重要性,选择一种最优的任务调度算法来决定不同网页的搜集频率和相对搜集次序.针对网页变化和增量搜集技术这一主题,对最近几年的研究成果作总结,并介绍最新的研究进展.首先论述对网页变化规律的建模、模型参数估计和估计效率等问题;然后介绍几个著名的增量搜集系统,着重分析它们的任务调度算法;最后,从理论上分析和总结增量搜集系统的最佳任务调度算法及其一个基于启发式策略的近似解,并预测其将来的研究趋势.该工作对增量搜集系统的设计和Web演化规律的研究具有参考意义.
孟涛王继民闫宏飞
关键词:调度策略
中国政府网“一带一路”新闻话题挖掘分析被引量:4
2019年
[目的/意义]探究中国政府网"一带一路"相关新闻的话题内容及热度变化,呈现"一带一路"倡议主题及动态,明确不同时期的倡议重点,为相关研究提供参考。[方法/过程]构建基于LDA模型的新闻话题内容的基本框架,限定2015-2017年"一带一路"相关新闻数据,利用LDA模型进行话题抽取,根据文档与话题的概率分布计算,分析各主题在不同时间段的热度演化。[结果/结论]抽取得出30个细分话题,归纳为政策沟通、设施联通、贸易畅通、资金融通、民心相通、"一带一路"对我国经济的影响和政府工作7大类。其中,政策沟通类在全时间段上热度最高,贸易畅通和"一带一路"对我国经济的影响两类话题紧随其后。"进出口"等细分话题的热度不断上升,"改革与转型"等细分话题的热度则有下降,体现了官方媒体新闻内容及其关注度随时间而变化的特点。
秦玥吴亚平王继民
关键词:LDA模型
共10页<12345678910>
聚类工具0