孙玉伟 作品数:29 被引量:273 H指数:11 供职机构: 山东师范大学图书馆 更多>> 发文基金: 国家社会科学基金 山东省社会科学规划研究项目 黑龙江省哲学社会科学研究规划 更多>> 相关领域: 文化科学 经济管理 自动化与计算机技术 交通运输工程 更多>>
信息行为领域知识基础、研究热点与前沿的可视化分析 被引量:25 2012年 以来自Web of Science数据库(1975~2011年)的以信息行为主题的2520条文献为数据源,借助CitespaceⅡ软件对相关被引文献和主题词等数据进行分析和处理,以知识图谱的方式对信息行为研究的知识基础、研究热点、研究前沿进行分析。发现2个明显的聚类展示出信息行为研究的2个分支领域;2个分支内的经典基础理论和模型很好地展示了信息行为领域研究的知识基础;9个高频关键词表征了信息行为的研究热点;2003年以来的7个突现词和若干个高频关键词表征了信息行为的研究前沿。 孙玉伟关键词:信息行为 知识图谱 不同特征对文本聚类效果的比较研究——以新闻文本为例 被引量:8 2020年 [目的/意义]通过实验分析不同特征提取算法对新闻文本聚类效果的影响。[方法/过程]选取搜狗实验室的搜狐新闻语料库以及澳大利亚广播公司2003-2017年间的新闻标题语料库,对TF-IDF、Word2vec以及Doc2vec三种单一特征,TF-IDF+Word2vec、TF-IDF+Doc2vec、Word2vec+Doc2vec以及TF-IDF+Word2vec+Doc2vec四种组合特征在K-means、凝聚以及DBSCAN算法上分别进行聚类分析,通过Purity以及NMI两个评测指标对聚类效果进行评价。[结果/结论]单类特征中三个特征的聚类质量呈Word2vec> TF-IDF> Doc2vec关系;组合特征中TF-IDF+Word2vec的效果最优。Word2vec在单一特征中的表现最优,其也是不同组合特征间差异的主要因素,特征组合是否可以提升聚类性能需基于多因素进行综合判定。 张旭 孙玉伟 孙玉伟关键词:TF-IDF 文本聚类 聚类分析 社会科学科研人员数据复用行为影响因素研究:MOA框架下的探索 被引量:14 2021年 [目的/意义]探究社会科学科研人员的数据复用行为的影响因素,对图情机构进行科学数据管理和数据服务提供策略参考。[方法/过程]基于MOA理论框架构建数据复用行为影响因素模型,对社会科学领域二手数据使用较为普遍的科研人员进行问卷调查获得样本数据,利用结构方程模型分析验证科研人员数据复用行为的影响因素及其作用路径,并对模型进行了修正。[结果/结论]社会科学领域科研人员的数据复用动机对社会科学科研人员数据复用行为影响最大,其次是机会,再次是能力。动机因素中,科研人员本身的数据需求与感知利益正向影响数据复用行为;机会因素中,二手数据的质量、数据背景信息完备性、数据的可获得性均正向影响数据复用行为;数据素养能力对科研人员数据复用行为也有显著的正向影响。其中,机会因素中的学科风气对数据复用行为的影响不显著。 孙玉伟 孙玉伟 刘超 巩礼男 田梅关键词:社会科学 数据复用 影响因素 管理学科研人员数据复用行为特征探析 被引量:12 2020年 以国内管理学领域为例,探索社会科学科研人员数据复用行为特征,为图情机构科学数据管理和服务提供参考。采用内容分析法,以管理学权威期刊1188篇实证论文为样本,对第一作者信息、数据复用基本情况、数据获取前的评估、数据获取后的处理、数据评估后的使用进行编码,运用描述性统计分析,揭示科研人员数据复用行为的规律特征;利用逻辑回归和卡方检验,探究年龄、性别、资历(职称)对是否数据复用有无显著影响,以及对复用数据类型的选择有无显著影响。在管理学领域,数据复用高度普及且呈上升趋势;数据来源集中于政府及组织提供的数据和商业数据库;数据评估判据排名前两位的是准确性、可得性;数据处理以“筛选”最为常见;数据参考或引用普遍用说明和注释的方式;复用数据类型以量化数据为主,质性数据为辅;年龄对复用数据类型的选择有显著影响,年龄较大的科研人员更倾向于质性数据复用,年龄较小的科研人员更倾向于量化数据复用;年龄、性别、资历(职称)对是否数据复用的影响没有得到验证。 张莹 戚景琳 孙玉伟关键词:社会科学 管理学 科学数据 数据复用 用户信息行为研究的理论基础探源(上) 被引量:20 2011年 用来源于不同学科的相关理论对用户信息行为(UIB)进行阐释,分上下两篇,上篇:基于批判现实主义、本体论和认识论探讨UIB的哲学基础;用知识异常状态、意义建构、认知负荷理论探讨UIB的认知科学基础;用自我效能感、次序效应和从众心理理论探讨UIB的心理学基础;用最小省力法则和布鲁克斯知识方程探讨UIB的图情学基础;下篇:用社会网络、小世界和信息贫困理论探讨UIB的社会学基础;用利用与满足、游戏娱乐、沉默的螺旋理论探讨UIB的传播学基础;用风险回报理论阐述UIB研究的经济学基础;用信息觅食理论阐述UIB的生态学基础。最后得出结论:UIB研究的理论基础主要来源于哲学、认知科学、心理学、社会学、传播学、图情学、经济学、生态学等学科领域,并融合在这些学科的交叉学科领域内与这些学科共同发展。 孙玉伟关键词:用户信息行为 学科融合 数字环境下科学交流模型的分析与评述 被引量:9 2010年 详细介绍数字环境下国外具有代表性的几种科学交流模型,包括Hurd模型、Sφndergaard模型、SCLC模型、arXiv的路径模型。在此基础上,从研究角度、研究内容、研究方法、研究的深度和广度方面对4个模型进行对比分析和客观评述,指出4个模型的不同点和共同之处,最后对数字时代科学交流模型的进展做出展望。 孙玉伟关键词:数字化 基于委托代理理论的科技中介机构激励机制研究 被引量:7 2010年 根据委托代理理论,模型化成果生产方(简称成果方)与科技中介机构(简称中介方)的委托代理关系,通过对模型最优解的分析,得出中介方最优激励机制,并指出中介方激励机制设计应该注意的问题。 孙玉伟关键词:科技中介机构 委托代理模型 激励机制 信息不对称 风险规避 用户信息行为研究的理论基础探源(下) 被引量:14 2011年 用来源于不同学科的相关理论对用户信息行为(UIB)进行阐释,分上下两篇,上篇:基于批判现实主义、本体论和认识论探讨UIB的哲学基础;用知识异常状态、意义建构、认知负荷理论来探讨UIB的认知科学基础;用自我效能感、次序效应和从众心理理论来探讨UIB的心理学基础;用最小省力法则和布鲁克斯知识方程来探讨UIB的图情学基础;下篇:用社会网络、小世界和信息贫困理论来探讨UIB的社会学基础;用利用与满足、游戏娱乐、沉默的螺旋理论来探讨UIB的传播学基础;用风险回报理论来阐述UIB研究的经济学基础;用信息觅食理论来阐述UIB的生态学基础。最后得出结论:UIB研究的理论基础主要来源于哲学、认知科学、心理学、社会学、传播学、图情学、经济学、生态学等学科领域,并融合在这些学科的交叉学科领域内与这些学科共同发展。 孙玉伟关键词:用户信息行为 学科融合 社会科学科研人员数据复用行为研究——以经济学为例 被引量:11 2020年 [目的/意义]以经济学领域为例,探索社会科学科研人员数据复用行为特征和偏好,为图情机构进行科学数据管理和数据服务提供参考。[方法/过程]以2017—2019年发表在经济学领域4种高质量期刊上的1351篇论文为样本,对经济学领域的科研人员年龄和性别、是否复用数据、有无数据标题、数据来源类型、数据获取的障碍、数据评估判据、数据处理方式、数据复用规范程度等进行编码,通过描述性统计分析探索了科研人员在数据选择和利用方面的行为特征和偏好,通过卡方检验探究年龄、性别对数据源选择、数据复用规范程度是否有显著影响,通过Logistic回归探究年龄、性别如何影响数据复用。[结果/结论]经济学领域科研人员数据复用现象较为普遍,主要选择规范的数据库和统计年鉴作为二手数据源;数据缺失、异常和偏误是数据获取的最大障碍;在评判数据时主要考虑数据的完整性、全面性、精准性和适用性;数据处理方式以剔除异常数据最为常见,整体而言,经济学科研人员在文章中呈现的数据复用规范程度有待进一步提高。科研人员的年龄对数据复用与否有显著影响,年龄越大,数据复用的越少;不同年龄段的科研人员数据复用规范程度有显著性差异;科研人员的性别对于数据复用与否以及数据复用规范程度没有显著性差异。 戚景琳 张莹 孙玉伟关键词:社会科学 经济学 数据复用 扎根理论方法论在国内图情领域的应用及其反思 被引量:11 2019年 扎根理论方法论(GTM)作为三大定性研究方法之一,近年来得到图情学者持续上升的关注。文章通过对国内111篇应用GTM的实证研究论文的内容分析,对研究样本的文献回顾方式、数据收集、抽样方法、编码程序、研究贡献形式及其与程序运用之间的关系等进行分析,得出结论:GTM在不同研究情境中呈现出灵活性,但在使用前提和文献回顾方式、抽样方法、核心编码程序及其与其他方法的区别上均存在不同程度的错用、误解,其学派之争是扎根理论应用误解的根源;GTM应用对知识的贡献以"现象描述"和"理论模型"为主,贡献的形式与研究目的、研究情境、GTM程序的运用相关。应纠正当前国内图书情报领域对于GTM的认知偏差,理解GTM的适用性和使用前提,规范研究程序的表述,重视研究证据的呈现、编码过程中概念和范畴的凝练,厘清GTM与其他研究方法的关系,根据研究目的或研究情境灵活选择GTM程序,加强研究结果与相关研究的比较分析,从而得出更具解释力的理论(模型)。 孙玉伟 成颖 张建军关键词:图书情报学