桂婕 作品数:42 被引量:133 H指数:6 供职机构: 中国科学技术信息研究所 更多>> 发文基金: 中国科学技术信息研究所预研基金项目 国家自然科学基金 国家科技支撑计划 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 政治法律 更多>>
欧洲专利局OPS服务专利法律状态数据结构分析 被引量:1 2021年 对专利法律状态数据结构的解析是进行专利法律状态数据加工的基础。本文以欧洲专利局(EPO)开放专利服务(OPS)提供的专利法律状态XML数据为研究对象,介绍了OPS专利法律状态数据获取的方法以及当前使用的法律状态数据格式,解析了XML数据结构,并分析了重点数据元素,为EPO OPS法律状态数据加工提供参考。 雷孝平 张静 桂婕 陈亮关键词:法律状态 社会网络分析的岛屿方法及其应用 2016年 [目的/意义]岛屿方法可以将一个网络或巨组元分为较小的组元,为了解具有一定特征的子网络或群体行为提供了一种简便有效的途径。[方法/过程]介绍了岛屿分析方法的基本工作原理和流程,通过科学合作网络和信用卡交易网络两个应用实例的介绍和讨论,对岛屿方法的特点进行了总结。[结果/结论]岛屿分析方法适合于节点或边上数值属性具有非单一取值的网络,既适合于普通网络,也适合于多模网络,既可应用于连通网络,也可应用于不连通网络,具有一定的灵活性,通过设置不同的海平面参数可获得具有不同特征的组元,然后对获得的组元进行分析,便可以深入了解网络结构和群体特征。[局限]岛屿方法适合于有值网络,但对节点或边不存在数值属性的网络无效。 韩红旗 付媛 桂婕 汪雪锋 王志楠 杜云生关键词:社会网络分析 科学数据引用:前提、挑战与实现机制 2023年 [目的/意义]研究科学数据引用的重要前提、现实挑战与实现机制,对于在科研活动中推广科学数据引用、保护科学数据知识产权具有重要意义。[方法/过程]基于全生命周期管理、利益相关者分析等理论,分析科学数据引用的发生条件、影响因素等,开展对比与差距分析,提出相关工作建议。[结果/结论]科学数据引用要求把科学数据作为重要产出,并记录其在科研过程中利用情况。当前科学数据引用实施中存在引用不清晰、溯源不稳定、关联不准确、追踪不便捷等问题,科学数据引用实现依赖于各利益相关者协同推进政策体系、著录标准、技术基础设施建设,当前我国需重点推广引用标准、探索科学数据评价、强化基础设施建设。 桂婕 杨波 屈宝强 刘蔚 陈晓文关键词:科学数据 著录标准 面向深度分析的领域专利信息特色资源服务平台建设 被引量:3 2010年 专利信息是集技术、经济、法律信息于一体的重要情报分析数据来源,也是支持技术创新管理的重要决策依据。但目前,面向科技领域专利深度分析过程中存在着信息整合程度低、深层信息揭示力度小、先进IT技术方法应用不足而不能快速响应决策支持等问题。基于此,文章提出了以重点科技领域战略研究为服务目标、建设面向深度分析的领域专利信息特色资源服务平台的研究思路,并介绍了该平台实现的流程与方法。 桂婕 乔晓东 朱札军 张兆锋 李鹏关键词:专利信息 对象推荐方法、装置、电子设备和存储介质 本申请实施例提供了一种对象推荐方法、装置、电子设备和存储介质,涉及科技管理技术领域。该方法包括:对于至少一个对象中每个对象,对对象的至少一种信息类别的原始信息进行标准化处理,获得对象的至少一个元数据;根据预设方式从至少一... 牟琳 夏春姊 桂婕 郝梦从专利深度分析工具和技术平台研发到相关系统的国际测评NTCIR 2010年 创新是先进国家发达历程的见证,也是落后国家欲跻身于先进国家行列的可靠途径。目前,我国的主旋律就是自主创新,从国家政策制定,到企业的发展,创新无处不在。 乔晓东 桂婕 李颖关键词:测评 自主创新 条件随机场与规则集成的专利摘要信息抽取 被引量:3 2010年 专利是一种重要的情报分析数据来源,由于专利使用的术语比论文更为抽象等原因,基于统计的信息抽取效果并不理想。文章利用文档结构的特点以及专利写作过程中的常用特色词汇,在利用条件随机场这种概率模型的基础上,提出了集成基于规则的专利摘要信息抽取方法。系统参加亚洲语言信息检索测评会议专利挖掘之技术趋势图谱子任务,取得较好的成绩,证实其系统的实用性与高效性。 李鹏 桂婕 乔晓东 张兆锋关键词:信息抽取 条件随机场 基于条件随机场的专利摘要信息抽取研究 被引量:3 2010年 专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。 黄绍杉 乔晓东 桂婕 李鹏关键词:信息抽取 条件随机场 自组织映射在专利文本聚类中的应用研究 被引量:8 2010年 自组织映射(SOM)是一种基于人工神经网络的聚类方法,通过将相似的输入数据映射到相同或者相近神经元达到相似相聚的目的,有着不需要先验知识、保持拓扑结构不变、无监督自我学习和易于可视化的优点。由于专利文献有着数量大、文字晦涩冗长、专业性强等特点,分析难度较大,自动聚类分析能挖掘专利文献内在相似性,作为基础性处理用于后期应用,例如专利数据清洗、专利检索、主题分析和专利地图生成等众多领域。基于SOM的专利文本聚类与传统聚类方法相比效率和准确率较高,并且易于可视化展示。本文使用了SOM、k-means和TwoStep算法分别在专利文本聚类中作了对比,得出SOM较优的结论。 曲军伟 乔晓东 桂婕关键词:自组织映射 文本挖掘 可视化 专利引证分析工具的设计与实现 被引量:4 2010年 专利引证分析在专利分析中的作用越来越大。文章介绍了一个专利引证分析工具的设计与实现,包括数据的获取、清洗、转换和生成图形,并进行了简单的应用分析。同时,介绍了一个开源的可视化工具包Prefuse,希望对想通过用可视化手段进行文献分析的研究人员提供有益的启示。 张兆锋 桂婕 乔晓东 朱礼军 李鹏关键词:信息可视化 数据挖掘