张春菊 作品数:38 被引量:319 H指数:12 供职机构: 合肥工业大学土木与水利工程学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 天文地球 自动化与计算机技术 环境科学与工程 文化科学 更多>>
基于XML Schema的多源地名词典集成方法 被引量:5 2012年 目前,我国已经构建大量不同级别、面向不同应用的地名词典,网络大众化地名服务成为地名词典的必然发展趋势。该文提出一种基于XML Schema的多源异构地名词典集成方法,以XML Schema对地名词典进行数据描述,采用XSLT数据转换方法,运用MapForce软件,快速进行地名词典的数据结构映射,能够有效解决地名词典的跨平台及数据类型不统一问题。 张雪英 朱少楠 张春菊 徐希涛 杜超利关键词:XMLSCHEMA 数据集成 XSLT 中文文本的地理空间关系标注 被引量:22 2012年 为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。 张雪英 张春菊 朱少楠关键词:自然语言 中文文本 标注语料库 面向中文文本的地质语义信息标注与语料库构建 被引量:3 2023年 实现文本中地质信息的结构化抽取、语义解析、可视化表达和知识图谱构建,将为地质大数据的深度挖掘与利用提供有力的数据基础和技术支撑。无论是采用传统统计模型还是深度学习模型,地质信息语义解析均需要已标注的语料库的支持。特别是,地质信息的文本描述具有领域性特征,无法通过通用自然语言语料迁移实现。因此,不同层次的地质信息标注语料库的构建成为地质语义信息解析的关键和基础。文章在分析中文文本中地质语义信息描述语言特点的基础上,从地质实体的时空和属性描述特征出发,清晰表达地质实体的各种语义关系,制定了中文文本的地质语义信息标注体系和标注规范,自主研发了“交互式地质语义信息标注工具”,解决了传统人工标注存在错误率高、重复工作量大等缺点,以矿产资源的中文研究文献和报告为数据源,构建了大规模地质语义信息标注语料库,较为有效地解决了当前相关标准和规模化标准数据匮乏的问题。 张雪英 张春菊 张春菊 刘文聪 叶鹏 鲁艳旭关键词:中文文本 语义关系 中文文本中时间信息解析方法 被引量:17 2014年 探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。 张春菊 张雪英 李明 王曙关键词:中文文本 地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别 暴雨洪涝敏感性影响因子分析及评估--以江西安义县为例 被引量:9 2021年 由于区域地理环境存在差异,洪涝敏感性影响因子的选取主要根据区域地理特征及个人经验确定,缺乏统一的标准、系统的分析和科学的评价。洪涝灾害与影响因子之间是复杂的、多变量的非线性关系,与研究区的地质、地貌、土地覆盖等诸多因素密切相关。针对不同的研究区域,搜集尽可能全面的影响因子并对其进行优化选取是实现洪涝敏感性准确评估的前提和保证。南昌市安义县位于潦河中下游,是洪涝灾害的主要受灾区域。基于遥感影像数据和地理信息系统技术,以安义县为例开展暴雨洪涝敏感性影响因子分析及评估研究。首先,利用成灾前后哨兵一号雷达影像提取安义县2016年6月30日至7月5日暴雨洪涝的淹没范围,选取高程、降水、用地类型、距河流距离、坡度等15个洪涝敏感性影响因子。然后,基于随机森林模型对15个影响因子进行重要性排序,按照排序结果对影响因子逐步精简,并基于神经网络模型对影响因子进行优化选取。最后,基于优化选取后的影响因子,采用神经网络模型进行安义县洪涝敏感性评估,并用实例验证洪涝敏感性评估结果的可靠性。研究结果表明,在精简收敛指数、坡向、剖面曲率、地形位置指数和汇流动力指数5个最不重要的影响因子后,神经网络模型的性能有一定提升;敏感性等级为中等及中等以上区域主要分布在潦河两岸,约占安义县总面积的1/3,近70%的洪涝分布在敏感性中等及中等以上区域,洪涝发生在洪涝敏感性等级为中等及中等以上区域的可能性非常大,洪涝敏感性评估结果与安义县实际情况相符。 吕希希 张春菊 黄建伟 田宇 王小丽关键词:暴雨洪涝 神经网络 基于BiLSTM-CRF的中文地质时间信息抽取 被引量:8 2021年 时间信息贯穿于地质现象和事件产生、发展、消亡的整个过程中,反映了地质现象和事件的状态和演变过程。特别是,地质时间表达通常与成矿内在机制和时空演化规律有关。设计并实现了基于深度学习的通用时间和地质时间信息抽取方法。结合地质矿产文本中时间信息的描述特点,将时间信息划分为通用时间信息与地质时间信息两种类型,并对两种时间信息类型进行细分;基于自主研发的"交互式矿产信息标注软件",采用交叉验证及意见反馈模式构建了地质时间信息语料库;实现了基于双向长短期记忆神经网络-条件随机场(BiLSTM-CRF)的时间信息抽取方法;并与主流的卷积神经网络(CNN)和条件随机场(CRF)模型的抽取结果进行了比较。实验结果表明,基于双向长短期记忆神经网络-条件随机场的时间信息抽取效果最好,对总体时间抽取的F1值达到95.49%,较好地解决了地质文本中时间信息的规范化表达和结构化抽取问题。 刘文聪 张春菊 汪陈 张雪英 张雪英 朱月琴 鲁艳旭关键词:地质时间 条件随机场 基于事件过程建模的台风灾害社交媒体信息聚合与演变特征表达 2024年 台风灾害事件过程具有尺度效应,而高时效性社交媒体中蕴含的丰富台风灾害事件信息可为多尺度认知台风灾害事件过程提供支持。该文首先以对象为构成事件的基本单元,以状态划分作为多尺度度量过程的基础,构建多粒度台风灾害事件过程表达模型;在此基础上提出基于社交媒体的台风灾害事件过程挖掘方法,通过多级语义约束的信息聚合方法,提取特定时空条件下不同的对象状态特征;基于状态在时空上连接形成的状态序列分析不同对象的演变轨迹,从多维度表达事件过程的不同演变特征。最后,以2019年“利奇马”台风灾害事件为例,验证多粒度台风灾害事件过程模型的合理性与信息聚合方法在实际应用中的有效性。 叶鹏 张春菊 刘欣 何鹤鸣关键词:台风灾害 信息聚合 社交媒体 基于网络爬虫的地名数据库维护方法 本发明公开了一种基于网络爬虫的地名数据库维护方法,主要包括两个部分:基于网络爬虫的空间敏感网页获取和网页文本中地名信息解析。具体步骤分为:基于Google搜索引擎服务的空间敏感网页获取;基于空间主题相关度的空间敏感网页过... 张雪英 张春菊 杜超利 朱少楠地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别