您的位置: 专家智库 > >

李凯

作品数:14 被引量:18H指数:2
供职机构:中国科学院计算机网络信息中心更多>>
发文基金:中国科学院战略性先导科技专项更多>>
相关领域:自动化与计算机技术医药卫生电气工程一般工业技术更多>>

文献类型

  • 10篇期刊文章
  • 2篇会议论文
  • 2篇专利

领域

  • 7篇自动化与计算...
  • 2篇电气工程
  • 2篇医药卫生
  • 1篇经济管理
  • 1篇一般工业技术
  • 1篇文化科学
  • 1篇理学

主题

  • 3篇数据驱动
  • 3篇GM(1,1...
  • 2篇维度
  • 2篇梅毒
  • 2篇结构矩阵
  • 2篇矩阵
  • 2篇基元
  • 2篇GDP预测
  • 2篇材料特征
  • 2篇材料性质
  • 1篇第一性原理
  • 1篇第一性原理计...
  • 1篇疫情
  • 1篇疫情预测
  • 1篇异构
  • 1篇异构问题
  • 1篇语言模型
  • 1篇知识图
  • 1篇知识图谱
  • 1篇数据处理

机构

  • 14篇中国科学院
  • 8篇中国科学院大...
  • 4篇新疆农业大学

作者

  • 14篇李凯
  • 6篇王宗国
  • 6篇王彦棡
  • 4篇陆忠华
  • 4篇王珏
  • 2篇恰汗合孜尔
  • 2篇孟胜
  • 2篇周纯葆
  • 2篇曹荣强
  • 2篇宋健龙
  • 2篇赵旭山
  • 1篇迟学斌
  • 1篇张博尧

传媒

  • 7篇数据与计算发...
  • 1篇数学的实践与...
  • 1篇中国卫生统计
  • 1篇中国科学数据...

年份

  • 3篇2025
  • 1篇2024
  • 1篇2023
  • 1篇2022
  • 3篇2021
  • 1篇2020
  • 4篇2013
14 条 记 录,以下是 1-10
排序方式:
GM(1,1)模型的优化及其在广东省GDP预测中的应用
本文提出了一种基于初始值和背景值同时优化的新GM(1,1)模型,利用广东省年度GDP数据预测作为研究对象,用以验证所提模型的有效性和准确性,通过计算实例验证了该优化模型具有较高的模拟和预测精度.
李凯陆忠华恰汗·合孜尔
文献传递
基于检查点的大模型弹性训练方法研究
2025年
【目的】鉴于大语言模型在训练过程中对计算资源的巨大需求,分布式训练框架的弹性训练方法至关重要,确保模型能够在资源变更时做出弹性调整来保证训练顺利进行。【方法】对于这种迫切需求,本文提出了面向大语言模型的3D并行训练和显存优化弹性训练机制,在深度学习框架Megatron-DeepSpeed中引入了基于检查点技术的弹性训练方法,为框架增添了弹性功能。【结果】本文提出的基于检查点的弹性训练方法适配于不同资源配置的模型训练,通过对LLaMA1模型实施3D并行训练和显存优化的弹性策略,设置8组实验比较资源改变后损失值变化、作业完成时间、显存分配占比等实验指标。【结论】实验结果表明资源变化后不同并行度下的模型损失值相近,验证了模型在不同资源配置下的可扩展性,模型在资源紧张情况下能保持模型训练的连续性,模型在资源充足情况下增加计算资源以及并行度能显著提高训练速度和性能。
王子健李凯曹荣强周纯葆
关键词:检查点
材料领域知识图谱构建与应用研究
2025年
【目的】为方便处理大规模非结构化材料科学信息,深入挖掘材料信息数据之间的关系,知识图谱为材料的特性和结构的集成研究提供了技术支持。【方法】本研究提出了一种新的知识图谱构建方式,构建了基于知识图谱的材料知识智能问答及材料知识图谱云平台。知识智能问答系统通过BERT+CRF构建,图谱云平台基于B/S框架开发。【结果】本研究构建的系统框架可以实现材料的知识问答,并以云平台的形式为用户提供使用入口,并可直观展示材料知识图谱。以III-V族化合物计算数据集为例,构建了III-V族化合物材料知识图谱。【结论】本研究扩展了知识图谱在材料领域的应用,对加快新材料的发现和挖掘材料的潜在信息具有重要意义。
袁扬刘祺霖陈子逸万萌李凯王彦棡王婧王宗国
关键词:知识图谱
Llama2-70b模型的微调技术及其在材料领域的应用研究
2025年
【目的】为降低大语言模型的使用门槛,促进大语言模型在学科领域的应用。本文系统介绍了Llama2-70b模型的微调过程及其在材料领域应用的流程。【方法】本研究利用DeepSpeed框架和无机材料合成路径的指令式数据集,采用LoRA微调技术对开源大模型Llama2-70b进行微调,并对模型的超参数进行了调优,从模型训练中的损失值和模型稳定性两个方面对调优效果进行了评估,最终确定了一组适合模型的超参数组合。【结果】通过对模型的训练和优化,最终获得了一个在稳定性和性能方面表现优异的材料合成大语言模型。【结论】该研究为大语言模型在学科领域的应用提供了宝贵的经验和方法,所训练的材料大语言模型为材料合成设计提供了有意义的参考和支持。
唐雷陈子逸梁锶翰李凯万萌张博尧刘淼孟胜王彦棡周纯葆周纯葆
组合预测模型在梅毒流行病预测中的应用被引量:7
2013年
目的对我国梅毒流行病进行发病率的预测。方法对我国2003-2009年梅毒疫情的年发病率数据建立几个预测模型,并分别预测我国2010-2011年梅毒疫情的年发病率。结果组合预测模型预测结果比单个模型预测结果的精度要高。结论组合预测模型可以提高预测精度,能够较准确地预测我国梅毒流行病疫情的年发病率情况。
李凯陆忠华恰汗合孜尔
关键词:组合预测梅毒
一种数据驱动的人工智能材料预测系统
本发明实施例提供了一种数据驱动的人工智能材料预测系统,所述系统至少包括:用户交户层,配置为根据用户选择,确认通过构建新的材料预测模型,或使用已有材料预测模型,进行材料性质预测;以及,接受用户输入的材料特征量;自动特征层,...
赵旭山王宗国王珏王彦棡万萌宋健龙李凯李杨
文献传递
数据驱动的材料智能设计平台研究与应用被引量:1
2023年
【目的】新科研范式下,基于大数据的人工智能技术为加速新材料设计与发现提供了新的方法与视角,为材料领域研究人员提供了一个可用的材料智能设计平台,对于新材料的发现与性能优化具有重要意义。【方法】本文提出一种基于数据驱动的材料智能设计平台的整体架构,阐述应用平台开展新材料设计和优化的关键技术及相关工具,并给出该平台在材料领域的应用案例。【结果】材料智能设计平台及其应用加快了新材料设计与性能优化的进程,同时也为科研人员提供了一种交互式、插件式的开发环境。【局限】材料领域数据的多源异构、样本小、含噪声且数据关系复杂等特点给模型训练效果产生一定的影响,未来希望在数据规范和小样本训练方面进行更多探索。【结论】本文所提出的材料设计平台为材料领域实现科研范式变革提供了理论依据和示范作用。
王宗国万萌陈子逸李凯李凯刘淼孟胜孟胜
关键词:数据驱动科研范式
基于单元素掺杂的TiO2光催化材料数据库
2021年
TiO2作为最重要的光催化材料之一,由于其禁带宽度仅能吸收太阳光的紫外光部分,导致TiO2光催化剂的催化效率较低。通过掺杂来调控TiO2的禁带宽度是提高TiO2光催化效率的主要途径。目前已有不同的研究对单个元素掺杂TiO2的机理进行探索,但是从零散的数据中很难发现系统的规律,因此建立一个包含全元素周期表的掺杂数据库对于进一步的研究非常重要。本研究基于高通量计算和筛选技术,建立了全自动的工作流和数据采集系统,构建了包含上百个结构及其对应的磁性、电子结构、热力学以及介电性质的数据库,从参数收敛、计算结果收敛两个方面进行数据质量控制。本数据库包含了计算原始数据文件和部分抽取的数据,对于开展基于TiO2光催化材料的研究具有良好的数据支撑作用。
王宗国郭令举万萌李凯李凯郭佳龙
关键词:光催化材料数据库第一性原理计算
联邦学习全局模型和个性化模型的现状与展望被引量:1
2024年
【目的】联邦学习是目前的研究热点,本文从模型架构角度出发综述近年来联邦学习方法的研究和进展。【文献范围】本文采用关键词检索和引文二次检索的方法从国际计算机类期刊、会议中收集论文。【方法】在简单讨论联邦学习的定义、架构以及三种异质性问题的基础上,从模型架构角度出发,将联邦学习算法分为学习全局模型和学习个性化模型两大类,进一步讨论两大类别中的联邦学习方法所用数据集、对异构问题的解决以及方法优缺点。【结果】现有的联邦学习方法,可以学习泛化性能强大的全局模型,也可以学习个性化的局部模型。目前研究人员对数据异构问题的关注多于设备异构问题,在测试时所用数据集通常为常规机器学习数据集。【结论】联邦学习领域发展迅速,但仍存在异构问题研究不足、基准测试不成熟的问题,相信未来会有更多在真实场景中针对联邦异构问题的解决方案。
修涵文李贺曹荣强万萌李凯李凯
关键词:异构问题
基于分时LSTM的光伏发电功率预测被引量:2
2021年
【目的】准确的预测光伏发电功率对电网调度具有十分重要的意义。【方法】光伏发电是一个连续不断的过程,光伏发电功率每时刻的变化取决于当前时刻和历史时刻的气象特征。本文考虑光伏发电的时间相关性,提出了基于分时长短期记忆神经网络(Long Short-Term Memory,LSTM)的光伏发电功率预测模型,利用Pearson相关系数对光伏发电功率的时序特征以及气象特征进行研究,选择与光伏发电功率高度相关的历史气象特征作为光伏发电功率预测模型的输入。【结果】对真实光伏电站进行案例分析,基于分时LSTM的光伏发电功率预测可以有效提高光伏发电功率预测精度,并适应光伏时序数据时间不对齐的特点。【结论】本文所提出的模型与传统LSTM模型相比具有更低的预测误差。
许可王珏姚铁锤李凯
共2页<12>
聚类工具0