夏诏杰 作品数:23 被引量:37 H指数:4 供职机构: 中国科学院过程工程研究所 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 化学工程 环境科学与工程 更多>>
面向化学领域网络资源的文本自动分类算法 为了提高化学主题搜索引擎的查询效果,采用距离加权k-近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的... 梁春燕 夏诏杰 郭力关键词:文本自动分类 文献传递 虚拟过程工程数据管理系统的设计与实现 2013年 为实现对工业装置内流体流动与传递过程的三维实时高精度模拟,中国科学院过程工程研究所提出了虚拟过程工程(VPE)的构想。为存储和管理在VPE实验过程中产生的海量实时实验数据和模拟数据,本文对VPE的数据管理系统进行了需求分析和功能设计,所实现的数据管理系统包含海量数据存储、底层通信协议、数据实时交互与数据管理工具等部分。该系统目前运行良好,为VPE 1.0提供了可靠的功能支撑。 李周洲 郭力 夏诏杰 赵明坤关键词:数据管理系统 化学主题网络爬虫的设计和实现 被引量:10 2006年 由于通用搜索引擎检索返回的结果过多、主题相关性不强以及随着人们对提供的各项信息服务的要求越来越高,基于整个Web的信息采集越来越力不从心。同时它无法及时地采集到足够的最新的Web信息,也不能满足人们日益增长的个性化需求。本文通过把Internet化学资源导航系统所积累的化学知识与搜索引擎的自动采集技术相结合展开了对化学主题网络爬虫开发的研究。结果表明,基于Widrow-Hoff分类器的化学主题网络爬虫能有效的采集化学相关的网页。 夏诏杰 梁春燕 郭力关键词:主题爬虫 主题搜索引擎 分类器 基于MVVM的ReaxFF MD模拟的化学反应数据系统的建立 2024年 基于反应力场(reactive force field,ReaxFF)的反应分子动力学模拟的结果分析具有挑战性。国际首个ReaxFF MD化学反应分析及可视化工具VARxMD(visulization and analysis of ReaxFF molecular dynamics)可自动生成不同时刻之间完整的化学反应列表,通过物种检索进一步对反应路径进行分类。但VARxMD目前的反应分析针对的是某一确定条件下单一的ReaxFF MD模拟轨迹,利用VARxMD分析获得一次模拟的完整反应列表需要消耗大量计算资源和时间。本文提出基于数据库来储存VARxMD反应分析结果数据,基于数据库检索进一步分析反应的思路,并采用MVVM(model-view-view model)的系统设计模式、结合渐进式框架Vue.js建立了ReaxFF MD模拟的化学反应数据系统ReaxMDDB(reaction database of ReaxFF MD simulation)。系统应用于多个RP-3模型热解和氧化模拟反应数据的结果表明:该系统不仅实现了多个ReaxFF MD模拟的详细反应的统一分析和化学反应的2D分子结构显示,而且可永久保存模拟获得的反应数据集以备后续进一步分析反应机理。ReaxMDDB具有很好的通用性,为认识不同反应模拟所揭示的共性化学反应机理提供了方便的平台。 魏财熠 夏诏杰 李晓霞 李晓霞 任春醒 郑默关键词:化学信息学 化学主题网络爬虫的研究 网络爬虫(Web Crawler)是指通过Web页面之间的链接关系从Web上自动的获取页面信息,并且沿着链接执行不断扩展的程序。随着网络的迅速发展,Web成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战... 夏诏杰 郭力 李晓霞关键词:主题网络爬虫 文本分类 网页分块 文献传递 利用ChemDB Portal检索化学深层网 <正>Internet的普及为专业人员获取数据信息、利用计算工具提供了统一的平台,检索网络化学信息资源的工具也从化学浅层网向化学深层网发展。中国科学院过程工程研究所高性能计算与 李晓霞 袁小龙 夏诏杰 井银铃 聂峰光 唐武成 郭力关键词:化学数据库 搜索引擎 化学信息学 文献传递 面向化学领域网络资源的文本自动分类算法 被引量:1 2004年 为了提高化学主题搜索引擎的查询效果,采用距离加权七一近邻分类算法来进行自动分类.为了测试该算法对化学领域网络资源进行分类的效果,文中使用化学化工资源导航系统ChIN人工积累的资源和描述信息作为数据集,并采用基于化学领域的多层次分类体系进行分类.经测试,系统微平均值Fmicro最高可达到71%.文中还就文档的关键词和数据集的熵对分类性能的影响进行了讨论.结果表明,该算法能较好地应用于化学领域网络资源的自动分类. 梁春燕 夏诏杰 郭力关键词:文本自动分类 Internet化学化工搜索引擎的主题网络爬虫和索引研究 Internet作为信息的主要载体之一,其信息资源几乎涵盖所有学科领域。化学专业领域也不例外,Internet已经逐渐成为人们获取化学信息的主要途径。由于Internet具有节点平等、自由发布的特点,使Internet资... 夏诏杰关键词:主题网络爬虫 倒排索引 主题搜索引擎 用户兴趣模型 网络搜索引擎的性能优化策略和相关技术 被引量:8 2004年 由于检索结果的不准确性,使网络搜索引擎有时难以满足用户的查询需求。因此,在传统搜索引擎技术的基础上,采用其它理论和技术来提高搜索引擎的查准率,可以对搜索引擎进行性能优化。该文提出了几种对网络搜索引擎进行性能优化的策略,并对相关的实现技术进行了探讨。根据网络资源的权威性及其与用户查询的相关性对检索结果进行排序,可以有效提高结果的准确度;通过基于概念的信息检索技术和信息的自动分类技术可以有效地对用户查询进行语义的扩充和理解,更好地满足用户需求;实现搜索引擎的个性化查询和专业化查询,也是提高搜索引擎性能的重要途径。 梁春燕 郭力 夏诏杰 杨章远关键词:信息检索 搜索引擎 用户兴趣模型 基于产排预测的园区固废管理系统设计与应用 被引量:1 2023年 针对现有园区信息化系统缺乏生产调优支撑功能的问题,融合固废产生和利用生产线生产监控、产品质检等多源数据,设计基于产排预测的园区固废信息管理系统。该系统依托机器学习算法,重点突破多源异构固废管理关联数据采集和管理、生产线运行状态和相关固废排放实时预测、生产系统资源环境综合效益分析等技术和方法,实现企业和生产线层面固废动态追踪、预测预警和综合分析功能,为企业和园区固废产排全过程智能管控提供支撑。 石靖靖 陈盛龙 李强 夏诏杰 张文娟