马存
- 作品数:3 被引量:5H指数:1
- 供职机构:中国科学院沈阳计算技术研究所更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 电网业务中的海量数据存储技术被引量:1
- 2014年
- 随着电网业务中海量数据的增多,其所采用的集中式数据库或大电网统一数据库的数据存储方式已难以满足电网业务与管理的需要.本文首先着重分析了电网业务中的数据类型与特性,然后在综合考虑国家电网当前旧设备与通信网络结构的基础上,提出了一种适用于电网业务的分布式存储方案,并对其数据访问控制进行了设计;最后,进行了初步验证与对比分析.
- 李培军吕立李喜旺马存于喜清
- 关键词:海量数据分布式存储访问控制
- 改进特征权重的短文本聚类算法被引量:1
- 2018年
- 短文本的研究一直是自然语言处理领域的热门话题,由于短文本特征稀疏、用语口语化严重的特点,它的聚类模型存在维度高、主题聚焦性差、语义信息不明显的问题.针对对上述问题的研究,本文提出了一种改进特征权重的短文本聚类算法.首先,定义多因子权重规则,基于词性和符号情感分析构造综合评估函数,结合词项和文本内容相关度进行特征词选择;接着,使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;最后,利用RWMD算法计算短文本之间的相似度并将其应用K-Means算法中进行聚类.最后在3个测试集上的聚类效果表明,该算法有效提高了短文本聚类的准确率.
- 马存马存郭锐锋高岑
- 关键词:情感分析
- 基于SEDA企业服务总线负载控制被引量:3
- 2013年
- 在基于分阶段事件驱动架构下,把企业服务总线系统按事务逻辑处理功能划分成消息监听、协议解析、消息转换、消息路由、消息发送五个阶段.系统在运行过程中,由中央调度器对各个阶段的负载信息进行收集.本文根据均值方差分析,对各个阶段的线程池大小进行动态调整,使得每个阶段的处理事务能力协调关联起来,从而避免出现由于某个阶段负载过重而影响整个系统的性能.
- 马存马跃廉东本李文博
- 关键词:SOA企业服务总线