钱卫宁
- 作品数:106 被引量:869H指数:12
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术经济管理文化科学政治法律更多>>
- 一种社交媒体中热点微博数据的自适应取样方法
- 本发明公开了一种社交媒体中热点微博数据的自适应取样方法,包括如下步骤:初步取样步骤:自动与社交媒体的数据接口建立通信,从社交媒体中获取一条以上微博数据;热点检测步骤:检测微博数据的属性,若微博转发量大于500次,则微博数...
- 李叶章群燕夏帆钱卫宁周傲英
- 文献传递
- 可扩展事务处理系统研究问题与进展
- 本文分析了可扩展事务处理系统研究问题与进展。具体分析了事务处理问题、互联网环境下的事务处理需求、可扩展数据管理系统架构、可扩展事务处理研究问题。
- 钱卫宁
- 关键词:系统架构数据管理
- 一种基于自然语言处理的古文标点符号修复方法
- 本发明公开了一种基于自然语言处理的古文标点符号修复方法,该方法包括:获取古籍中的文本数据并进行基础的数据清洗;根据古籍的内容分为不同的藏部体系分类;对文本进行向量化表示;利用各个分类中已有的存在标点符号的文本作为完成标注...
- 黄煜哲董启文兰韵诗钱卫宁周傲英
- EDOLOIS:高效准确的子空间局部离群点发现
- 1引言越来越多的数据存放在数据库中,这使得利用这些信息并从中高效获取知识成为一种当然的需要。长期以来,人们把注意力都放到了那些识别数据集中大量对象有统一模式的方面。事实上,发现数据
- 周红福钱卫宁魏藜周傲英
- 关键词:OUTLIERSUBSPACEINNER
- 文献传递
- 一个基于对等网络的文本共享与检索系统的设计与实现
- 本文提出了P-Terse(Peer-to-peerTExtRetrievalandSEarch),一个基于对等网络的文本共享与检索系统.与现有的P2P系统相比,P-Terse有如下三个特性:1)是基于内容而非基于文件名的...
- 陈飞波杜蓓钱卫宁周傲英
- 关键词:对等计算对等网络分布式计算文本检索
- 文献传递
- 一种基于三角形统计的图数据压缩方法和查询方法
- 本发明公开了一种基于三角形统计的图数据压缩方法,包括下述步骤:获得一组图数据,筛选其中所有由三个存在相互关联的结点构成的三角形元素,构成三角形元素的集合;在集合中,若两个以上三角形元素之前相互共同具有两个相同的结点,则将...
- 张俍钱卫宁周傲英
- 文献传递
- SQRT:P2P环境下的一种基于贡献的自适应查询路由策略
- 1引言P2P(Peer-to-Peer)是一种分布式计算模式,网络中的节点可以随意地加入或退出,没有统一的全局控制,具有很高的自治性,资源高度共享等特点。在文件的共享与交换、分布式计算,以及分布式数据管理等方面,P2P具...
- 阳德青徐林昊钱卫宁周水庚周傲英
- 关键词:P2P
- 文献传递
- 基于Raft一致性协议的高可用性实现被引量:9
- 2015年
- 随着互联网的快速发展和大数据时代的来临,传统数据库的局限性开始逐渐显现,而支持海量数据存储和高并发访问的分布式数据库系统越来越流行.在此背景下阿里巴巴集团研发了一款适用于海量数据存储的分布式数据库系统(OceanBase),并提供单集群和多集群两种部署模式.但多集群部署模式下的可用性较低,无法满足关键性应用的需求,包括:发生故障时不支持主备集群的自动切换;主备集群之间无法保证日志的强同步.针对上述问题,本文分析了传统数据库的高可用方案,针对OceanBase架构的特点,结合了Raft算法的思想,设计并实现了基于时间戳的分布式选举模块、自动化的集群切换模块和基于QUORUM策略的日志强同步模块.经实验验证,以上模块的实现能够提高系统整体的可用性.
- 张晨东郭进伟刘柏众储佳佳周敏奇钱卫宁
- 关键词:分布式数据库高可用性
- 一种基于LDA和BERT的金融文本机器阅读理解方法
- 本发明公开了一种基于LDA和BERT的金融文本机器阅读理解方法,该方法采用段落召回步骤和机器阅读理解步骤。针对长文本数据的阅读理解,对数据进行合理切分,通过召回模块进行候选段落的召回,并采用多任务学习的方式在机器阅读理解...
- 陈薇羽罗轶凤钱卫宁
- 文献传递
- 一种产生社交媒体时间轴结构数据的方法
- 本发明公开了一种产生社交媒体时间轴结构数据的方法,包括:针对用户在社交媒体中发布和转发的微博信息建立模型;构建由第一缓冲池和第二缓冲池组成的框架,通过模型模拟下一条微博信息的发布时间,将下一条微博信息存入第一缓冲池,从第...
- 于程程夏帆钱卫宁周傲英
- 文献传递