胡国超
- 作品数:6 被引量:21H指数:3
- 供职机构:华北计算技术研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于图形数据结构的复杂对象建模设计被引量:14
- 2015年
- 随着数据的爆炸式增长,给用户来带来越来越多的信息挖掘资源的同时,也给对象信息的查询带来了困扰。对于复杂的对象,往往拥有着庞大的子表,复杂对象信息的查询效率面临着相当大的挑战。针对该情况,本文设计了一种基于图形数据存储系统的规范约束,用来对复杂对象进行建模,用以增强复杂对象模型的表述能力;同时,在此基础上结合高效图论算法,避免了关系数据库中庞大的表连接过程,使复杂对象的信息查询效率得到了极大的提高。
- 卢超黄蔚胡国超
- 关键词:数据建模
- 弱监督军事实体关系识别被引量:3
- 2018年
- 目前的实体关系识别方法,无法充分利用海量未标注军事文本中的潜在信息,并且在实体关系特征词提取方面并不完善。于是本文对实体关系描述词的特点进行了分析,提出了一种语义层面的弱监督军事实体关系识别技术。本方法采取Word2vec模型和FPGrowth算法对海量未标注军事文本进行分析,从关联分析角度进行实体关系描述词提取,从语义相似角度进行关系词扩充,并提出一种浅层关系分类矩阵对实体关系进行分类。该方法在对1000篇军事文本测试中,取得了加权平均值F-Score为89.2%的效果。
- 李煜甫黄蔚胡国超
- 关键词:BOOTSTRAPPING
- 基于LDA模型和AP聚类的主题事件抽取技术被引量:1
- 2017年
- 目前,事件抽取技术一般是对文本的事件信息进行直接抽取,忽略了文本的信息结构,并且抽取结果易受文本词语分布的影响。本文对文本的概念层级结构进行分析,并提出一种基于二次聚类并再划分的主题事件抽取方法。该方法可以提取文本的主题-事件层次化信息,并通过信息词的二次提取减小相关事件信息的干扰,优化抽取结果,并利用事件时间轴展示出事件的发展状态信息。实验结果表明本方法可以有效地提取文本的主题事件信息。
- 张建恒黄蔚胡国超
- 基于OPTICS聚类和关联分析的轨迹伴随模式分析被引量:3
- 2017年
- 目前,主流的轨迹伴随模式挖掘方法大多是对连续短时间内轨迹的一次挖掘,忽略了前后非连续时间上的关联分析,因此对隐含伴随模式的挖掘不准确。本文对轨迹伴随模式进行了分析,并提出一种结合密度聚类和关联分析的伴随模式分析方法。该方法首先挖掘轨迹数据中的局部模式簇,通过非连续时间片局部模式簇的关联分析,优化挖掘结果。实验结果表明本文方法可以有效地挖掘轨迹中的伴随模式。
- 胡文博黄蔚胡国超
- 关键词:密度聚类
- 基于改进随机森林的洗钱交易角色识别应用
- 2018年
- 对于识别洗钱交易中钱庄账户的方法、现有公安办案方法与现有研究基于机器预警方法存在准确度低且滞后的问题,本文分析洗钱犯罪集团中钱庄与客户的交易行为特点,从主体背景属性、交易统计量、交易网络、交易行为离群4种角度提取一系列特征进行刻画,并通过随机森林进行特征选择与优化,在已经标注过的数据上进行模型训练与验证,形成一个能够对参与洗钱交易者身份进行自动识别的应用。通过实际数据验证可以发现有严重危害的钱庄经营者。
- 张昊黄蔚胡国超
- 关键词:洗钱交易交易网络中心性
- 基于Rhino引擎的低侵入式JavaScript内置对象扩展方法
- 2014年
- 为了获取由JavaScript脚本生成的网页信息,更好地获取网页深层信息,提出基于低侵入式的Rhino解析引擎改进方法。通过对Rhino引擎解析JavaScript脚本过程进行深入研究分析,得出扩展Rhino引擎的关键环节。在此基础上提出低侵入式的设计方法,对Rhino引擎进行低耦合的扩展改进,从而完善Rhino引擎对客户端JavaScript脚本的解析。通过使用低侵入式的扩展方法,将Rhino引擎的扩展和使用完全分离,使开发人员不用了解Rhino引擎的实现细节,简化扩展开发。设计实验验证了Rhino引擎改进效果。
- 聂琨琳黄蔚胡国超
- 关键词:DOM树