梁锐
- 作品数:3 被引量:9H指数:2
- 供职机构:电子科技大学信息与软件工程学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金福建省教育厅A类人文社科/科技研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于多层核心集凝聚思想的视频关键帧提取
- 2016年
- 针对当前传统的关键帧提取算法准确度低,视频检索的查全率和查准率不高的问题,提出一种基于多层核心凝聚思想的视频关键帧提取算法。利用K-medoids算法优化多层核心集凝聚算法,用真实数据作为聚类中心的特性,对MULCA算法的凝聚粗化和凝聚细化两个重要过程进行改进,用其替代原粗化过程得到的顶层核心集,设计一种多层核心集凝聚算法(IMULCA),实现顶层核心集的快速准确定位,适当减少凝聚层数,简化算法的计算复杂性。将改进算法应用到视频关键帧提取中,实验结果表明,改进算法相对于原有算法能够更加有效地对视频关键帧进行提取。
- 梁锐朱清新胡娟
- 关键词:关键帧视频检索
- 基于多特征融合的深度视频自然语言描述方法被引量:6
- 2017年
- 针对计算机对视频进行自动标注和描述准确率不高的问题,提出一种基于多特征融合的深度视频自然语言描述的方法。该方法提取视频帧序列的空间特征、运动特征、视频特征,进行特征的融合,使用融合的特征训练基于长短期记忆(LSTM)的自然语言描述模型。通过不同的特征组合训练多个自然语言描述模型,在测试时再进行后期融合,即先选择一个模型获取当前输入的多个可能的输出,再使用其他模型计算当前输出的概率,对这些输出的概率进行加权求和,取概率最高的作为输出。此方法中的特征融合的方法包括前期融合:特征的拼接、不同特征对齐加权求和;后期融合:不同特征模型输出的概率的加权融合,使用前期融合的特征对已生成的LSTM模型进行微调。在标准测试集MSVD上进行实验,结果表明:融合不同类型的特征方法能够获得更高评测分值的提升;相同类型的特征融合的评测结果不会高于单个特征的分值;使用特征对预训练好的模型进行微调的方法效果较差。其中使用前期融合与后期融合相结合的方法生成的视频自然语言描述得到的METEOR评测分值为0.302,比目前查到的最高值高1.34%,表明该方法可以提升视频自动描述的准确性。
- 梁锐朱清新廖淑娇牛新征
- 关键词:视频语义分析视频描述递归神经网络
- 测试代价受限下数据的属性和粒度选择方法被引量:3
- 2018年
- 代价敏感学习中经常考虑测试代价和误分类代价。在实际应用中,一个属性的测试代价常跟属性值的粒度有关,而一个具有多个属性的对象的误分类代价又常受它的属性的总测试代价大小的影响。基于这一点,研究在总测试代价受限的情形下,数据的属性和粒度选择的问题。以最小化数据处理的平均总代价为目标提出了一种方法,该方法能同时选择最优的属性子集和数据粒度。首先建立了该方法的理论模型,再设计了一个高效的算法。实验结果表明,所提算法能有效地进行不同大小的测试代价约束下的属性和粒度选择。
- 廖淑娇朱清新朱清新