梁亚玲
- 作品数:37 被引量:59H指数:5
- 供职机构:华南理工大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金广州市科技计划项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种基于SIP协议的流媒体传输架构方法
- 本发明公开了一种基于SIP协议的流媒体传输架构方法,包括点对点传输与点对多点传输,还包括openH264编码、Packsize、payload、RIP编码、UDP编码等,点对点传输时,发送者的摄像头图像数据经过openH...
- 杨民杰杜明辉梁亚玲
- 文献传递
- 一种基于混合云的可靠应用分配分布式遗传方法
- 本发明公开了一种基于混合云的可靠应用分配分布式遗传方法,包括下列步骤:S1、构建优化模型;S2、定义约束条件;S3、定义目标函数;S4、定义染色体;S5、构建分布式池模型;S6、编码;S7、判断应用程序放置的数量或迭代次...
- 涂成栋梁亚玲杜明辉
- 文献传递
- 基于角度特征的分类网络
- 2020年
- 卷积神经网络(Convolutional Neural Networks,CNN)在图像分类任务中的卓越表现,使得其被广泛应用于计算机视觉的各个领域。图像分类模型精度与效率的提升,除了归功于网络结构的改变外,还有很大一部分原因来自于归一化技术以及分类损失函数的改进。在人脸识别任务中,随着精度的不断提升,分类损失函数从Softmax Loss到Triplet Loss,又从L-Softmax Loss到Arcface Loss,度量方式从几何度量发展到角度度量。度量方式的改变实际上是特征形式的变化,即特征形式从一般特征转变为角度特征。在Mnist数据集上,使用角度度量损失函数训练得到的特征点呈角度分布,同时准确率比几何度量高;将角度度量方式用更直接的角度特征来表示,训练得到的同类特征点呈直线分布,准确度也比一般角度度量更高。这不禁令人思考,在CNN分类模型中是否可以使用角度特征来代替一般特征。在CNN分类模型中,其主要架构往往由多个卷积层和一个或多个全连接层组成,通过统一卷积层与全连接层的归一化操作,得到角度卷积层与角度全连接层。在普通分类网络的基础上,用角度卷积层替换卷积层,用角度全连接层替换全连接层,可以得到一个由角度特征组成的角度分类网络。在Cifar-100数据集上,基于ResNet-32构造的角度分类网络相比原分类网络,分类准确率提高了2%,从而论证了角度特征在分类网络中的有效性。
- 王立华杜明辉梁亚玲
- 关键词:图像分类卷积神经网络归一化损失函数
- 感兴趣区域图像编码和子带预测编码的研究
- 随着互联网和多媒体业务日新月异的发展,图像编码技术也在不断发展.新的图像编码标准JPEG2000提供了非常丰富的功能,其中感兴趣区域图像编码ROI(region of interest coding)是该标准的一个亮点,...
- 梁亚玲
- 关键词:JPEG2000感兴趣区域SPIHTEBCOT图像编码
- 文献传递
- 一种图像恢复方法、系统、装置和存储介质
- 本发明公开了一种图像恢复方法、系统、装置和存储介质,其中方法包括:获取低照度图像对,根据所述低照度图像对挑选训练集;采用所述训练集对图像恢复模型进行训练;获取需要恢复的低照度图片,将所述低照度图片输入训练后的所述图像恢复...
- 陈子龙黎小茗梁亚玲杜明辉
- 一种深度学习全局优化方法、识别方法、装置及介质
- 本发明公开了一种深度学习全局优化方法、识别方法、装置及介质,其中优化方法包括:获取训练数据集;获取用于深度学习的训练批次,并更新特征向量;根据更新后的记忆集特征向量、未更新的记忆集标签来更新记忆集标签;筛选记忆集中对模型...
- 刘翼飞梁亚玲陈子恒
- 基于Lab色度空间a分量的唇部提取方法被引量:5
- 2011年
- 唇部提取是唇读系统和基于唇部的身份识别系统中的重要预处理过程,提取效果直接影响系统性能,现有的唇部提取方法对被提取人肤色有一定依赖性,且对带胡须和露齿图像的唇部提取效果较差。针对该问题,通过对常用色度空间各分量的可分离性进行研究,提出基于Lab色度空间的a分量唇部提取方法。实验结果证明,该方法能实现唇部的自动分割和提取,具有较好的鲁棒性。
- 梁亚玲杜明辉
- 关键词:唇读
- 一种双分支关键特征重组的行人重识别方法、系统及介质
- 本发明公开了一种双分支关键特征重组的行人重识别方法、系统及介质,其中方法包括:获取图像数据;将图像数据输入训练后的行人重识别模型进行处理,输出行人重识别结果;所述行人重识别模型包括ViT模块和一条局部分支;其中,将ViT...
- 杨一豪梁亚玲
- 车载环境下的语音端点检测被引量:4
- 2018年
- 为了提高车载噪声环境下语音端点检测的准确性,提出了一个基于GRU-RNN的神经网络结构,对带噪语音的Log-Mel特征序列进行处理,实现语音与噪声的分离,从而恢复出纯净语音的LogMel特征序列;在此基础上,提出一种新的特征Log-Mel-Sum,并用该特征进行端点检测。实验结果表明,在车载环境下,本文方法具有很好的端点检测性能。
- 涂志强梁亚玲杜明辉
- 关键词:语音端点检测循环神经网络
- 基于2DNPP和Trace变换的平面内旋转人脸识别被引量:4
- 2012年
- 针对平面内具有随机旋转角度的人脸图像难以识别问题,提出一种融合二维近邻保持投影(2DNPP)和Trace变换的方法,以实现图像旋转不变性特征提取和识别.首先对图像做一重和二重Trace变换,然后对二重曲线进行匹配计算,得到既对平面内旋转变化具有鲁棒性、又能保存丰富图像信息的特征,最后通过2DNPP进行降维并分类.用该方法分别对正面的、旋转的、加噪声的人脸图像进行了识别实验,并与SIFT、pseudo-Zernike等方法进行了比较,结果表明:对于具有随机旋转角度的ORL图像库,文中算法识别率达到96%,且对白噪声具有较强的鲁棒性.
- 施展杜明辉梁亚玲
- 关键词:人脸识别旋转不变性特征提取