您的位置: 专家智库 > >

张琪

作品数:14 被引量:26H指数:3
供职机构:中国人民公安大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术电子电信理学经济管理更多>>

文献类型

  • 13篇中文期刊文章

领域

  • 11篇自动化与计算...
  • 2篇电子电信
  • 1篇理学

主题

  • 8篇图像
  • 2篇信息安全
  • 2篇用户
  • 2篇用户界面
  • 2篇智能视频
  • 2篇视频
  • 2篇图像处理
  • 2篇图形用户
  • 2篇图形用户界面
  • 2篇解码
  • 2篇后门
  • 2篇虹膜
  • 2篇虹膜识别
  • 2篇分辨率
  • 2篇编解码
  • 2篇超分辨
  • 2篇超分辨率
  • 2篇超分辨率重建
  • 2篇TRANSF...
  • 1篇对称型

机构

  • 13篇中国人民公安...
  • 3篇北京建筑大学

作者

  • 13篇张琪
  • 7篇丁建伟
  • 3篇王蓉
  • 2篇孙阳
  • 1篇李欣
  • 1篇李冲
  • 1篇田启川
  • 1篇宋振峰

传媒

  • 2篇实验技术与管...
  • 2篇现代电子技术
  • 1篇计算机辅助设...
  • 1篇计算机工程与...
  • 1篇应用科学学报
  • 1篇北京航空航天...
  • 1篇电脑知识与技...
  • 1篇中国图象图形...
  • 1篇中国科技论文
  • 1篇电子技术与软...
  • 1篇长江信息通信

年份

  • 1篇2024
  • 6篇2023
  • 3篇2022
  • 3篇2021
14 条 记 录,以下是 1-10
排序方式:
基于无监督深度学习的真实图像超分辨率重建
2023年
针对实际图像超分辨率重建任务中,有监督学习方法训练的模型依赖训练数据集导致泛化性不佳的问题,提出了一种使用无监督方法训练的真实图像超分辨率重建模型。首先,基于非配对的真实图像,构建了真实图像退化生成对抗式网络,将输入的真实高分辨率图像生成具有逼真细节的退化图像;其次,使用多头注意力机制构建了残差卷积图像超分辨率重建网络,通过建立长距离相关性学习,提升了真实图像超分辨率重建效果。该方法在经典超分辨率测试集和真实图像数据集上进行了大量实验,对比现有主流无监督真实图像超分辨率重建模型,PSNR指标平均提升1.57 dB;针对安防监控图像数据集,无参考图像质量评价指标NIQE最多降低52.32%。
魏慧雯丁建伟张琪张正一孙阳
关键词:图像重建图像模型
智能视频处理系统综合实验设计
2022年
为了帮助学生更好理解智能视频处理技术的基本原理和警务应用,文章设计了智能视频处理的综合实验。使用Matlab语言设计实现图形用户界面,分别实现图像读取、目标跟踪、目标识别、异常行为分析、报警等功能。该实验不仅能清晰阐释智能视频处理的原理和方法,还能帮助学生充分理解图像处理知识,培养动手实践能力,激发学习热情,有效提升教学效果。
彭崇丁建伟张琪
关键词:目标跟踪图形化界面
局部特征增强的转置自注意力图像超分辨率重建
2024年
目的 超分辨率(super resolution,SR)重建任务通过划分窗口引入自注意力机制进行特征提取,获得了令人瞩目的成绩。针对划分窗口应用自注意力机制时会限制图像信息聚合范围、制约模型对特征信息进行建模的问题,本文基于转置自注意力机制构建全局和局部信息建模网络捕捉图像像素依赖关系。方法 首先采用轻量的基线模型对特征进行简单关系建模,然后将空间维度上的自注意力机制转换到通道维度,通过计算交叉协方差矩阵构建各像素点之间的长距离依赖关系,接着通过引入通道注意力块补充图像重建所需的局部信息,最后构建双门控机制控制信息在模型中的流动,提高模型对特征的建模能力及其鲁棒性。结果 实验在5个基准数据集Set5、Set14、BSD100、Urban100、Manga109上与主流方法进行了比较,在不同比例因子的SR任务中均获得了最佳或者次佳的结果。与SwinIR(image restoration using swin Transformer)在×2倍SR任务中相比,在以上5个数据集上的峰值信噪比分别提升了0.03 dB、0.21 dB、0.05 dB、0.29 dB和0.10 dB,结构相似度也获得了极大提升,同时视觉感知优化十分明显。结论 所提出的网络模型能够更充分地对特征信息全局关系进行建模,同时也不会丢失图像特有的局部相关性。重建图像质量明显提高,细节更加丰富,充分说明了本文方法的有效性与先进性。
孙阳丁建伟张琪邓琪瑶
关键词:图像超分辨率重建图像复原
虹膜识别系统综合实验设计被引量:6
2021年
为更好地传授虹膜识别的基本原理和实现方法,该文设计了虹膜识别系统的综合实验。利用Matlab语言设计图形用户界面,实现图像读取、虹膜定位、虹膜归一化、特征提取和分类识别等功能。该实验不仅可以使学生综合运用图像处理与识别知识,更好地理解虹膜识别的基本原理和方法,还能提高学生的科研素质和动手实践能力。
李欣张琪王蓉
关键词:图像处理虹膜识别图形用户界面
结合Transformer与对称型编解码器的噪声虹膜图像分割方法被引量:1
2022年
针对少约束场景下采集的虹膜图像容易受到镜面反射、睫毛和头发遮挡、运动和离焦模糊等噪声的干扰,导致难以准确地分割有效的虹膜区域的问题,提出一种结合Transformer与对称型编解码器的噪声虹膜图像分割方法.首先,使用Swin Transformer作为编码器,将输入图像的区块序列送入分层Transformer模块中,通过自注意力机制建模像素间的长距离依赖,增强上下文信息的交互;其次,构建与编码器对称的Transformer解码器,对所提取的高阶上下文特征进行多层解码,解码过程中与编码器跳跃连接进行多尺度特征融合,减少下采样造成的空间位置信息丢失;最后,对解码器每个阶段的输出进行监督学习,提升不同尺度特征的抽取质量.基于3个公开的噪声近红外和可见光虹膜数据集NICE.I,CASIA.v4-distance和MICHE-I,与若干包括传统方法、基于卷积神经网络的方法和基于现有Transformer的方法在内的基准方法进行对比实验,实验结果表明,所提方法在E_(1),E_(2),F_(1)和MIOU定量评价指标上均取得了比基准方法更优的分割性能,尤其是在减少噪声的干扰上具有明显的优势.此外,在CASIA.v4-distance数据集上的虹膜识别实验表明,文中方法可以有效地提升虹膜识别的性能,显示了良好的应用潜力.
顾正杰王财勇田启川田启川
关键词:虹膜识别TRANSFORMER
基于局部和全局梯度上升的分段后门防御被引量:1
2023年
针对后门触发器趋于隐蔽且难以检测的问题,提出了一种基于局部和全局梯度上升的分段后门防御方法:在训练前期,引入局部梯度上升扩大后门样本与干净样本平均训练损失之差,隔离出少量高精度后门样本,便于后期进行后门遗忘;在后门遗忘阶段,引入全局梯度上升,打破后门样本与目标类别之间的相关性,实现防御。实验基于3个基准数据集GTSRB、Cifar10和MNIST,在宽残差网络上针对6种先进后门攻击进行了大量实验,分段后门防御方法能够将绝大部分攻击的成功率防御至5%以下。另外,实验也证明了分段防御方法在后门数据集与干净数据集上都能训练出干净等效的学习模型。
萧晓彤丁建伟张琪
关键词:信息安全
多层次特征融合和注意力机制的道路裂缝模型被引量:1
2023年
针对现有裂缝检测方法易受各类噪声干扰从而导致误检及小尺度裂缝漏检的问题,提出一种基于多层次特征融合和注意力机制的道路裂缝检测模型,采用编解码结构DeepCrack网络作为基本架构。设计单尺度多层次特征融合模块应用于特征提取,通过多级网络表征增强裂缝的细节特征。同时在编解码端对称融合部位,引入改进后的三重注意力模块,从通道、高和宽3个维度进行跨维度交互,凸显裂缝特征和抑制噪声特征,并进行跨维度的特征融合,以获得更具互补性的裂缝特征。实验表明,在道路裂缝数据集CRKWH100上,模型在多个边缘评估指标上实现了当前最优,同时在Stone331石材裂缝数据集中也验证了该模型的泛化性。
宋榕榕王财勇田启川张琪
图像去噪系统综合实验设计被引量:2
2021年
本文因为数字图像处理理论知识繁多且设计面广泛[1],为了更好的了解图像处理,利用MATLAB GUI人机交互平台来处理数字图像,设计一个对图像进行获取、添加噪声和图像去噪的实验仿真系统,通过简单的实验平台操作,能更加清楚的了解到具体的不同参数对图像所作用的效果,将理论与实践相结合,对理论知识了解的更加全面和具体。
王倩丁建伟张琪
关键词:图像去噪MATLAB
基于图片边界后门嵌入的图像识别攻击研究
2023年
采用公开数据集或预训练好的神经网络模型可以快速实现图像分析、语音识别等应用,但存在一定的风险或威胁。攻击者可以通过向开源训练数据或者训练模型中嵌入后门,使模型在接收到带有触发功能的数据时执行指定的后门行为。目前,图像识别的后门攻击采用的后门触发器大多在视觉上容易被发现,为此,文中提出一种基于图片边界后门嵌入的图像识别攻击方法。该方法向训练图片边界添加窄的有色带作为后门触发器,利用隐蔽的外形逃避视觉关注。在MNIST、CIFAR⁃10等图像识别数据集上对所提方法进行测试,实验结果表明,该后门可以稳定注入,并在毒药率为30%时,攻击成功率达到99.73%。相比于其他两种常见的后门攻击方法,所提方法攻击成功率更高,具有较强的攻击性和鲁棒性。
萧晓彤丁建伟张琪
关键词:图像识别神经网络信息安全
基于Transformer与多层次模态融合的图像指代分割方法
2023年
针对现有指代分割算法对图像整体场景理解不充分以及模态间信息交互欠缺的问题,提出一种基于Transformer与多层次模态融合的指代分割方法。首先,使用BERT与金字塔池化Transformer(pyramid pooling Transformer,P2T)抽取文本特征和多尺度视觉特征,捕获全局上下文信息,强化模型对图像的整体感知;其次,使用多头注意力机制融合文本特征与各尺度视觉特征,促进跨模态信息之间的多层次深度交互;最后,引入坐标注意力调节(CA Adjustmen)模块,以自适应的权重聚合上述多模态特征和视觉特征,将文本信息的引导嵌入视觉编码的各个阶段,提升跨模态信息表示在语义空间中的一致性。在RefCOCO、RefCOCO+和G-Ref数据集上进行训练和测试,结果表明,所提方法具有较低的模型复杂度,并可以准确定位和分割出文本指代的目标。
吴澳张琪王蓉宋振峰
共2页<12>
聚类工具0