您的位置: 专家智库 > >

易江燕

作品数:96 被引量:33H指数:3
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信文化科学更多>>

文献类型

  • 91篇专利
  • 4篇期刊文章
  • 1篇会议论文

领域

  • 17篇自动化与计算...
  • 9篇电子电信
  • 5篇文化科学

主题

  • 79篇语音
  • 24篇存储介质
  • 23篇声学特征
  • 21篇电子设备
  • 20篇语音识别
  • 14篇音频
  • 13篇解码
  • 12篇声学模型
  • 10篇语音检测
  • 10篇解码器
  • 9篇端到端
  • 9篇训练数据
  • 8篇音素
  • 8篇篡改
  • 7篇编码器
  • 6篇网络
  • 6篇混合语音
  • 6篇词表
  • 5篇端到端系统
  • 5篇语音数据

机构

  • 96篇中国科学院自...
  • 5篇中国科学院大...
  • 1篇中国科学技术...
  • 1篇中国科学院脑...

作者

  • 96篇易江燕
  • 95篇陶建华
  • 15篇梁山
  • 11篇汪涛
  • 8篇温正棋
  • 5篇刘斌
  • 4篇张震
  • 1篇张大伟

传媒

  • 1篇计算机研究与...
  • 1篇清华大学学报...
  • 1篇信号处理
  • 1篇信息安全学报
  • 1篇第十四届全国...

年份

  • 9篇2024
  • 12篇2023
  • 27篇2022
  • 38篇2021
  • 3篇2020
  • 2篇2019
  • 2篇2018
  • 3篇2017
96 条 记 录,以下是 1-10
排序方式:
篡改音频的篡改区域检测方法、装置及存储介质
本公开涉及一种篡改音频的篡改区域的检测方法、装置及存储介质,上述方法包括:获取待检测信号,并提取所述待检测信号的声学特征;将所述声学特征输入篡改区域检测模型,输出每帧所述待检测信号的标签,其中,所述篡改区域检测模型已通过...
易江燕陶建华田正坤傅睿博
文献传递
端到端语音转写模型的训练方法、系统、装置
本发明属于电子信号处理技术领域,具体涉及一种端到端语音转写模型的训练方法、系统、装置,旨在解决端到端语音转写模型无法很好的学习语音数据的对齐信息的问题。本系统方法包括提取语音训练数据的特征,得到语音特征序列;通过GMM‑...
陶建华田正坤易江燕
文献传递
基于知识迁移的电话信道虚假语音鉴别方法及存储介质
本发明提供一种基于知识迁移的电话信道虚假语音鉴别方法,包括:将利用麦克风信道语音数据训练而得的鉴别模型作为麦克风信道模型,将利用电话信道语音训练数据训练得到的声学模型视为电话信道模型;在所述电话信道模型训练过程中,应用所...
易江燕陶建华田正坤傅睿博
文献传递
语音判别方法、装置、电子设备及存储介质
本公开涉及一种语音判别方法、装置、电子设备及存储介质,上述方法包括:获取待判别语音;提取所述待判别语音的声学特征和语言风格特征;对所述声学特征和所述语言风格特征进行语音拼接处理,得到融合特征;将所述融合特征输入语音判别器...
陶建华遆敬苗易江燕傅睿博
文献传递
篡改音频的检测方法、装置、电子设备及存储介质
本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测信号,并对待检测信号进行第一预设阶数的小波变换,得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数;对阶数大于等于第二...
梁山陶建华聂帅易江燕
文献传递
语音场景篡改鉴别的方法、装置、电子设备及存储介质
本申请涉及一种语音场景篡改鉴别的方法、装置、电子设备及存储介质,所述语音场景篡改鉴别的方法,包括以下步骤:提取输入的待鉴别音频的对数功率谱的声学特征;将提取的待鉴别音频的对数功率谱的声学特征输入预先训练的语音场景篡改识别...
陶建华王成龙易江燕
文献传递
基于隐变量空间添加水印的语音合成方法、装置及设备
本公开涉及一种基于隐变量空间添加水印的语音合成方法、装置及设备,上述方法包括:获取待处理文本和待添加的水印信息;对待处理文本的文本音素序列、水印信息进行特征提取处理,得到位于概率空间的文本音素隐变量和水印隐变量;拼接文本...
陶建华章楚源易江燕
编辑音频的方法、装置、电子设备及存储介质
本申请涉及一种编辑音频的方法、装置、电子设备及存储介质,所述方法包括:获取根据已知的修改文本对已知的待编辑音频的原始文本进行修改得到的修改后文本;预测所述修改文本对应的音频持续时长;根据所述修改文本对应的音频持续时长对所...
陶建华汪涛易江燕傅睿博
文献传递
一种无需原始数据存储的持续性学习生成语音特征的方法
本发明提供一种无需原始数据存储的持续性学习生成语音特征的方法,包括:采集音频数据,提取音频声学特征,得到线性倒谱系数特征;应用所述线性倒谱系数特征对深度学习网络模型进行训练,得到源域模型;在源域模型的训练损失函数基础上加...
陶建华马浩鑫易江燕
文献传递
一种语音识别与语音翻译端到端系统及设备
本发明提供一种语音识别与语音翻译端到端系统及电子设备,其中,系统包括:声学编码器、多任务解码器和语义不变性约束模块,同时完成识别系统与翻译系统这两个任务,另外根据不同任务的文本语义相同特点,对模型施加语义约束,学习高层次...
陶建华张帅易江燕
文献传递
共10页<12345678910>
聚类工具0