您的位置: 专家智库 > >

钱彦旻

作品数:35 被引量:10H指数:1
供职机构:上海交通大学更多>>
发文基金:江苏省基础研究计划国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信文化科学更多>>

文献类型

  • 34篇专利
  • 1篇期刊文章

领域

  • 7篇自动化与计算...
  • 4篇电子电信
  • 2篇文化科学

主题

  • 23篇语音
  • 6篇音频
  • 6篇音素
  • 6篇声学特征
  • 5篇语音识别
  • 5篇神经网
  • 5篇神经网络
  • 5篇声学模型
  • 5篇说话人
  • 5篇网络
  • 4篇语言模型
  • 4篇欺骗检测
  • 4篇解码
  • 3篇语音合成
  • 3篇噪声
  • 3篇前馈
  • 3篇解码器
  • 3篇后验概率
  • 3篇泛化
  • 3篇标签

机构

  • 35篇上海交通大学
  • 13篇苏州思必驰信...
  • 2篇上海交通大学...
  • 1篇上海交通大学...

作者

  • 35篇钱彦旻
  • 5篇韩冰
  • 5篇俞凯
  • 2篇陈楠昕
  • 1篇陈博
  • 1篇黄文

传媒

  • 1篇计算机学报

年份

  • 6篇2025
  • 11篇2024
  • 1篇2022
  • 3篇2020
  • 8篇2019
  • 3篇2018
  • 1篇2017
  • 2篇2016
35 条 记 录,以下是 1-10
排序方式:
一种基于自监督预训练模型的机器故障检测方法
本发明公开了一种基于自监督预训练模型的机器故障检测方法,涉及机器学习领域。本发明通过状态增强来进行数据增强;引入大规模语音数据预训练的预训练模型来提升模型泛化性;transformer池化的融合策略来进行多声音片段融合故...
钱彦旻韩冰
一种基于生成式算法的目标说话人活动检测系统
本发明公开了一种基于生成式算法的目标说话人活动检测系统,涉及语音领域,本发明使用生成方法进行目标说话人检测,在序列到序列目标说话人语音活动检测Seq2Seq‑TSVAD系统中实现了基于流匹配Flow‑Matching的生...
钱彦旻陈正阳
儿童语音识别模型的训练方法及系统
本发明实施例提供一种儿童语音识别模型的训练方法。该方法包括:获取训练数据;通过基线声学模型训练得到无条件生成对抗网络;将随机噪声数据输入无条件生成对抗网络,得到噪声增强声学特征;将噪声增强声学特征输入至基线声学模型,得到...
钱彦旻吴松泽俞凯盛佩瑶杨卓林李晨达
困难气道的检测方法及其电子设备和存储介质
本发明实施例提供一种困难气道的检测方法。该方法包括:对用户的语音音频进行声学特征提取和语音活性检测;将提取的声学特征进行平均池化处理,得到第一嵌入向量;将活性检测后的发声帧输入至用于表征困难气道的说话人的深度说话人模型,...
钱彦旻 周之恺 夏明 姜虹 曹爽
一种基于帧重采样和子带剪枝的轻量化语音增强方法
本发明公开了一种基于帧重采样和子带剪枝的轻量化语音增强方法,涉及自动语音识别领域。本发明提出的层级帧重采样(Layer‑Wise Frame Resampling,LWS)与子带剪枝(Sub‑Band Pruning,S...
钱彦旻赵思怡
基于深度学习的说话人语音欺骗攻击检测方法及系统
一种基于深度学习的说话人语音欺骗攻击检测方法及系统,通过构建音频训练集,初始化并采用训练集的多帧特征向量和单帧向量序列分别训练深度前馈神经网络和深度递归神经网络;在测试阶段,将待测音频的帧级别和序列级别特征向量分别导入经...
钱彦旻陈楠昕俞凯
用于数据增强的语音加噪方法及系统
本发明实施例提供一种用于数据增强的语音加噪方法。该方法包括:将无噪音频和带噪音频的说话人向量输入至条件变分自编码模型,对模型编码器输出的向量均值以及方差向量随机高斯分布采样,得到噪音隐向量;将噪音隐向量和无噪音频输入至模...
俞凯钱彦旻吴章昊王帅
语音音色转换中的节奏控制方法、电子设备和存储介质
本发明公开了一种语音音色转换中的节奏控制方法,包括,获取源语音的源语音语义向量和源语音梅尔谱;对源语音进行扰动后,获取源语音的源语音节奏向量;获取参考语音的参考语音语义向量、参考语音节奏向量和参考语音梅尔谱;掩盖部分语音...
钱彦旻 陈正阳
一种基于语音离散化和声码器的目标说话人抽取系统
本发明公开了一种基于语音离散化和声码器的目标说话人抽取系统,涉及语音识别技术领域,包括预训练语音离散模块、离散标记预测模块和语音生成模块,其中,所述预训练语音离散模块用于将语音数据离散化为离散标记序列,所述离散标记预测模...
钱彦旻余林峰张王优
欺骗录音检测神经网络模型的优化方法及系统
本发明实施例提供一种欺骗录音检测神经网络模型的优化方法。该方法包括:基于特征提取器、欺骗检测器和领域预测器构建欺骗录音检测神经网络模型;将源域数据以及目标域数据输入至特征提取器;将特征提取器的输出分别输入至欺骗检测器和领...
俞凯钱彦旻王鸿基丁翰林王帅
共4页<1234>
聚类工具0