2025年7月23日
星期三
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
钱彦旻
作品数:
35
被引量:10
H指数:1
供职机构:
上海交通大学
更多>>
发文基金:
江苏省基础研究计划
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
电子电信
文化科学
更多>>
合作作者
俞凯
上海交通大学
韩冰
上海交通大学
陈楠昕
上海交通大学
黄文
上海交通大学
陈博
上海交通大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
34篇
专利
1篇
期刊文章
领域
7篇
自动化与计算...
4篇
电子电信
2篇
文化科学
主题
23篇
语音
6篇
音频
6篇
音素
6篇
声学特征
5篇
语音识别
5篇
神经网
5篇
神经网络
5篇
声学模型
5篇
说话人
5篇
网络
4篇
语言模型
4篇
欺骗检测
4篇
解码
3篇
语音合成
3篇
噪声
3篇
前馈
3篇
解码器
3篇
后验概率
3篇
泛化
3篇
标签
机构
35篇
上海交通大学
13篇
苏州思必驰信...
2篇
上海交通大学...
1篇
上海交通大学...
作者
35篇
钱彦旻
5篇
韩冰
5篇
俞凯
2篇
陈楠昕
1篇
陈博
1篇
黄文
传媒
1篇
计算机学报
年份
6篇
2025
11篇
2024
1篇
2022
3篇
2020
8篇
2019
3篇
2018
1篇
2017
2篇
2016
共
35
条 记 录,以下是 1-10
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于自监督预训练模型的机器故障检测方法
本发明公开了一种基于自监督预训练模型的机器故障检测方法,涉及机器学习领域。本发明通过状态增强来进行数据增强;引入大规模语音数据预训练的预训练模型来提升模型泛化性;transformer池化的融合策略来进行多声音片段融合故...
钱彦旻
韩冰
一种基于生成式算法的目标说话人活动检测系统
本发明公开了一种基于生成式算法的目标说话人活动检测系统,涉及语音领域,本发明使用生成方法进行目标说话人检测,在序列到序列目标说话人语音活动检测Seq2Seq‑TSVAD系统中实现了基于流匹配Flow‑Matching的生...
钱彦旻
陈正阳
儿童语音识别模型的训练方法及系统
本发明实施例提供一种儿童语音识别模型的训练方法。该方法包括:获取训练数据;通过基线声学模型训练得到无条件生成对抗网络;将随机噪声数据输入无条件生成对抗网络,得到噪声增强声学特征;将噪声增强声学特征输入至基线声学模型,得到...
钱彦旻
吴松泽
俞凯
盛佩瑶
杨卓林
李晨达
困难气道的检测方法及其电子设备和存储介质
本发明实施例提供一种困难气道的检测方法。该方法包括:对用户的语音音频进行声学特征提取和语音活性检测;将提取的声学特征进行平均池化处理,得到第一嵌入向量;将活性检测后的发声帧输入至用于表征困难气道的说话人的深度说话人模型,...
钱彦旻
周之恺
夏明
姜虹
曹爽
一种基于帧重采样和子带剪枝的轻量化语音增强方法
本发明公开了一种基于帧重采样和子带剪枝的轻量化语音增强方法,涉及自动语音识别领域。本发明提出的层级帧重采样(Layer‑Wise Frame Resampling,LWS)与子带剪枝(Sub‑Band Pruning,S...
钱彦旻
赵思怡
基于深度学习的说话人语音欺骗攻击检测方法及系统
一种基于深度学习的说话人语音欺骗攻击检测方法及系统,通过构建音频训练集,初始化并采用训练集的多帧特征向量和单帧向量序列分别训练深度前馈神经网络和深度递归神经网络;在测试阶段,将待测音频的帧级别和序列级别特征向量分别导入经...
钱彦旻
陈楠昕
俞凯
用于数据增强的语音加噪方法及系统
本发明实施例提供一种用于数据增强的语音加噪方法。该方法包括:将无噪音频和带噪音频的说话人向量输入至条件变分自编码模型,对模型编码器输出的向量均值以及方差向量随机高斯分布采样,得到噪音隐向量;将噪音隐向量和无噪音频输入至模...
俞凯
钱彦旻
吴章昊
王帅
语音音色转换中的节奏控制方法、电子设备和存储介质
本发明公开了一种语音音色转换中的节奏控制方法,包括,获取源语音的源语音语义向量和源语音梅尔谱;对源语音进行扰动后,获取源语音的源语音节奏向量;获取参考语音的参考语音语义向量、参考语音节奏向量和参考语音梅尔谱;掩盖部分语音...
钱彦旻
陈正阳
一种基于语音离散化和声码器的目标说话人抽取系统
本发明公开了一种基于语音离散化和声码器的目标说话人抽取系统,涉及语音识别技术领域,包括预训练语音离散模块、离散标记预测模块和语音生成模块,其中,所述预训练语音离散模块用于将语音数据离散化为离散标记序列,所述离散标记预测模...
钱彦旻
余林峰
张王优
欺骗录音检测神经网络模型的优化方法及系统
本发明实施例提供一种欺骗录音检测神经网络模型的优化方法。该方法包括:基于特征提取器、欺骗检测器和领域预测器构建欺骗录音检测神经网络模型;将源域数据以及目标域数据输入至特征提取器;将特征提取器的输出分别输入至欺骗检测器和领...
俞凯
钱彦旻
王鸿基
丁翰林
王帅
全选
清除
导出
共4页
<
1
2
3
4
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张