公共文化服务平台

2025年7月23日星期三

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

钱彦旻: 作品数：35 被引量：10H指数：1; 供职机构：上海交通大学更多>>; 发文基金：江苏省基础研究计划国家自然科学基金更多>>; 相关领域：自动化与计算机技术电子电信文化科学更多>>

合作作者

俞凯上海交通大学
韩冰上海交通大学
陈楠昕上海交通大学
黄文上海交通大学
陈博上海交通大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

34篇专利
1篇期刊文章

领域

7篇自动化与计算...
4篇电子电信
2篇文化科学

主题

23篇语音
6篇音频
6篇音素
6篇声学特征
5篇语音识别
5篇神经网
5篇神经网络
5篇声学模型
5篇说话人
5篇网络
4篇语言模型
4篇欺骗检测
4篇解码
3篇语音合成
3篇噪声
3篇前馈
3篇解码器
3篇后验概率
3篇泛化
3篇标签

机构

35篇上海交通大学
13篇苏州思必驰信...
2篇上海交通大学...
1篇上海交通大学...

作者

35篇钱彦旻
5篇韩冰
5篇俞凯
2篇陈楠昕
1篇陈博
1篇黄文

传媒

1篇计算机学报

年份

6篇2025
11篇2024
1篇2022
3篇2020
8篇2019
3篇2018
1篇2017
2篇2016

共 35 条记录，以下是 1-10

全选清除导出

排序方式：

一种基于自监督预训练模型的机器故障检测方法: 本发明公开了一种基于自监督预训练模型的机器故障检测方法，涉及机器学习领域。本发明通过状态增强来进行数据增强；引入大规模语音数据预训练的预训练模型来提升模型泛化性；transformer池化的融合策略来进行多声音片段融合故...; 钱彦旻韩冰

一种基于生成式算法的目标说话人活动检测系统: 本发明公开了一种基于生成式算法的目标说话人活动检测系统，涉及语音领域，本发明使用生成方法进行目标说话人检测，在序列到序列目标说话人语音活动检测Seq2Seq‑TSVAD系统中实现了基于流匹配Flow‑Matching的生...; 钱彦旻陈正阳

儿童语音识别模型的训练方法及系统: 本发明实施例提供一种儿童语音识别模型的训练方法。该方法包括：获取训练数据；通过基线声学模型训练得到无条件生成对抗网络；将随机噪声数据输入无条件生成对抗网络，得到噪声增强声学特征；将噪声增强声学特征输入至基线声学模型，得到...; 钱彦旻吴松泽俞凯盛佩瑶杨卓林李晨达

困难气道的检测方法及其电子设备和存储介质: 本发明实施例提供一种困难气道的检测方法。该方法包括：对用户的语音音频进行声学特征提取和语音活性检测；将提取的声学特征进行平均池化处理，得到第一嵌入向量；将活性检测后的发声帧输入至用于表征困难气道的说话人的深度说话人模型，...; 钱彦旻周之恺夏明姜虹曹爽

一种基于帧重采样和子带剪枝的轻量化语音增强方法: 本发明公开了一种基于帧重采样和子带剪枝的轻量化语音增强方法，涉及自动语音识别领域。本发明提出的层级帧重采样(Layer‑Wise Frame Resampling,LWS)与子带剪枝(Sub‑Band Pruning,S...; 钱彦旻赵思怡

基于深度学习的说话人语音欺骗攻击检测方法及系统: 一种基于深度学习的说话人语音欺骗攻击检测方法及系统，通过构建音频训练集，初始化并采用训练集的多帧特征向量和单帧向量序列分别训练深度前馈神经网络和深度递归神经网络；在测试阶段，将待测音频的帧级别和序列级别特征向量分别导入经...; 钱彦旻陈楠昕俞凯

用于数据增强的语音加噪方法及系统: 本发明实施例提供一种用于数据增强的语音加噪方法。该方法包括：将无噪音频和带噪音频的说话人向量输入至条件变分自编码模型，对模型编码器输出的向量均值以及方差向量随机高斯分布采样，得到噪音隐向量；将噪音隐向量和无噪音频输入至模...; 俞凯钱彦旻吴章昊王帅

语音音色转换中的节奏控制方法、电子设备和存储介质: 本发明公开了一种语音音色转换中的节奏控制方法，包括，获取源语音的源语音语义向量和源语音梅尔谱；对源语音进行扰动后，获取源语音的源语音节奏向量；获取参考语音的参考语音语义向量、参考语音节奏向量和参考语音梅尔谱；掩盖部分语音...; 钱彦旻陈正阳

一种基于语音离散化和声码器的目标说话人抽取系统: 本发明公开了一种基于语音离散化和声码器的目标说话人抽取系统，涉及语音识别技术领域，包括预训练语音离散模块、离散标记预测模块和语音生成模块，其中，所述预训练语音离散模块用于将语音数据离散化为离散标记序列，所述离散标记预测模...; 钱彦旻余林峰张王优

欺骗录音检测神经网络模型的优化方法及系统: 本发明实施例提供一种欺骗录音检测神经网络模型的优化方法。该方法包括：基于特征提取器、欺骗检测器和领域预测器构建欺骗录音检测神经网络模型；将源域数据以及目标域数据输入至特征提取器；将特征提取器的输出分别输入至欺骗检测器和领...; 俞凯钱彦旻王鸿基丁翰林王帅

全选清除导出

共4页<1 2 3 4>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张