搜索到2547篇“ 谱系数“的相关文章
- 使用全局自注意Teager能量倒谱系数检测重放欺骗语音
- 2024年
- 提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。
- 陈铭陈雪勤
- 一种基于梅尔倒谱系数与GRU模型的辐射源识别方法与系统
- 本发明公开了一种基于梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)与门控循环单元(Gated Recurrent Unit,GRU)模型的辐射源识别方法与系统,属于目标识别...
- 聂伟 张中洋 谢良波周牧
- 一种基于生成对抗网络的全带宽谱系数生成方法及系统
- 本申请公开了一种基于生成对抗网络的全带宽谱系数生成方法及系统,属于音频编解码技术领域,该方法包括:在对音乐音频的解码过程中,利用LC3解码器对音频码流进行解码,获取音频码流对应的带宽谱系数;利用预训练的生成网络对带宽谱系...
- 李强王尧叶东翔朱勇
- 砂岩破裂状态声发射梅尔倒谱系数判识方法
- 2024年
- 岩体结构破裂是严重制约矿山、地铁、隧道等地下空间工程建设及其安全运行的重要因素。实现对岩体结构破裂状态的识别是当下研究的热点与重点之一。为此,开展了不同条件的砂岩加载破坏实验,提取了加载全程的声发射梅尔倒谱系数及其波动差,研究了系数及其波动差在砂岩受载破坏全程的变化规律,分析了1号系数(一组声发射梅尔倒谱系数包括12个,1号系数指第1个声发射梅尔倒谱系数)及其波动差与砂岩破裂状态的相关性特征,基于此提出了砂岩破裂状态声发射梅尔倒谱系数判识方法,构建了判识准则并进行判识效果检验。结果表明:随载荷增加,1号系数整体上增大,系数及其离散性在破坏阶段显著增大并表现出显著的规律波动性特征;1号系数波动差具有阶段性变化特征,波动差的大小及其起伏变化可表征砂岩的破裂,波动差整体增大及突增的变化可反映砂岩非稳定变形和峰后破坏阶段的宏观破裂,波动差的突增幅度可反映砂岩破裂程度;声发射梅尔倒谱系数及其波动差对砂岩破裂表现出良好的响应特征,该特征受不同加载条件的影响较小,说明声发射梅尔倒谱系数在反映砂岩破裂上具有适用性;1号系数及其波动差与砂岩破裂状态具有较好相关性,该相关性可分为3个阶段,即1号系数及其波动差在砂岩微破裂阶段分布集中,在临近失稳破坏阶段分布范围急剧增大、整体值升高且出现高异常值,在峰后破坏阶段分布范围进一步增大、整体值更高、高异常值更多;利用1号系数的75%位点值和异常值、1号系数波动差的75%位点值和异常值构建了砂岩破裂状态判识准则,采用三分类模型混淆矩阵对判识准则的效果进行了检验,判识准确度和精准度分别为90.43%、94.45%。该成果可为其他种类煤岩的破裂状态识别提供借鉴,为煤岩失稳监测预警提供参考。
- 何学秋杨菲李振雷李娜宋大钊王洪磊SOBOLEV AlekseiRASSKAZOV Igor
- 关键词:声发射
- 基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法
- 本发明属于语音信号特征提取领域,具体涉及一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法。该方法包括三大部分:一、对语音信号进行粗粒化处理得到粗粒化序列,并计算粗粒化序列的分布概率,然后计算粗粒化序列的熵,再根据粗粒...
- 张海峰李彪乔铁柱崔思栋岳智超
- 梅尔频率倒谱系数在声带息肉手术前后嗓音分析中的价值研究被引量:2
- 2024年
- 目的 本研究拟通过提取患者嗓音中的梅尔频率倒谱系数(MFCC)指标,探讨其在声带息肉手术前后嗓音分析中的临床价值。方法 回顾性分析于2018年1月—2019年8月行声带息肉手术且术前及术后1个月均行嗓音评估的患者41例,男31例,女10例;平均年龄(42.9±11.4)岁。另选取无声嘶且无声带病变的正常受试者21例作为基线对照。使用基于Python编程语言的librosa语音处理包进行MFCC特征提取,分别提取每位患者的MFCC均值,MFCC方差与MFCC标准差,使用配对样本t检验比较声带息肉手术前后上述各MFCC特征的差异。结果 声带息肉患者术后MFCC均值1.25±1.01、MFCC方差561.34±154.98及MFCC标准差21.74±4.03比术前MFCC均值6.81±2.05、MFCC方差1 019.66±295.87及MFCC标准差34.37±6.63显著下降,差异具有统计学意义(t=18.596,P=0.000;t=10.338,P=0.000;t=11.852,P=0.000)。声带息肉组患者术后1个月其MFCC均值、MFCC方差及MFCC标准差与正常受试者相比差异均无统计学意义,表明绝大部分声带息肉患者术后嗓音得到良好的恢复。结论 本研究首次探索了MFCC在声带息肉手术前后嗓音分析中的价值,MFCC各特征可作为评估声带息肉术后嗓音恢复的指标。
- 刘茉葛鑫颖赵晓畅郝青青李祖飞
- 关键词:声带息肉声嘶嗓音分析手术
- 基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型
- 2024年
- 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。
- 齐晨浩杨晶东邱泽浩尧明慧燕海霞
- 关键词:高血压TRANSFORMER
- 一种煤岩破裂状态的声发射梅尔倒谱系数判识方法及装置
- 本发明涉及煤岩损伤破坏状态识别技术领域,特别是指一种煤岩破裂状态的声发射梅尔倒谱系数判识方法及装置,包括:通过煤岩受载破坏实验,采集声发射数据;对声发射数据进行声发射梅尔倒谱系数的提取与处理;对声发射梅尔倒谱系数进行声发...
- 李振雷杨菲宋大钊何学秋李娜何生全邱黎明王洪磊
- 基于梅尔频率倒谱系数特征识别供水管网漏损的机器学习模型比较研究
- 2024年
- 当前,声信号在供水管网漏损识别领域备受关注,成为水务行业研究的焦点。针对探漏培训基地采集的声信号进行处理,提取梅尔频率倒谱系数特征,并运用支持向量机、随机森林、梯度提升决策树、XGBoost和BP神经网络五种有代表性的机器学习模型进行训练和测试。测试结果表明,5种机器学习模型都能有效识别管道中的漏损声信号特征,F1分数都超过86%。将上述模型应用于诊断实际管网中获取的漏损声信号,支持向量机表现最优,准确率达到82.8%,具有较强的泛化能力。结果验证了基于MFCC的机器学习模型可提高管网漏损诊断效率,降低维护成本。
- 何立新张宏洋张峥陈炯禧王琦王琦龙岩
- 关键词:供水管网MFCC
- Mel频率倒谱系数平滑的耳机均衡
- 2023年
- 适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。
- 李光炬李光炬钱鹏甘维明甘维明
- 关键词:MEL频率倒谱系数
相关作者
- 李应

- 作品数:69被引量:137H指数:7
- 供职机构:福州大学数学与计算机科学学院
- 研究主题:声音识别 抗噪 声音 低信噪比 MEL频率倒谱系数
- 景新幸

- 作品数:169被引量:545H指数:11
- 供职机构:桂林电子科技大学
- 研究主题:语音识别 说话人识别 矢量量化 DSP 特征参数
- 李艳雄

- 作品数:94被引量:110H指数:6
- 供职机构:华南理工大学
- 研究主题:语音 说话人 音频 网络 预加重
- 杜庆治

- 作品数:379被引量:325H指数:9
- 供职机构:昆明理工大学信息工程与自动化学院
- 研究主题:语种识别 语音 相似度 汉字 音频信号处理
- 龙华

- 作品数:571被引量:477H指数:9
- 供职机构:昆明理工大学信息工程与自动化学院
- 研究主题:语种识别 包装盒 相似度 语音 文本