您的位置: 专家智库 > >

江苏省自然科学基金(BK20131196)

作品数:5 被引量:12H指数:2
相关作者:俞一彪陈雪勤赵鹤鸣陈浩周燕更多>>
相关机构:苏州大学苏州市职业大学北京交通大学更多>>
发文基金:江苏省自然科学基金国家自然科学基金国家级大学生创新创业训练计划更多>>
相关领域:电子电信更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇电子电信

主题

  • 3篇语音
  • 1篇低信噪比
  • 1篇低信噪比环境
  • 1篇信号
  • 1篇信噪比
  • 1篇延时
  • 1篇语料
  • 1篇语音活动检测
  • 1篇语音检测
  • 1篇语音信号
  • 1篇语音转换
  • 1篇平行语料
  • 1篇谱参数
  • 1篇情感分类
  • 1篇群延时
  • 1篇主观
  • 1篇稀疏分解
  • 1篇谎言
  • 1篇混合模型
  • 1篇极值

机构

  • 5篇苏州大学
  • 1篇北京交通大学
  • 1篇苏州市职业大...

作者

  • 4篇俞一彪
  • 3篇陈雪勤
  • 2篇赵鹤鸣
  • 1篇周燕
  • 1篇陈浩
  • 1篇周峰

传媒

  • 1篇声学学报
  • 1篇电子学报
  • 1篇应用科学学报
  • 1篇信号处理
  • 1篇计算机与数字...

年份

  • 1篇2018
  • 1篇2017
  • 1篇2016
  • 1篇2014
  • 1篇2013
5 条 记 录,以下是 1-5
排序方式:
倒谱参数稀疏分解下的汉语音谎言检测被引量:4
2018年
为了提高汉语语音的谎言检测准确率,提出了一种对信号倒谱参数进行稀疏分解的方法。首先,采用小波包滤波器组对语音信号进行多频带划分,求得子频带对数能量并进行离散余弦变换以提取小波包频带倒谱系数,结合梅尔频率谱系数得到倒谱参数;其次,依据K-奇异值分解方法分别利用说谎和非说谎两种状态下的语音倒谱参数集训练得到过完备混合字典,在此字典上根据正交匹配追踪算法对参数集进行稀疏编码提取稀疏特征;最终进行多种分类模型下的识别实验·实验结果表明,稀疏分解方法相比传统参数降维方法具有更好的优化性能,本文推荐的稀疏谱特征最佳识别率达到78.34%,优于其他特征参数,显著提高了谎言检测识别准确率。
樊晓鹤赵鹤鸣陈雪勤周燕
关键词:稀疏分解语音信号
低信噪比环境下语音检测的邻域极值差分信号功率谱分维算法被引量:1
2013年
提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测.在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音的语音信号活动检测(speech activity detection,SAD)性能与盒维相似,明显好于谱熵算法.多种噪声环境下的SAD检测结果显示,所提算法的误检率远低于谱熵算法,在除白噪声以外各种条件下的误检率均低于盒维算法,且计算量约为盒维算法的5%.实验表明,该算法在SAD检测和效率两方面具有良好的综合性能.
陈雪勤俞一彪赵鹤鸣
关键词:语音活动检测低信噪比分形维功率谱
群延时谱参数在汉语数字语音识别中的应用被引量:1
2017年
汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字"2"和"8"的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。
周峰俞一彪
关键词:群延时
高表现力情感语料库的设计被引量:4
2014年
针对高表现力情感语音合成的需要,设计并建立了一个具有四种情感状态(正常、喜悦、忧伤、愤怒)的高表现力情感语料库。该数据库包含1000个词组、700条语句,共30分钟的语料。论文分析并讨论了设计和建立情感语料库的几个重要准则:语料的选择、制定标注规范、安静的录音环境、情感的情景准备以及情感语料库经主观辨听的后期筛选。为达到高表现力,论文着重强调了情境诱发的重要性,主观听觉评价表明,本数据库具有明显的情感特征。
陈浩师雪姣肖智议陈雪勤俞一彪
关键词:情感分类
约束条件下的结构化高斯混合模型及非平行语料语音转换被引量:2
2016年
提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在(Expectation Maximum,EM)迭代过程中对语音帧属于模型分量的后验概率进行修正,得到基于约束的结构化高斯混合模型(Structured Gaussian Mixture Model with Constraint condition,CSGMM).再利用全局声学结构(Acoustic Universal Structure,AUS)原理对源和目标说话人的约束结构化高斯混合模型的高斯分布进行匹配对准,推导出短时谱转换函数.主观和客观评价实验结果表明,使用该方法得到的转换后语音在谱失真,目标倾向性和语音质量等方面均优于传统的结构化模型语音转换方法,转换语音的平均谱失真仅为0.52,说话人正确识别率达到95.25%,目标语音倾向性指标ABX平均为0.82,性能更加接近于基于平行语料的语音转换方法.
车滢霞俞一彪
关键词:语音转换
共1页<1>
聚类工具0