您的位置: 专家智库 > >

广东省自然科学基金(10451064101004651)

作品数:8 被引量:24H指数:3
相关作者:李艳雄贺前华何俊朱华虹杨继臣更多>>
相关机构:华南理工大学仲恺农业工程学院更多>>
发文基金:广东省自然科学基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 7篇电子电信
  • 2篇自动化与计算...

主题

  • 2篇信号
  • 2篇信号处理
  • 2篇语音
  • 2篇语音信号
  • 2篇语音信号处理
  • 2篇声纹
  • 2篇说话人
  • 1篇多媒体
  • 1篇多媒体检索
  • 1篇新闻
  • 1篇新闻故事
  • 1篇异常语音
  • 1篇语音检测
  • 1篇身份认证
  • 1篇说话人聚类
  • 1篇说话人识别
  • 1篇说话人识别算...
  • 1篇同态
  • 1篇同态加密
  • 1篇取证技术

机构

  • 8篇华南理工大学
  • 2篇仲恺农业工程...

作者

  • 8篇李艳雄
  • 6篇贺前华
  • 3篇何俊
  • 2篇杨继臣
  • 2篇朱华虹
  • 1篇张雪源
  • 1篇李威
  • 1篇潘伟锵
  • 1篇吴永
  • 1篇王志锋
  • 1篇王志峰

传媒

  • 3篇华南理工大学...
  • 1篇电子与信息学...
  • 1篇计算机工程与...
  • 1篇计算机工程与...
  • 1篇信号处理
  • 1篇计算机工程与...

年份

  • 1篇2014
  • 2篇2013
  • 5篇2012
  • 1篇2011
8 条 记 录,以下是 1-9
排序方式:
新闻故事中的关键说话人发现方法被引量:1
2012年
为了发现新闻故事中的关键说话人,用以提高多媒体检索效率,在说话人索引的基础上,提出了关键人发现方法:根据新闻故事中说话人的特点,基于说话人频率、说话人持续时间、平均每次说话人时长和说话人位置因子4个因素,综合定义了说话人关键度,用以判断说话人的重要性,把每个新闻故事中说话人关键度最大的人作为关键说话人。实验结果表明,该种算法可以找到故事中绝大部分的关键说话人,验证了该算法的有效性和可行性。
杨继臣李艳雄
关键词:新闻故事多媒体检索主要角色
基于特征均值距离的短语音段说话人聚类算法被引量:9
2012年
该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明:与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。
李艳雄吴永贺前华
关键词:语音信号处理说话人聚类
基于随机映射的声纹模板保护方法被引量:1
2013年
针对生物特征模板涉及用户隐私而易受到各种攻击的问题,在定义随机映射形式化表示的基础上,结合主流文本无关说话人识别技术,提出了一种基于随机映射的声纹模板保护方法.在注册阶段,将声纹特征映射至随机空间再训练高斯混合模型(GMM),并存储模型参数作为模板;在认证阶段,待认证的声纹特征在相同的变换域与模型库进行匹配.文中还给出了该方法在认证性能保持和安全性方面的理论分析.实验结果表明,适当降维能在提高安全性的同时近似保持GMM的身份认证性能,而目前基于矢量量化的认证性能下降超过8%,说明随机映射更适用于基于GMM的声纹认证系统的模板保护.
朱华虹贺前华李艳雄张雪源
关键词:声纹高斯混合模型
一种基于性别的说话人索引算法
2012年
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。
杨继臣何俊李艳雄
录音设备的建模和识别算法被引量:6
2013年
本文提出了一种录音设备的建模和识别算法。在特征选择方面,考虑到音频段中的静音包含了与正常语音一样的设备信息,并且不受说话人、文本、情感等因素的影响,因此从静音段中提取出表征录音设备"机器指纹"的特征,并用谱减法去除其中的背景噪声。在识别模型方面,利用设备通用背景模型构建反对设备模型;在设备通用背景模型的基础上,利用少量的特定设备数据,通过MAP自适应算法获得相应录音设备的模型。最后通过归一化似然度得分对输入的特定录音设备的语音样本进行分类判决。实验结果表明,对于9种不同录音设备的平均正确识别率为87.42%,并考察了不同因素对本文算法的影响,验证了本文算法的有效性和可靠性。
王志锋贺前华李艳雄
变异特征加权的异常语音说话人识别算法被引量:5
2012年
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.
何俊李艳雄贺前华李威
关键词:异常语音说话人识别K-L距离加权因子
OPTIMAL STREAM WEIGHTING ESTIMATION METHOD FOR AUDIO-VISUAL DECISION FUSION SPEECH RECOGNITION
<正>A new weighting estimation method based on Integer Linear Programming(ILP) is proposed to estimate near-opt...
Xiaohui Feng
文献传递
基于同态加密的声纹模板设计及其分析被引量:1
2014年
结合声纹特征和VQ(Vector Quantization)识别算法的特点,在对整数同态加密算法进行改进的基础上,提出基于同态加密(homomorphic encryption scheme)的声纹模板保护方法。将实数形式的码本和认证声纹特征转化为整数,采用改进的整数同态加密算法对数据加密并计算密文的欧氏距离分量差,运算结果经解密后用于计算平均最小量化误差最终进行决策输出。该方法克服了实数同态加密算法密文泄漏明文的大小关系、小数和正负数信息等缺陷,并能抵抗已知明文攻击。实验结果表明,加密后系统的身份认证性能可基本保持,验证了方法的有效性。
朱华虹贺前华李艳雄潘伟锵
关键词:声纹同态加密身份认证
基于相关维数的病变连续语音检测算法被引量:1
2012年
针对人为设定最优采样延迟不能客观反映信号采样延迟和固定相关维数不易描述病变异常语音复杂性的缺陷,文中提出一种基于相关维数的病变连续语音检测算法.该算法在语音信号合理采样延迟区间内不断调整采样延迟,搜索使正常语音与病变连续语音的区分等错误率达到最小的嵌入相关维数,以避免设定采样延迟的缺陷.同时,通过将相关维数曲线划分成子区间,并判定子区间的稳定性,以达到不固定嵌入相关维数的目的.最后,对每个合理采样延迟时间内获取的训练语音的最优相关维数进行等错误率分析,选用具有最小等错误率的相关维数及对应的采样延迟为文中混沌参数,为测试语音提取混沌指数进行正异常区分.实验结果表明,该算法的区分正确率为75.6%,分别比GMM-SVM、Shimmer、固定相关维和采样延迟法、SHR算法和Jitter算法提高7.8%、9.3%、16.0%、18.0%和20.4%.
贺前华何俊李艳雄王志峰
关键词:语音信号处理
共1页<1>
聚类工具0