您的位置: 专家智库 > >

国家教育部博士点基金(20070699015)

作品数:3 被引量:3H指数:1
相关作者:谢磊杨玉莲王跃芦咪咪王晓暄更多>>
相关机构:西北工业大学更多>>
发文基金:国家教育部博士点基金西北工业大学基础研究基金陕西省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文

领域

  • 4篇自动化与计算...
  • 1篇电子电信

主题

  • 3篇新闻
  • 3篇音频
  • 3篇中文
  • 2篇音频分类
  • 2篇语音
  • 2篇语音识别
  • 2篇说话人识别
  • 2篇频分
  • 2篇广播
  • 1篇多媒体检索
  • 1篇新闻广播
  • 1篇新闻字幕
  • 1篇信息检索
  • 1篇音乐
  • 1篇音乐节
  • 1篇音乐节拍
  • 1篇声纹
  • 1篇声纹识别
  • 1篇实时跟踪算法
  • 1篇全自动

机构

  • 5篇西北工业大学

作者

  • 5篇杨玉莲
  • 5篇谢磊
  • 3篇张艳宁
  • 3篇郑李磊
  • 2篇王晓暄
  • 1篇王跃
  • 1篇芦咪咪

传媒

  • 2篇计算机应用研...
  • 1篇电子学报
  • 1篇第18届全国...

年份

  • 1篇2011
  • 4篇2009
3 条 记 录,以下是 1-5
排序方式:
中文新闻字幕自动生成系统的设计与实现
通过大词汇量连续语音识别技术对广播音频进行自动抄本(Automatic Transcription),将新闻音频转换成文本,是实现新闻结构化分割、基于内容语义访问和检索的前提。本文设计与开发了一个中文新闻字幕自动生成系统...
郑李磊谢磊王晓暄卢咪咪杨玉莲张艳宁
关键词:语音识别音频分类字幕制作
文献传递
全自动中文新闻字幕生成系统的设计与实现
2011年
本文设计与实现了一个全自动中文新闻字幕生成系统,输入为新闻视频,输出为视频对应的字幕文本.以《新闻联播》为语料,实现了音频提取、音频分类与切分、说话人识别、大词汇量连续语音识别、视频文件的播放和文本字幕的自动生成等多项功能.新闻字幕的自动生成,避免了繁重费时的人工字幕添加过程.实验表明,该系统识别率高,能够满足听障等特殊人群和特殊场合的电视新闻收视需求.
郑李磊谢磊芦咪咪王晓暄杨玉莲张艳宁
关键词:语音识别音频分类说话人识别
基于Alize工具包的广播音频播音员自动标注系统
本文设计与实现了一个基于Alize开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台《新闻联播》节目主持人以及重要说话人进行自动身份识别、分割与标注。采用Alize工具包提供的Feature Server、M...
卢咪咪谢磊郑李磊杨玉莲张艳宁
关键词:说话人识别声纹识别多媒体检索
文献传递
基于子词链的中文新闻广播故事自动分割被引量:2
2009年
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解决了在传统词链方法中由于语音识别错误(特别是词典未收录词汇)导致的相关联词之间无法匹配的问题。同时,利用各级词汇表示单元之间的互补性,如词的表义确定性和子词对语音识别错误的鲁棒性,对各级词汇进行融合,利用不同级别词汇表示单元的优势进一步提高中文新闻广播故事分割的性能。在TDT2中文标准新闻广播语料库上进行的实验表明,基于一元汉字子词链分割方法的F-mea-sure比传统词链方法提高了6.06%。基于一元和二元汉字子词链边界强度的融合可以使F-mea-sure进一步提高2.55%。基于投票法的融合可以使F-measure比传统词链方法提高9.04%。
杨玉莲谢磊
关键词:信息检索
基于自适应白化的音乐节拍实时跟踪算法被引量:1
2009年
提出一种基于自适应白化的音乐节拍实时跟踪算法。在对音乐信号进行触发点检测之前,构建音乐信号短时傅里叶变换的当前频域峰值表,对各频段的频谱幅值进行自适应加权,使各个频段保持相似的动态范围,改善音乐信号起伏变化较大时触发点检测准确性低的问题,进而提高节拍实时跟踪效果。在MIREX2006标准测试库上的节拍跟踪实验表明,自适应白化的引入可整体提高P-score,特别是对于起伏变化很大的音乐信号,节拍跟踪效果的提高非常明显。
王跃谢磊杨玉莲
共1页<1>
聚类工具0