您的位置: 专家智库 > >

刘斌

作品数:77 被引量:69H指数:5
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:自动化与计算机技术电子电信文化科学天文地球更多>>

文献类型

  • 61篇专利
  • 10篇期刊文章
  • 4篇会议论文
  • 1篇学位论文
  • 1篇科技成果

领域

  • 15篇自动化与计算...
  • 12篇电子电信
  • 1篇天文地球
  • 1篇文化科学

主题

  • 25篇语音
  • 19篇视频
  • 13篇神经网
  • 13篇神经网络
  • 12篇音频
  • 12篇视频特征
  • 12篇网络
  • 11篇多模态
  • 9篇情感
  • 9篇情感识别
  • 8篇信号
  • 8篇音频特征
  • 8篇音视频
  • 8篇表情
  • 6篇抑郁
  • 6篇语音识别
  • 6篇人脸
  • 6篇速率
  • 6篇表情识别
  • 5篇语音合成

机构

  • 77篇中国科学院自...
  • 4篇北京市城市规...
  • 4篇中国科学院大...
  • 3篇中国科学院
  • 2篇中国科学院脑...
  • 1篇安徽大学
  • 1篇北京科技大学
  • 1篇北京理工大学
  • 1篇清华大学
  • 1篇山东大学
  • 1篇河北工业大学
  • 1篇浙江大学
  • 1篇中国科学院软...
  • 1篇中国电子技术...

作者

  • 77篇刘斌
  • 65篇陶建华
  • 8篇温正棋
  • 5篇杨明浩
  • 5篇易江燕
  • 4篇杜立群
  • 3篇莫福源
  • 3篇李昊
  • 2篇高辉
  • 2篇汤淑敏
  • 2篇姚庆明
  • 2篇李雅
  • 2篇张楠
  • 2篇王飞跃
  • 2篇郑晓龙
  • 2篇张大伟
  • 2篇张步青
  • 2篇潘诗锋
  • 1篇吕钊
  • 1篇高廷丽

传媒

  • 4篇信号处理
  • 1篇清华大学学报...
  • 1篇软件学报
  • 1篇计算机辅助设...
  • 1篇信息技术与标...
  • 1篇中国图象图形...
  • 1篇人工智能
  • 1篇第十六届全国...
  • 1篇第十三届全国...
  • 1篇第十四届全国...

年份

  • 4篇2022
  • 42篇2021
  • 3篇2020
  • 5篇2019
  • 3篇2018
  • 4篇2017
  • 1篇2016
  • 3篇2015
  • 4篇2014
  • 4篇2013
  • 1篇2012
  • 1篇2010
  • 2篇2009
77 条 记 录,以下是 1-10
排序方式:
语音带宽扩展模型的训练方法及语音带宽扩展方法
本发明公开了一种语音带宽扩展模型的训练方法和语音带宽扩展方法。其中,语音带宽扩展方法包括:获取待扩展窄带语音;计算所述待扩展窄带语音的幅值谱和相位谱,并提取所述待扩展窄带语音的辅助特征;采用训练后的所述语音带宽扩展模型对...
陶建华刘斌
文献传递
基于融合深度特征的微表情识别方法
本申请涉及基于融合深度特征的微表情识别方法,包括:输入微表情视频文件,得到仅包含人脸的微表情帧序列;对微表情序列归一化和灰度化,得到微表情预处理序列;掩盖微表情预处理序列中不活跃的区域,得到微表情活跃帧序列;使用光流法对...
陶建华佘文祥刘斌连政
文献传递
基于动态贝叶斯网络的智能空间行为识别研究
嵌入式计算、通信技术发展的结果促使与物理过程交互的网络化嵌入式系统的发展,由此而引发的”深度互联”的网络化系统促使智能空间系统的发展。智能空间系统中非常重要的是实现从网络化嵌入式系统采集的原始数据推理出高层的行动和目标,...
刘斌
一种生理信号预测方法
本申请涉及一种生理信号预测方法,包括:采集视频文件,视频文件中包含有长时视频,视频的文件内容含有单个人的面部和真实生理信号数据;将单个长时视频分割成多段短时视频片段,每段短时视频片段具有固定帧数,并且每段短时视频片段对应...
陶建华何宇刘斌孙立才
文献传递
多模态融合的心理压力分析方法
本发明提供多模态融合的心理压力分析方法,包括:把长的音视频切分为带有面部和语音的短音视频,并对短音视频进行分帧处理,得到图像序列和语音信号;对图像序列进行面部特征提取,得到面部帧序列;应用光流法对所述面部帧序列的相邻帧提...
陶建华何宇刘斌连政
文献传递
联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法被引量:11
2017年
本文提出了一种联合长短时记忆递归神经网络和非负矩阵分解方法对单通道语音进行混响消除;对语音信号的对数功率谱建模抑制混响干扰。首先通过长短时记忆递归神经网络估计对数功率谱,这种模型结构能捕获整个音频序列的信息重构纯净语音的对数功率谱,然后通过非负矩阵分解方法对重构的对数功率谱进行后处理抑制过平滑问题;实验结果表明所提方法可以有效抑制语音信号中的混响干扰,本文方法的各种性能指标优于基线方法。
刘斌陶建华
关键词:非负矩阵分解
一种语音数据的编码及解码方法
本发明提供了一种语音数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过端点检测剔除原始音频中的非语音数据,获得语音段数据;对每帧语音数据提取谱参数、基音周期等参数,并计算连续多帧语音数据的增益均值,通过矢量码本...
陶建华刘斌莫福源
文献传递
一种高效的语音检测方法
本发明公开了一种语音检测方法,该方法包括以下步骤:在时域上分析原始音频的短时能量和短时过零率,剔除其中的部分非语音信号;在频域上分析保留下来的音频信号子带的谱包络特性和子带的熵特性,进一步剔除其中的部分非语音信号;将保留...
陶建华刘斌
文献传递
面向窄带通信的极低速率语音编码算法研究
提出了一种面向窄带通信的极低速率参数语音编码算法.在2.4kbps MELP标准的基础上结合听觉感知,对线谱对参数进行联合矢量量化、对基音周期进行内插和非线性量化、对能量参数进行高效压缩,可以使语音数据在0.5kbps下...
刘斌陶建华莫福源
关键词:矢量量化信号传输窄带通信
文献传递
面向交互场景的自动谎言检测方法、装置、设备及介质
本申请实施例涉及一种面向交互场景的自动谎言检测方法、装置、设备及介质,旨在提高自动谎言检测的准确率。所述方法包括:将待测样片分别按照视频、音频和文本这三个模态进行切分,提取出这三个模态的短时特征,将待测样片中每句对话中三...
陶建华连政刘斌孙立才
文献传递
共8页<12345678>
聚类工具0