搜索到657篇“ 语音驱动“的相关文章
一种语音驱动清扫机器人的方法、装置、设备和介质
本公开涉及智能机器人技术领域,提供了一种语音驱动清扫机器人的方法、装置、设备和介质。包括:接收清扫语音指令;将清扫语音指令转换为文本指令;将文本指令与预设指令模式进行对比,以确定调度需求;根据调度需求和当前环境规划清扫路...
吴朝博支涛
一种语音驱动的虚拟场景生成与切换方法及实现系统
本发明公开了一种语音驱动的虚拟场景生成与切换方法及实现系统,应用于元宇宙VR虚拟现实眼镜设备中,包括:通过语音识别和自然语言处理技术,识别用户的指令,实时生成或切换虚拟场景,实现个性化的场景创建和物体生成。采用边缘计算节...
杨阳王国珍彭璐
图像的语音驱动方法、装置及电子设备
本申请提出一种图像的语音驱动方法、装置及电子设备,依据原始视频中包含目标对象的至少一帧第一原始图像,对目标对象进行三维面部重建,得到目标对象的三维面部模型,在获得用于驱动原始视频中不同于第一原始图像的第二原始图像的目标语...
常新峰刘磊
一种数字冰壶运动员面部表情的语音驱动方法
本发明提出一种数字冰壶运动员面部表情的语音驱动方法。所述方法基于冰壶比赛视频建立冰壶运动员的数字人形象,并建立冰壶运动员的个性化情绪参数库,使用神经网络模型将冰壶比赛音频转换为个性化表情参数,将个性化表情参数转换为三维人...
金晶王纪龙姜宇李丹丹
语音驱动机器人嘴部开合的方法、装置、机器人、电子设备及计算机可读介质
本申请涉及一种通过语音驱动机器人嘴部开合的方法和装置、机器人,所述方法包括:步骤1,获取机器人的目标语音;步骤2,对所述目标语音进进行分帧处理,生个多个分帧音频数据,使得每个分帧音频数据的时间长度在预定时长之间;所述多个...
魏宇飞王传辉
网络训练方法及装置、语音驱动面部动画的方法及装置
本申请涉及一种网络训练方法及装置、语音驱动面部动画的方法及装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:从样本视频数据中获取目标帧图像和对应的音频数据;从目标帧图像中识别得到人脸图像,通过表情预测网络对...
徐洁
语音驱动3D虚拟人的情绪表达方法、系统及设备
本申请涉及3D虚拟人技术领域,提供一种语音驱动3D虚拟人的情绪表达方法、系统及设备,用于提高3D虚拟人情绪表达的精度。该方法从目标音频分割后的各音频片段中获取全部表情基的驱动参数,并采用情绪提取模型,根据目标音频获得的各...
赵世强刘帅杨智远吴连朋
一种利用扩散模型的语音驱动人脸图像生成方法及系统
本发明提供一种利用扩散模型的语音驱动人脸图像生成方法及系统,涉及AIGC技术领域,包括:输入驱动音频和部分人脸图像;对驱动音频和部分人脸图像分别进行特征提取,得到音频特征和图像特征;将音频特征和图像特征输入到扩散模型,生...
虞钉钉徐清王晓梅沈伟林沈旭立曹培
基于语音驱动的数字人构建方法
本发明公开了一种基于语音驱动的数字人构建方法,通过改进wav2lip模型的音频编码器、人脸编码器以及人脸解码器,用深度可分离卷积DSC和时频分解机制TFD优化音频编码器,减少模型的参数数量与计算量,同时增强模型捕捉关键特...
李翔陈仁文罗林雨赵叙扬孙青婷蔡俊威赵旭东马鸿麟张永军朱全银金圣华汤夏磊韩金婷吴丁鹏吴林燕
一种语音驱动的政务报告智能生成方法
本发明提供一种语音驱动的政务报告智能生成方法,包括以下步骤:用户通过语音输入对公文的完整要求,可以一次性输入,也可以多次输入,形式为口语,无需实现进行严谨措辞,系统首先通过语音识别技术将用户语音转换为文字,之后通过大模型...
薛庆昊王瑾李振杰耿秋实褚艳龙原振华王猛王心逸王宇晨班静娇

相关作者

谢磊
作品数:68被引量:100H指数:6
供职机构:西北工业大学航海学院
研究主题:语音识别 语音驱动 浅海 语音 麦克风
李冰锋
作品数:72被引量:109H指数:6
供职机构:河南理工大学电气工程与自动化学院
研究主题:绝缘子检测 绝缘子 注意力 语音驱动 损失函数
熊盛武
作品数:373被引量:694H指数:15
供职机构:武汉理工大学
研究主题:图像 遥感图像 哈希 注意力 电子设备
高文
作品数:886被引量:4,967H指数:38
供职机构:北京大学
研究主题:视频 图像 视频编码 宏块 AVS
曾瑞
作品数:13被引量:0H指数:0
供职机构:武汉理工大学
研究主题:视频 语音驱动 可视化方法 多模态 属性信息