2025年4月27日
星期日
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
搜索到
657
篇“
语音驱动
“的相关文章
资源类型:
全部数字资源类型
期刊文章
政策法规
学位论文
专利
会议论文
标准
专著
科技成果
产品样本
科技报告
全部数字资源类型
全部数字资源类型
期刊文章
政策法规
学位论文
专利
会议论文
标准
专著
科技成果
产品样本
科技报告
排序方式:
相关度排序
被引量排序
时效性降序
时效性升序
相关度排序
相关度排序
被引量排序
时效性降序
时效性升序
一种
语音
驱动
清扫机器人的方法、装置、设备和介质
本公开涉及智能机器人技术领域,提供了一种
语音
驱动
清扫机器人的方法、装置、设备和介质。包括:接收清扫
语音
指令;将清扫
语音
指令转换为文本指令;将文本指令与预设指令模式进行对比,以确定调度需求;根据调度需求和当前环境规划清扫路...
吴朝博
支涛
一种
语音
驱动
的虚拟场景生成与切换方法及实现系统
本发明公开了一种
语音
驱动
的虚拟场景生成与切换方法及实现系统,应用于元宇宙VR虚拟现实眼镜设备中,包括:通过
语音
识别和自然语言处理技术,识别用户的指令,实时生成或切换虚拟场景,实现个性化的场景创建和物体生成。采用边缘计算节...
杨阳
王国珍
彭璐
图像的
语音
驱动
方法、装置及电子设备
本申请提出一种图像的
语音
驱动
方法、装置及电子设备,依据原始视频中包含目标对象的至少一帧第一原始图像,对目标对象进行三维面部重建,得到目标对象的三维面部模型,在获得用于
驱动
原始视频中不同于第一原始图像的第二原始图像的目标语...
常新峰
刘磊
一种数字冰壶运动员面部表情的
语音
驱动
方法
本发明提出一种数字冰壶运动员面部表情的
语音
驱动
方法。所述方法基于冰壶比赛视频建立冰壶运动员的数字人形象,并建立冰壶运动员的个性化情绪参数库,使用神经网络模型将冰壶比赛音频转换为个性化表情参数,将个性化表情参数转换为三维人...
金晶
王纪龙
姜宇
李丹丹
语音
驱动
机器人嘴部开合的方法、装置、机器人、电子设备及计算机可读介质
本申请涉及一种通过
语音
驱动
机器人嘴部开合的方法和装置、机器人,所述方法包括:步骤1,获取机器人的目标
语音
;步骤2,对所述目标
语音
进进行分帧处理,生个多个分帧音频数据,使得每个分帧音频数据的时间长度在预定时长之间;所述多个...
魏宇飞
王传辉
网络训练方法及装置、
语音
驱动
面部动画的方法及装置
本申请涉及一种网络训练方法及装置、
语音
驱动
面部动画的方法及装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:从样本视频数据中获取目标帧图像和对应的音频数据;从目标帧图像中识别得到人脸图像,通过表情预测网络对...
徐洁
语音
驱动
3D虚拟人的情绪表达方法、系统及设备
本申请涉及3D虚拟人技术领域,提供一种
语音
驱动
3D虚拟人的情绪表达方法、系统及设备,用于提高3D虚拟人情绪表达的精度。该方法从目标音频分割后的各音频片段中获取全部表情基的
驱动
参数,并采用情绪提取模型,根据目标音频获得的各...
赵世强
刘帅
杨智远
吴连朋
一种利用扩散模型的
语音
驱动
人脸图像生成方法及系统
本发明提供一种利用扩散模型的
语音
驱动
人脸图像生成方法及系统,涉及AIGC技术领域,包括:输入
驱动
音频和部分人脸图像;对
驱动
音频和部分人脸图像分别进行特征提取,得到音频特征和图像特征;将音频特征和图像特征输入到扩散模型,生...
虞钉钉
徐清
王晓梅
沈伟林
沈旭立
曹培
基于
语音
驱动
的数字人构建方法
本发明公开了一种基于
语音
驱动
的数字人构建方法,通过改进wav2lip模型的音频编码器、人脸编码器以及人脸解码器,用深度可分离卷积DSC和时频分解机制TFD优化音频编码器,减少模型的参数数量与计算量,同时增强模型捕捉关键特...
李翔
陈仁文
罗林雨
赵叙扬
孙青婷
蔡俊威
赵旭东
马鸿麟
张永军
朱全银
金圣华
汤夏磊
韩金婷
吴丁鹏
吴林燕
一种
语音
驱动
的政务报告智能生成方法
本发明提供一种
语音
驱动
的政务报告智能生成方法,包括以下步骤:用户通过
语音
输入对公文的完整要求,可以一次性输入,也可以多次输入,形式为口语,无需实现进行严谨措辞,系统首先通过
语音
识别技术将用户
语音
转换为文字,之后通过大模型...
薛庆昊
王瑾
李振杰
耿秋实
褚艳龙
原振华
王猛
王心逸
王宇晨
班静娇
加载更多 ∨
相关作者
谢磊
作品数:68
被引量:100
H指数:6
供职机构:西北工业大学航海学院
研究主题:语音识别 语音驱动 浅海 语音 麦克风
李冰锋
作品数:72
被引量:109
H指数:6
供职机构:河南理工大学电气工程与自动化学院
研究主题:绝缘子检测 绝缘子 注意力 语音驱动 损失函数
熊盛武
作品数:373
被引量:694
H指数:15
供职机构:武汉理工大学
研究主题:图像 遥感图像 哈希 注意力 电子设备
高文
作品数:886
被引量:4,967
H指数:38
供职机构:北京大学
研究主题:视频 图像 视频编码 宏块 AVS
曾瑞
作品数:13
被引量:0
H指数:0
供职机构:武汉理工大学
研究主题:视频 语音驱动 可视化方法 多模态 属性信息
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张