您的位置: 专家智库 > >

文献类型

  • 41篇中文专利

领域

  • 5篇自动化与计算...
  • 5篇文化科学

主题

  • 12篇图像
  • 10篇音频
  • 10篇语音
  • 8篇声纹
  • 8篇声纹识别
  • 8篇向量
  • 6篇音素
  • 6篇人脸
  • 6篇身份
  • 6篇图像处理
  • 4篇音频处理
  • 4篇音频数据
  • 4篇用户
  • 4篇语音识别
  • 4篇识别方法
  • 4篇图像处理方法
  • 4篇字符
  • 4篇字符串
  • 4篇后验概率
  • 4篇存储介质

机构

  • 41篇深圳市腾讯计...

作者

  • 41篇李科
  • 33篇黄飞跃
  • 31篇吴永坚
  • 24篇金星明
  • 18篇吴富章
  • 18篇李为
  • 9篇李季檩
  • 8篇朱碧磊
  • 3篇吴运声
  • 3篇董未名
  • 2篇张宇
  • 2篇谢志峰
  • 2篇唐帆
  • 2篇姚达
  • 2篇杨兵
  • 2篇于佳骏
  • 1篇王红法
  • 1篇郭晓威
  • 1篇倪辉

年份

  • 1篇2023
  • 2篇2021
  • 3篇2020
  • 14篇2019
  • 2篇2018
  • 5篇2017
  • 12篇2016
  • 2篇2015
41 条 记 录,以下是 1-10
排序方式:
一种图像检索方法、装置和存储介质
本发明实施例公开了一种图像检索方法、装置和存储介质;本发明实施例在接收用户发送的图像检索请求后,该图像检索请求携带数据库标识和需要检索的图像特征,可以获取该数据库标识对应的目标数据库,该目标数据库包括多个子库,接着,基于...
王润泽金星明邹晓园李科
身份向量处理方法和装置
本发明涉及一种身份向量处理方法和装置,所述方法包括:获取样本集合,所述样本集合包括多个说话人类别的身份向量的样本;获取所述样本集合中每个样本所对应的类间近邻样本;获取所述样本集合中每个样本所对应的类内近邻样本;根据所述样...
李为黄飞跃吴永坚吴富章李科金星明钱柄桦
一种音频数据的处理方法及装置
本发明公开了一种音频数据的处理方法和装置,该音频数据的处理方法包括:获取待分离音频数据;获取该待分离音频数据的总频谱;对该总频谱进行分离,得到分离后歌声频谱和分离后伴奏频谱,其中歌声频谱包括乐曲的歌唱部分所对应的频谱,伴...
朱碧磊李科吴永坚黄飞跃
文献传递
人脸图像的聚类方法、装置、服务器及存储介质
本发明公开了一种人脸图像的聚类方法、装置、服务器及存储介质,属于图像处理技术领域。所述方法包括:确定每张人脸图像的人脸区域和人体区域;根据从每张人脸图像的人脸区域中提取的人脸特征,对多张人脸图像进行聚类,得到多个人脸图像...
晏轶超汪铖杰李季檩葛彦昊甘振业何长伟李科金星明钱柄桦吴永坚黄飞跃吴运声
文献传递
人脸实时跟踪的方法和装置
本发明公开了一种人脸实时跟踪的方法和装置,所述方法包括步骤:在人脸跟踪时,将一个检测周期内检测到的第一帧图像中的人脸作为正样本,提取正样本特征,并在第一帧图像中的正样本区域标记人脸跟踪框;在第k帧图像中,对应于第k‑1帧...
李科姚达郑昉劢
文献传递
语音数据处理方法和装置
本发明公开了一种语音数据处理方法和装置。该方法包括:获取多个语音样本中每个语音样本的I‑Vector向量,并确定多个语音样本中的目标种子样本;分别计算目标种子样本的I‑Vector向量与目标剩余语音样本的I‑Vector...
金星明李为郑昉劢吴富章朱碧磊钱柄桦李科吴永坚黄飞跃
文献传递
一种语音识别方法及其设备
本发明实施例公开一种语音识别方法及其设备,其中方法包括如下步骤:获取基于交互应用所输入的目标音频数据;提取所述目标音频数据中的目标Filter bank特征;将所述目标音频数据中的目标Filter bank特征作为训练后...
钱柄桦吴富章李为李科吴永坚黄飞跃
文献传递
图像处理方法及装置
本发明公开一种图像处理方法及装置,本发明实施例检测输入的人像图片中的人脸区域,获取所述人脸区域对应的人脸轮廓信息,所述人脸轮廓信息包含人脸区域中的人脸轮廓关键点;根据所述人脸轮廓信息,获取所述人脸轮廓信息对应的脸型轮廓尺...
李季檩余宗桥李科
文献传递
音频识别方法及装置
本发明是关于一种音频识别方法及装置,属于音频处理技术领域。该方法包括:获取待识别音频的原始音高序列,所述原始音高序列用于指示所述待识别音频在各个时间点上的频率;将所述原始音高序列切分成多个音高子序列;对所述原始音高序列和...
金星明于佳骏李科吴永坚黄飞跃
文献传递
一种音频处理方法及装置
本发明实施例提供一种音频处理方法及装置,其中的方法可包括:获取目标音频的N(N≥1的自然数)帧音频数据;提取所述N帧音频数据中每帧音频数据的音频特征参数;根据所述音频特征参数,将所述N帧音频数据映射至K(K≥1的自然数)...
金星明李科吴永坚黄飞跃
文献传递
共5页<12345>
聚类工具0