您的位置: 专家智库 > >

清华大学信息科学技术学院人机交互与媒体集成研究所

作品数:42 被引量:183H指数:9
相关作者:张勇李云浩戢谚弘更多>>
相关机构:南京理工大学计算机科学与技术学院计算机系统理论与技术系南京理工大学计算机科学与技术学院中国人民解放军军械工程学院控制工程系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术电子电信语言文字经济管理更多>>

文献类型

  • 25篇期刊文章
  • 17篇会议论文

领域

  • 25篇自动化与计算...
  • 17篇电子电信
  • 3篇语言文字
  • 1篇经济管理
  • 1篇电气工程
  • 1篇轻工技术与工...

主题

  • 9篇视频
  • 8篇图像
  • 6篇语音
  • 6篇计算机
  • 3篇语音合成
  • 3篇商标
  • 3篇图像处理
  • 3篇网络
  • 3篇建模方法
  • 2篇多媒体
  • 2篇多模态
  • 2篇信号
  • 2篇语音学
  • 2篇韵律
  • 2篇韵律研究
  • 2篇人脸
  • 2篇人脸检索
  • 2篇商标图像
  • 2篇商标图像检索
  • 2篇视频编码

机构

  • 42篇清华大学
  • 5篇南京理工大学
  • 1篇天津广播电视...
  • 1篇中国人民解放...
  • 1篇中国人民大学

作者

  • 15篇钟玉琢
  • 7篇蔡莲红
  • 7篇徐光祐
  • 6篇杨士强
  • 6篇陶建华
  • 6篇孙兴华
  • 5篇孙立峰
  • 5篇杨静宇
  • 5篇郭丽
  • 3篇祁妍军
  • 3篇贺玉文
  • 3篇史元春
  • 3篇田淑珍
  • 3篇黄元元
  • 2篇赵学军
  • 2篇赵晟
  • 2篇赵博
  • 2篇王正群
  • 2篇黄玫
  • 2篇龙白滔

传媒

  • 5篇小型微型计算...
  • 3篇中国图象图形...
  • 3篇软件学报
  • 3篇计算机工程与...
  • 3篇第九届全国多...
  • 2篇第十二届全国...
  • 1篇微电脑世界
  • 1篇中国传媒科技
  • 1篇模式识别与人...
  • 1篇电子学报
  • 1篇计算机学报
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇高技术通讯
  • 1篇计算机系统应...
  • 1篇中文信息学报
  • 1篇当代通信
  • 1篇2003中国...
  • 1篇863计划智...
  • 1篇第三届全国C...

年份

  • 5篇2005
  • 5篇2004
  • 7篇2003
  • 9篇2002
  • 11篇2001
  • 5篇2000
42 条 记 录,以下是 1-10
排序方式:
宽带流媒体服务器与传输体系
2003年
流式媒体的发展现状 多媒体和网络的交叉领域流媒体(Streaming Media)是当前宽带网络应用发展的必然结果,流媒体的应用系统、国际标准和基础研究正成为目前产业界和科研机构密切关注的焦点。第三代无线通信系统(3G),以及未来的宽带无线通信网络,均以提供高速接入和多媒体服务为特征。高接入带宽为无线网络多媒体服务提供了物质基础。
钟玉琢孙立峰
关键词:宽带网流媒体服务器
合成语音自然度客观测度被引量:6
2005年
目前合成语音的自然度有待提高,论文根据目前的研究现状提出了一种合成语音自然度的客观评价方法,该方法主要从语音韵律特征的主要参数出发,计算同一发音人的自然语音和合成语音之间的基频、时长、音强等参数的差距,其中由于两种语音基频时间不匹配,所以采用DTW(Dynamic Time Warping)算法来对两种语音的基频进行了时间弯折对准。最后再将计算结果与主观评测(MOS)的结果进行比较。实验数据表明,论文提出的基频曲线失真测度与MOS之间具有很强的相关性,从韵律特征角度给出的评价结果能够衡量合成语音的自然度。
赵博蔡莲红
关键词:语音合成评测
基于方向特征的二值商标图像检索方法被引量:14
2003年
文中针对二值商标图像,提出一种基于方向特征的商标图像检索方法。用边界方向直方图表示目标的边界方向特征,图像的相似性度量采用直方图求交算法;用区域方向直方图表示目标的区域方向特征,图像的相似性程度用直方图的相关距离来度量。这两者结合起来得到的方向特征可以同时反映图像的整体形状和轮廓形状。实验表明,方向特征能够有效地描述图像的形状及空间分布信息,取得了令人满意的检索结果。
郭丽黄元元孙兴华杨静宇
关键词:商标图像检索
基于自适应肤色建模的视频人脸检测和检索
本文将模板和肤色信息有机结合,建立了自适应的肤色模型用于视频人脸检测,并合理组织多条线索对肤色区域进行人脸检验.所建立的肤色模型既具有对当前视频的针对性,又无须参考预定义的肤色范围,因而对彩色偏移的视频都适用.同时本文采...
黄玫徐光艾海舟
关键词:人脸检测人脸检索人脸识别
文献传递
基于统计模型的韵律建模方法
陶建华蔡莲红吴志勇
汉语语音合成中的文本分析和韵律处理
本文通过阐述新一代汉语语音合成系统中文本分析、短语合并、韵律代价函数及韵律代价函数在语音基元选取中的体现,从而较为详细的分析了现代汉语语音合成系统的工作流程和有关的关键技术.指出传统意义上文本分析模型,无法体现语音合成中...
陶建华蔡莲红赵晟
关键词:汉语语音合成文本分析
文献传递
将计算融入环境——认识无所不在的计算与智能环境被引量:3
2001年
网络及多媒体技术的出现使计算机从实验室、办公室进入了人们的教育、娱乐和生活,但到目前为止,人机交互的方式仍未摆脱以计算机为中心的桌面计算的模式,计算机并没有充分地与人的生活环境融合在一起。无所不在计算技术的研究和探索将致力于突破这一瓶颈,使计算机更贴近我们的生活。 清华大学计算机系人机交互与媒体集成研究所徐光祐教授将阐述无所不在的计算时代的一个全新研究方向——智能环境。智能环境是一种嵌入了多种感知、计算设备的物理空间,能够根据上下文识别人的身体姿态、手势、语音等,进而判断出人的意图,以有效提高人们的工作和生活质量。本文提出的分布侍候式计算正是实现这种环境的一种途径。
徐光祐史元春谢伟凯蒋长浩
关键词:计算机智能环境计算技术人机交互技术
一种基于背景模型的自适应的对话语流切分方法
本文提出了一种无需先验知识的基于背景模型分段自适应的说话人建模方法,并用于对话语流的切分.该方法首先构建能够描述整体样本语音(包括混合语音)的高斯模型,然后'有效'选择语音段并运用MAP自适应算法产生新的说话人初始模型,...
符铁砚邓就庆胡起秀徐光祐
关键词:自适应迭代建模方法
文献传递
MPEG-4中sprite编码研究与实现
本文对MPEG-4中sprite的视频压缩编码方法进行了研究,尤其是对静态和动态sprite编码中的核心技术进行了探讨,并将这种编码方法和传统块运动补偿编码方法进行了比较,分析了sprite中的运动估计,运动矢量编码,编...
贺玉文赵学军钟玉琢杨士强
关键词:视频编码图像压缩编码
文献传递
视频语义物体的分割与跟踪
提出并实现了一个对视频序列中的语义物体进行分割和跟踪的系统,从视频序列的各帧中提取所关注的物体的轮廓。流程分两个步骤:初始帧的物体分割和后续帧的物体跟踪。在手工勾画和修正算法帮助下,获得初始帧中所关注物体的轮廓;应用光流...
曹翔徐光佑
关键词:光流估计
文献传递
共5页<12345>
聚类工具0