清华大学信息科学技术学院人机交互与媒体集成研究所 作品数:42 被引量:183 H指数:9 相关作者: 张勇 李云浩 戢谚弘 更多>> 相关机构: 南京理工大学计算机科学与技术学院计算机系统理论与技术系 南京理工大学计算机科学与技术学院 中国人民解放军军械工程学院控制工程系 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 电子电信 语言文字 经济管理 更多>>
宽带流媒体服务器与传输体系 2003年 流式媒体的发展现状 多媒体和网络的交叉领域流媒体(Streaming Media)是当前宽带网络应用发展的必然结果,流媒体的应用系统、国际标准和基础研究正成为目前产业界和科研机构密切关注的焦点。第三代无线通信系统(3G),以及未来的宽带无线通信网络,均以提供高速接入和多媒体服务为特征。高接入带宽为无线网络多媒体服务提供了物质基础。 钟玉琢 孙立峰关键词:宽带网 流媒体 服务器 合成语音自然度客观测度 被引量:6 2005年 目前合成语音的自然度有待提高,论文根据目前的研究现状提出了一种合成语音自然度的客观评价方法,该方法主要从语音韵律特征的主要参数出发,计算同一发音人的自然语音和合成语音之间的基频、时长、音强等参数的差距,其中由于两种语音基频时间不匹配,所以采用DTW(Dynamic Time Warping)算法来对两种语音的基频进行了时间弯折对准。最后再将计算结果与主观评测(MOS)的结果进行比较。实验数据表明,论文提出的基频曲线失真测度与MOS之间具有很强的相关性,从韵律特征角度给出的评价结果能够衡量合成语音的自然度。 赵博 蔡莲红关键词:语音合成 评测 基于方向特征的二值商标图像检索方法 被引量:14 2003年 文中针对二值商标图像,提出一种基于方向特征的商标图像检索方法。用边界方向直方图表示目标的边界方向特征,图像的相似性度量采用直方图求交算法;用区域方向直方图表示目标的区域方向特征,图像的相似性程度用直方图的相关距离来度量。这两者结合起来得到的方向特征可以同时反映图像的整体形状和轮廓形状。实验表明,方向特征能够有效地描述图像的形状及空间分布信息,取得了令人满意的检索结果。 郭丽 黄元元 孙兴华 杨静宇关键词:商标图像检索 基于自适应肤色建模的视频人脸检测和检索 本文将模板和肤色信息有机结合,建立了自适应的肤色模型用于视频人脸检测,并合理组织多条线索对肤色区域进行人脸检验.所建立的肤色模型既具有对当前视频的针对性,又无须参考预定义的肤色范围,因而对彩色偏移的视频都适用.同时本文采... 黄玫 徐光 艾海舟关键词:人脸检测 人脸检索 人脸识别 文献传递 基于统计模型的韵律建模方法 陶建华 蔡莲红 吴志勇汉语语音合成中的文本分析和韵律处理 本文通过阐述新一代汉语语音合成系统中文本分析、短语合并、韵律代价函数及韵律代价函数在语音基元选取中的体现,从而较为详细的分析了现代汉语语音合成系统的工作流程和有关的关键技术.指出传统意义上文本分析模型,无法体现语音合成中... 陶建华 蔡莲红 赵晟关键词:汉语语音合成 文本分析 文献传递 将计算融入环境——认识无所不在的计算与智能环境 被引量:3 2001年 网络及多媒体技术的出现使计算机从实验室、办公室进入了人们的教育、娱乐和生活,但到目前为止,人机交互的方式仍未摆脱以计算机为中心的桌面计算的模式,计算机并没有充分地与人的生活环境融合在一起。无所不在计算技术的研究和探索将致力于突破这一瓶颈,使计算机更贴近我们的生活。 清华大学计算机系人机交互与媒体集成研究所徐光祐教授将阐述无所不在的计算时代的一个全新研究方向——智能环境。智能环境是一种嵌入了多种感知、计算设备的物理空间,能够根据上下文识别人的身体姿态、手势、语音等,进而判断出人的意图,以有效提高人们的工作和生活质量。本文提出的分布侍候式计算正是实现这种环境的一种途径。 徐光祐 史元春 谢伟凯 蒋长浩关键词:计算机 智能环境 计算技术 人机交互技术 一种基于背景模型的自适应的对话语流切分方法 本文提出了一种无需先验知识的基于背景模型分段自适应的说话人建模方法,并用于对话语流的切分.该方法首先构建能够描述整体样本语音(包括混合语音)的高斯模型,然后'有效'选择语音段并运用MAP自适应算法产生新的说话人初始模型,... 符铁砚 邓就庆 胡起秀 徐光祐关键词:自适应迭代 建模方法 文献传递 MPEG-4中sprite编码研究与实现 本文对MPEG-4中sprite的视频压缩编码方法进行了研究,尤其是对静态和动态sprite编码中的核心技术进行了探讨,并将这种编码方法和传统块运动补偿编码方法进行了比较,分析了sprite中的运动估计,运动矢量编码,编... 贺玉文 赵学军 钟玉琢 杨士强关键词:视频编码 图像压缩编码 文献传递 视频语义物体的分割与跟踪 提出并实现了一个对视频序列中的语义物体进行分割和跟踪的系统,从视频序列的各帧中提取所关注的物体的轮廓。流程分两个步骤:初始帧的物体分割和后续帧的物体跟踪。在手工勾画和修正算法帮助下,获得初始帧中所关注物体的轮廓;应用光流... 曹翔 徐光佑关键词:光流估计 文献传递