徐光祐
- 作品数:152 被引量:2,610H指数:25
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学天文地球更多>>
- 中国多媒体技术研究:2004被引量:10
- 2005年
- 该文是中国多媒体技术研究与应用的年度文献综述之七,其是在查阅了2004年9种核心刊物的2 926篇文章的基础上,从中选取了363篇多媒体技术相关的文章进行了分类、统计,以展现出2004年中国多媒体技术发展的现状。同时,通过对比前4年的统计结果可以看到,数字水印、虚拟现实、多模态接口、多媒体信息检索、服务质量保证、计算机支持的协同工作、地理信息系统和数字地球等这些国际热门技术在国内也受到了高度的重视。该文还对5年来中国多媒体技术文献统计结果做了比较,从中可清楚地看到多媒体技术,尤其是热点技术的发展过程和发展趋势。该文不仅给从事多媒体技术研究与应用的人员提供了一个很好的文献资料的索引,也给论文作者和刊物编辑一个好的参考。
- 徐光祐贺伟晟史元春
- 关键词:多媒体虚拟现实超媒体多媒体通信CSCW无线多媒体
- 纹理约束下的人脸特征点跟踪被引量:25
- 2004年
- 将Lucas-Kanade光流跟踪算法与人脸特征点定位的统计模型DAM(direct appearance model)在Bayesian框架下结合起来,提出了视频中人脸特征点定位与跟踪的一种混合模型方法.利用Lucas-Kanade算法预测人脸特征点的位置,充分利用了帧间的相关信息,提高了跟踪的速度.通过DAM中纹理对形状的约束,在提高跟踪精度的同时增强了整个算法的鲁棒性.实验表明,这种方法可以很好地适应人脸的多种运动,可用于人脸识别或3D人脸建模.
- 宋刚艾海舟徐光祐
- 关键词:光流特征点定位特征点跟踪
- 面向流水线结构的并行匹配算法被引量:5
- 1993年
- 本文提出一种面向流水线计算机的立体视觉并行匹配算法,使立体视觉算法所需的低层视觉信息处理和特征匹配都能在具有高速视频总线的流水线计算机中完成,这样既简化了视觉系统的结构,又大大提高了处理速度.匹配中应用了排序、方向和幅度约束作为相似性判断,并根据匹配点邻域中的视差梯度,利用松弛迭代法提高匹配的可靠性.算法已在PIPE流水线计算机上实现,256×256图像的立体视觉算法可在10秒内完成.
- 徐光祐李经纬杨士强石定机
- 关键词:立体视觉
- 新闻视频显著人脸检索系统被引量:1
- 2003年
- 该文针对新闻视频设计并实现了一个显著人脸检索系统。首先将新闻视频分割成镜头序列,利用训练好的CascadeAdaboost人脸检测器对每个镜头检测出一定数目的候选人脸,按照一些规则选取可信度高的作为样本,用于提取该镜头内的肤色模型。接着对肤色分割后的区域进行位置、大小分析和模板匹配,以淘汰非人脸区域,确定待跟踪的对象列表。为了做精确的跟踪和识别,系统对每个跟踪对象建立更细致的肤色模型。跟踪过程中每间隔一定帧数重新进行人脸检测,以减少误差积累和探测是否有新人脸出现。最后从每个人脸序列挑选最适合进行人脸识别的图像建立其特征脸空间,结合肤色信息和PCA算法判断其是否为要检索的目标人脸。
- 黄玫孙兴华金国英徐光祐
- 关键词:CASCADEADABOOST人脸检索肤色模型
- 自然的人体动作识别
- 人体动作识别是计算机视觉的一个重要研究课题。目前大多数动作识别的研究都假设是在特定受限的场景下,即特定的视角、位置、对象、背景和光照条件下工作。其中,尤以要求特定的视角和位置对实际应用的限制最为严重。本文致力于研究能处理...
- 黄飞跃徐光祐
- 关键词:人体动作识别智能家居
- 中国多媒体技术研究:2002被引量:5
- 2003年
- 为了使人们对中国多媒体技术现状有个概略了解 ,特编写了中国多媒体技术研究与应用的年度文献综述之五 .通过查阅国内 2 0 0 2年 9种核心刊物的 2 76 1篇文章 ,从中选取了 4 6 4篇与多媒体技术相关的文章 ,进行分类、统计 ,同时 ,结合前 4年的统计结果 ,又将近 5年的多媒体技术文献统计结果做了比较 ,由此可清楚地看到多媒体技术 ,尤其是热点技术的发展过程和发展趋势 .该文不仅给从事多媒体技术研究与应用人员提供了一个很好的文献资料的索引 ,也给论文作者和刊物编辑人员提供了一个好的参考 .
- 徐光祐车轶史元春
- 关键词:多媒体技术文献统计
- 用于VR的全景图象建模方法及实现
- 建立环境的全景图是实现VR交互漫游的有效方法。在利用真实图象建立全景图的过程中,对拍摄条件限制越少越好,算法越简单越好。但这两方面是相互制约的:拍摄条件限制越少,摄像机的运动越复杂,求解运动方程越困难。因此根据实际情况,...
- 罗恒朱志刚徐光祐熊成宇
- 关键词:摄像机图象序列全景图象建模方法
- 面向普适计算的扩展的证据理论方法被引量:15
- 2004年
- 普适计算作为一种新型计算模式 ,从根本上改变人们对什么是计算的思考 .由于它需对多源信息进行融合 ,因此该文作者认为它是一种包含融合计算的模式 ,能通过多层次、多视角的融合 ,为人们提供更方便的信任度高的访问信息和计算服务 .基于普适计算应用的需要 ,该文讨论了扩展的证据理论方法 ,该方法采用可靠性因子评估多源证据觉察上下文信息 ;引入时效函数衡量多源证据的有效性与时间的关系 ,并将其组合到信任函数中 ,描述信任mass的时变规律 ;利用功率来度量多源证据觉察上下文信息间的相关程度 ,并通过去相关将其转化为相互独立的证据 ,扩展和完善了经典证据理论提供的方法 ,弥补了其不足之处 ,提高了不同应用场合下服务的质量 (QoS) ,确保了普适计算的服务宗旨 .利用支持普适计算模式的智能空间中的场景 ,验证了扩展的有效性 .
- 张德干徐光祐史元春赵海陈恩义
- 关键词:普适计算证据理论觉察上下文可靠性独立性
- 说话人识别中语音切分算法的研究
- 本文提出了4种语音切分新算法,在不同程度上消除了能量变化和噪声对切分的影响,应用于若干说话人识别系统,取得了良好的效果.
- 何致远胡起秀徐光祐
- 关键词:说话人识别
- 视角无关的动作识别被引量:14
- 2008年
- 人体动作识别是计算机视觉中一个流行而且重要的研究课题.当观察视角发生变化时,动作识别变得格外困难.至今为止,关于动作识别和手势识别的大多数研究工作都是围绕着视角相关的表达展开的.有一小部分利用了视角不变的表示开展研究,可是它们大多数存在一些缺陷,比如缺少用于识别的足够信息,依赖鲁棒的语义特征点的检测或者是点对应.为了解决这个问题,实现视角无关、动作人无关的动作识别,提出了"包容形状"的表示,这种表示不依赖于特定视角.在人体动作识别中,人的身体旋转通常是引起视角变化的主要原因.包容形状充分利用了两个正交摄像机拍摄的轮廓信息以去除由人的身体旋转产生的影响.从来自两个正交的摄像机拍摄的外轮廓,可以很容易计算得到包容形状.利用包容形状的体态表示和隐马尔可夫模型,取得了非特定人、任意视角下动作识别的很好的实验结果.这些实验结果也表明了包容形状包含有足够区分度的信息.同时提出了包客形状的扩展表示,以便在两个摄像机并不完全正交的更为一般的摄像机配置条件下也可以应用,这极大地加强了其实用价值.
- 黄飞跃徐光祐
- 关键词:隐马尔可夫模型