国家高技术研究发展计划(2006AA010101) 作品数:21 被引量:118 H指数:7 相关作者: 刘加 邢春晓 王克宏 董丽 张卫强 更多>> 相关机构: 清华大学 西北民族大学 北京科技大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 电子电信 经济管理 更多>>
用于稀疏数据集的协作过滤算法 被引量:2 2009年 稀疏性问题是协作过滤算法应用中的一个突出问题,当系统中用户对资源的评分数据集很稀疏的条件下,算法的精度和覆盖率会显著降低。针对这一问题,该文通过分析影响基于资源的协作过滤算法中的相似性计算的因素,提出采用"资源关系密度"作为描述协作过滤评分矩阵的一个特征指标,分析并总结了"资源关系密度"对典型的基于资源的协作过滤算法的影响,进而提出一种虚拟用户填充算法。实验结果表明,虚拟用户填充法能够有效改善典型的基于资源的协作过滤算法在稀疏数据集上的精度和覆盖率。 董丽 邢春晓 王克宏基于微分麦克风阵列的自适应语音增强算法研究及DSP实现 被引量:8 2009年 自适应滤波是语音增强算法中的常用技术,而算法复杂度与收敛速度是设计各种自适应算法需要首要考虑的问题.本文提出一种用于片上的语音增强自适应滤波新算法.该算法分两步实现,首先,利用一阶微分麦克风阵列,获得噪声的实时估计;其次,对传统的仿射投影算法(Affine projection algorithm,APA)加以改进,得到计算误差向量的快速算法,并根据估计误差动态调整搜索步长以及仿射投影维数,对带噪语音进行自适应滤波消噪.在TMS320VC5509 DSP芯片上实现该算法.实验表明,算法的自适应滤波过程具有接近递推最小二乘算法(Recursive least squares,RLS)的快速收敛速度,以及类似最小均方误差算法(Least mean squares,LMS)的低算法复杂度. 宋辉 刘加关键词:语音增强 仿射投影算法 自适应滤波 噪声消除 统一语言学中的类几何变换函数 2008年 在统一语言学语义单元理论的基础上,从类几何变换的角度对语言所蕴涵的语义知识进行分析和描述,指出不同的自然语言之间的翻译实质上是求解同一语义在不同语言上的不同表示之间的变换.以疑问句的疑问目的变换为例讨论了统一语言学中的类几何变换问题.并将疑问句根据对象和类型重新进行二维分类,同时定义六元素形式系统的变换描述语言TDL描述其可逆变换函数及双向变换算法.最后讨论了该变换函数在多语互译机器翻译系统中的应用. 胡玥 高小宇 高庆狮关键词:计算机应用 自然语言处理系统 机器翻译 基于开源的数字资源长期保存实验平台(THDP)的设计与实现 数字信息具有不稳定性和易逝性,读取数字资源的软硬件设备也随时面临过时和淘汰的危险,然而很多数字信息具有巨大的商业或学术价值,因此,数字资源的长期存取问题迫在眉睫。在遵循OAIS参考模型的前提下,利用一系列开源软件,设计了... 马宁宁 李超 姜爱蓉 邢春晓关键词:开源 DSPACE 数字资源长期保存 动态权限管理 文献传递 采用术语定义模式和多特征的新术语及定义识别方法 被引量:12 2009年 新术语及其定义抽取是信息抽取的重要研究内容之一.研究结果表明,在科技文献中,一个新术语往往伴随其定义出现,通过考察,在真实文本中,术语定义存在显著的语言表述特征,从大规模真实语料库中,通过考察术语定义构成的语言学模式、定义中词汇和术语周边的统计特征,提出了以术语定义的语言学模式(LPTD)作为待识别候选新术语集,同时考虑到有关新术语出现的上下文统计特征,用SVM分类器方法完成科技语料中新术语及其定义的识别.在大规模科技期刊上进行方法验证,开放性评测结果的精确率为90.5%、召回率达78.1%. 荀恩东 李晟关键词:信息抽取 支持向量机 支持SaaS的互联网调查表自动生成系统 随着互联网的发展,针对特定用户的互联网调查已经是一种基本的获取所需统计信息的方法。然而,对于非专业人员,编制一张互联网调查表并做相应统计非常困难。即使是专业人员,编制起来也相当繁琐。因此,如果能够向用户提供SaaS(软件... 邓泉松 张勇 邢春晓关键词:自动生成 易用性 SCA SAAS 文献传递 藏文Flv播放器的设计与实现 2012年 以设计和开发藏文Flv播放器为目的,采用了Flex技术来开发该播放器。对Flex技术进行了研究阐述,同时对藏文字体的特点作了详细的分析;对藏文Flv播放器的结构进行设计,详细分析该播放器的功能;利用Flex技术,开发了一款藏文Flv播放器,该播放器实现了藏文字体在播放器界面上正常显示和视频文件的正常播放。实验结果表明,利用Flex技术开发的藏文Flv播放器能够给用户带来更丰富、体验性更强的用户界面。 戴玉刚 刘战东关键词:藏文 FLEX技术 RIA技术 MLLR特征的SVM语种识别算法 为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对... 钟山 刘加关键词:语种识别 支持向量机 文献传递 面向文本数字化的自动纠错方法 被引量:3 2008年 为了提高文本数字化系统的质量,针对该系统的错误特点,采用频率统计树构建查错模型,结合切分信息进行标点纠错,通过表形码和缓存集给出纠错建议,提出了规则与统计结合的自动纠错方法。实验结果表明,该方法召回率为84.65%,准确率为78.89%,误判率为9.07%,能够满足数字化系统需求。 陈翔 徐平先 张玉志关键词:自动纠错 表形码 采用变步长算法的无双端检测回声消除系统 被引量:6 2010年 提出了一种新型无双端检测的自适应回声消除系统,在与传统的回声消除系统比较过程中,本系统表现出了良好的性能,不但结构简单,计算量也小。模拟双端通信实验表明,该自适应滤波器工作正常,回声消除性能好,减少了采用传统的回声消除算法中双端检测错误造成语音切音现象和回声消除不干净的状况。 谢鹏 刘加关键词:自适应滤波器 回声消除