郑红娜 作品数:8 被引量:14 H指数:3 供职机构: 太原理工大学 更多>> 发文基金: 国家自然科学基金 中国科学院知识创新工程 更多>> 相关领域: 自动化与计算机技术 电子电信 环境科学与工程 文化科学 更多>>
基于语音识别的智慧分类垃圾桶研究 被引量:6 2021年 传统的智慧垃圾桶往往只采用红外传感器检测是否有人接近,当人体接近了垃圾桶,就会自动打开垃圾桶的翻盖,这样的垃圾桶不仅无法完成垃圾分类功能,也无法有效防止病毒传播。因此,旨在实现一个可以自动垃圾分类的智慧垃圾桶,该垃圾桶基于微控制器和语音识别技术,其工作过程为:首先,非特定人语音识别芯片LD3320不断检测外界语音输入并进行语音识别,接着Arduino微控制器再根据识别结果判断该垃圾所属的分类,最后指挥舵机打开相应垃圾桶的盖子。智慧分类垃圾桶不仅可以助力垃圾分类政策的实施,解决人们困扰的垃圾分类问题,而且可为疫情期间无接触式垃圾投放提供技术保障。 郑红娜关键词:物联网 语音识别 ARDUINO 垃圾分类 舵机 基于YOLO-PS的马铃薯幼苗检测方法研究 2024年 针对马铃薯幼苗检测中的关键挑战,提出一种基于YOLO-PS的目标检测模型。该模型在检测骨干中引入MobileNetV4-backbone以增强对不同状态幼苗的特征提取能力,并在检测头中引入DLKA注意力机制,从而增强模型对马铃薯幼苗局部特征的提取和关注。为优化边界框的精确定位,采用Focal Loss损失函数。利用Pyqt5设计马铃薯幼苗识别系统的交互界面,使其操作简便且可靠。通过试验验证,YOLO-PS模型在马铃薯幼苗检测任务中表现优异,在测试集上的精确率达到94.75%,召回率为95.58%,平均精确度均值高达96.67%。该模型在马铃薯幼苗检测中的有效性和优越性,也为类似作物的幼苗检测提供新方法。 郑红娜 郑红娜 王强关键词:图像处理 汉语三维发音动作合成和动态模拟 被引量:1 2013年 本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。 郑红娜 朱云 王岚 陈辉关键词:DIRICHLET 基于产教融合的项目教学实践 被引量:3 2021年 阐述智慧物联网在化工生产的环境数据采集、检测和监控中的应用,物联网技术对系统的监控,探讨适用于物联网专业课的一种教学方法。 郑红娜 郑红娜 刘慧香 张红梅关键词:智慧教育 物联网 数据采集 基于发音轨迹的可视语音合成 被引量:1 2013年 着眼于语音可视化。为呈现真实说话人各发音器官的运动,提出一种改进的CM协同发音模型,并采用该方法合成汉字的发音轨迹,进而以此驱动和控制虚拟3D音视频说话人头模型,直观呈现通常可见及不可见发音器官的发音运动。实验证明:由改进方法获得的合成发音轨迹更逼近真实发音轨迹。同时,为了定量比较舌读和唇读在语音感知和识别中的作用,设计三组感知实验,实验结果显示:叠加了唇读信息的感知识别率较单纯的加噪语音的识别率提高了25.8%;而叠加了舌读信息的识别率较单纯听觉信息的识别率提高了26.7%。因此,当语音恶化时,舌读信息可提供大于唇读信息的补充作用,且舌读信息与唇读信息一样具有识别力。 郑红娜 白静 王岚 朱云关键词:唇读 基于OneNet平台的智慧教室分析 被引量:3 2021年 基于中国移动物联网开放平台OneNet,设计并构建了一个智慧教室,它不需要触摸仅仅使用手机或电脑就可以控制教室中的智能开关设备,实时收集各类传感器采集的环境数据。 郑红娜 郑红娜关键词:物联网 ARDUINO 可视英汉计算机辅助发音训练系统 本文着眼于语音可视化,目的在于揭示真人的发音运动。首先,通过电磁发音仪(Electro Magnetic Articulography,EMA) AG500,以200帧/秒的采样率采集了真实说话人的英语及汉语的发音动作数... 郑红娜关键词:可视语音合成 文献传递 基于发音动作的中英文元音交叉语言对比研究 2016年 本文通过电磁发音仪(Electro Magnetic Articulography,EMA)AG500,以200帧/秒的采样率采集了英语和汉语的标准发音动作数据,然而,交叉语言比较的首要任务就是要消除特定说话人声道特性及其它个人生理特性等音素而引起的固有差别,本文采用了基于说话人归一化的普氏算法来进行说话人归一化处理,获得了英汉相似音素发音的元音对比最小对,最后成功揭示了2种语言易混淆元音发音文本对在口腔内外发音动作上的区别。 郑红娜