Mean Shift算法在目标实时跟踪领域取得了广泛的应用,但是对于速度过快或尺度变化大的目标跟踪存在较大的缺陷。提出了一种基于Mean Shift和Kalman预测带宽的自适应跟踪算法。该算法提出以Kalman预测目标在下帧中的中心位置作为Mean Shift迭代初始位置;同时引入图像信息量度量方法以适应目标的尺度变化。实验结果表明,改进的跟踪算法能很好地跟踪尺度变化的目标,跟踪效果很好。
首先利用bidirectional encoder representations from transformers(BERT)模型的强大的语境理解能力来提取数据法律文本的深层语义特征,然后引入细粒度特征提取层,依照注意力机制,重点关注文本中与数据法律问答相关的关键部分,最后对所采集的法律问答数据集进行训练和评估.结果显示:与传统的多个单一模型相比,所提出的模型在准确度、精确度、召回率、F1分数等关键性能指标上均有提升,表明该系统能够更有效地理解和回应复杂的数据法学问题,为研究数据法学的专业人士和公众用户提供更高质量的问答服务.
为了克服基于单一视差合成的光场图像编码方法在遮挡区域无法恢复纹理细节的问题,提出一种基于多特征融合和几何感知网络的光场图像编码方法,以进一步提升遮挡场景下光场图像的压缩性能.首先,对密集光场稀疏采样,使用通用视频编码器(versatile video coding,VVC)对稀疏光场进行压缩;然后,在解码端使用2个关键分支模块,即视差估计模块和空间角度联合卷积模块,以获取光场图像全局的几何信息,确保在密集纹理和遮挡区域能够更充分地恢复特征;最后,为了挖掘2个分支融合特征的结构信息,构建了双向视图的堆栈结构,并运用几何感知的细化网络以重建高质量的密集光场.实验结果表明,与已有国际上流行的光场图像编码方法相比,所提出的方法具有显著优势.
该研究主要完成用kinect获得的"单路纹理+深度图像"来生成新的虚拟视点图像。针对深度图像的虚拟视点绘制技术(Depth Image Based Rendering,DIBR)生成的虚拟图像空洞问题,利用高斯混合模型分离前背景,背景空洞采用背景值填充,前景空洞采用改进的图像修复技术方法来填充。实验证明生成的虚拟视点图像具有较好的视觉效果。