针对Kubernetes内置弹性伸缩策略导致Pod水平扩容存在响应延迟,从而导致应用服务质量(Quality of Service,QoS)下降的问题。对Kubernetes进行了深入研究,提出了一种预测与响应相结合的弹性伸缩策略(PR策略)对原内置策略进行优化。该策略采用基于变分模态分解(Variable Modal Decomposition,VMD)和长短期记忆网络(Long Short Term Memory,LSTM)相结合的组合模型进行Pod扩容量预测。VMD-LSTM模型采用VMD对原始时间序列进行分解,通过自适应的方式将非平稳性数据变为较为平稳的数据,同时将分解后各分量输入LSTM进行预测,然后相加各分量的预测值得到最终预测结果,Kubernetes根据预测结果进行伸缩操作。在阿里云Clustertrace-v2018部分数据集上进行模型精确度实验,发现与单一模型ARIMA、BRR、LSTM、组合模型GRU-LSTM、EMD-LSTM相比,VMD-LSTM具有更高的预测精度。由于预测模型可能会出现一定误差,并且负载可能会突然增加到达峰值,故在扩容阶段引入响应式算法弥补预测式算法的不足。实验结果表明,相比Kubernetes内置弹性伸缩策略,所提策略能够降低响应延迟时间和提高QoS。