设为首页 | 加入收藏 |
产学研

Data Lab|基于深度学习的自动售货机运营数据预测分析

2026.05.30            浏览量:


前言




在数智化浪潮席卷全球的今天,AI及数据科学已成为推动社会进步和行业发展的关键力量。为了进一步促进教师队伍提升科研与社会服务能力,高质量反哺应用型人才培养,并助力区域数智化发展,数据科学学院推出“Data Lab”系列专栏。本系列旨在报道分院教师队伍在行业洞察、政策解读、数智分析、案例研究以及人才培养等方面的研究成果和思考。通过“以研促教,以教促学”的策略,展现教师在科学研究、教育教学以及AI数据应用中的综合素养,为行业、企业的未来发展贡献智慧与力量。





作者简介



65F33

经济统计学专业教师 何黎松


研究方向:机器学习、大语言模型及应用等,在《计算机科学与探索》、《Journal of Hospitality and Tourism Management》等刊物上发表了多篇论文。


主讲课程:《机器学习》《文本信息处理与应用》等。


2E555

经济统计学专业2022级学生 马妍


熟练运用Python、SQL、SPSS等工具进行经济数据的清洗、处理与可视化,擅长结合商业智能分析与机器学习方法开展数据挖掘,能够从海量经济运营数据中提取有价值的统计规律与业务洞察。在校期间积极参与相关项目,积累了从数据采集、统计分析到经济预测的完整实践经验。


一、研究背景

在新零售与数字经济快速发展的背景下,自动售货机行业正加速向智能化、精细化运营转型。然而,以咖啡为代表的即时饮品,由于时效性强、需求波动大、原材料保质期短等特点,传统依赖人工经验的管理模式难以应对复杂的市场变化,且缺少对需求不确定性及多因素耦合影响的量化分析,无法满足精细化管理要求。


西安欧亚学院立足区域发展需求,以“新服务、新零售、新传媒”为核心抓手践行“三新”发展战略,其聚焦数据驱动、线上线下融合、人工智能与大数据技术赋能的新型零售商业形态构建的“新零售”与自动售货机咖啡品类的运营数据预测场景高度契合。


基于此,本文以自动售货机咖啡品类为研究对象,探索基于深度学习的运营数据预测方法。研究首先对比了ARIMA、LightGBM、XGBoost及TabTransformer等基线模型的预测性能,发现梯度提升树模型效果显著。在此基础上,本文提出并构建了QuantumStack AI Forecaster™集成预测框架。该框架融合STL时序分解、多层次特征工程、异构基模型并行建模、基于RidgeCV的动态加权融合以及滚动预测与残差自助法不确定性量化机制,最终实现对未来30天日销售额的高精度预测,并给出可视化置信区间。研究为自动售货机智能补货、库存优化等决策提供了数据驱动的技术方案,助力行业从“经验驱动”迈向“数据驱动”


二、核心方法介绍

本文提出了QuantumStack AI ForecasterTM集成预测框架,核心方法包括五个方面。第一,STL时序分解:将原始日销售额序列分解为趋势、季节和残差三部分,增强模型对数据生成机制的理解。第二,多层次增强型特征工程:构造时间特征(星期、月份、正余弦编码)、多尺度滞后特征、滚动统计量(均值、方差、局部趋势斜率)等。第三,异构基模型并行建模:同时训练LightGBM、XGBoost、RandomForest和TabTransformer,分别捕捉线性、非线性、局部及全局关系。第四,基于RidgeCV的动态加权融合:以各基模型预测结果为自变量,真实销售为因变量,训练带交叉验证的岭回归模型,自动优化权重。第五,滚动预测与不确定性量化:采用滚动方式逐日预测未来30天,避免误差累积;利用残差自助法基于历史残差生成预测置信区间。


三、数据来源与预处理

数据来源于Kaggle公开数据集Index_1.csv,模拟某咖啡自动售货机2024年3月1日至2025年3月23日的交易记录,共3636条。原始字段包括交易日期、具体时间、支付方式、卡号、交易金额和咖啡名称。预处理步骤为:保留date、cash_type、money、coffee_name四个关键列;从日期中提取年份、月份、星期、季度、年中第几天、年中第几周等特征;对分类变量(支付方式、咖啡名称)进行标签编码;按时间顺序划分训练集(85%)与测试集(15%);缺失值处理方面,分类变量用众数填充,数值变量用中位数填充。


四、基于深度学习的自动售货机运营数据预测分析

4.1 基础模型预测

在咖啡销售预测任务中,本研究对比了ARIMA-auto、LightGBM、XGBoost和TabTransformer四种模型的性能,评估指标为RMSE、MAE和R²,如表2所示。结果显示,ARIMA-auto模型表现最差,RMSE和MAE分别高达189.31和163.38,R²为0.00,几乎无法解释数据变异性。LightGBM和XGBoost表现最优,RMSE仅为0.26和0.34,MAE为0.15和0.18,R²均接近1,说明预测误差小且能很好解释数据。TabTransformer介于两者之间,RMSE和MAE分别为4.74和4.27,虽远优于ARIMA-auto,但R²为0.00,表明存在过拟合或解释能力不足的问题

表 1 基础模型对比

557D


综上所述,LightGBM和XGBoost模型在咖啡销售预测任务中的表现最佳,它们不仅预测误差小,而且能够很好地解释数据的变异性。ARIMA-auto模型的表现最差,而TabTransformer模型虽然预测误差较小,但其解释能力不足,需要进一步的调整或改进。上述基础模型,都有不同的缺点凸显出来。因此,本文通过结合上述基础模型的优点以及STL季节趋势分解等算法,构建了一个新的集成框架,用以预测后续的销售数据。


4.2 QuantumStack AI ForecasterTM模型


QuantumStack AI ForecasterTM是一个端到端的多模型融合预测方案,基于历史销售数据学习,输出未来销量预测及不确定性估计,辅助自动售货机管理者优化补货与定价决策。


7FAF

图1 QuantumStack AI ForecasterTM模型流程图


QuantumStack AI ForecasterTM采用时序分解将日销量拆分为趋势、周期与残差,并结合增强特征工程(日期特征、滞后统计、分解分量等)。模型引入两层级联:第一层并行运行梯度提升树、随机森林与深度学习等基模型,第二层用线性元学习器自适应加权融合。针对多步预测,采用滚动递推避免误差累积。最终生成预测值与可视化图表,实现从数据到商业洞察的端到端智能预测。


根据基础模型的优点,我们构建了QuantumStack AI ForecasterTM模型,目的是能够更高精度的预测后续的销售数值。在完成QuantumStack AI ForecasterTM模型的构建之后,我们将其与原本选择的基础模型进行对比。

表2基础模型与QuantumStack AI ForecasterTM模型对比

3AAA


TabTransformer 与 ARIMA-auto 模型在此任务中均表现极差(R²均为0),前者完全失效,后者误差高达数百,说明数据具有复杂的非线性特征,传统统计与部分深度学习架构难以捕捉,而集成学习与 QuantumStack AI ForecasterTM 模型则能有效建模。

14CA3

图2 QuantumStack AI ForecasterTM--STL+残差自助法(Prophet-free)


使用新构建的QuantumStack AI ForecasterTM模型对未来 30 天的咖啡销售额进行了预测。从图中呈现的历史数据可以看出,这段时间的销售额波动十分明显。季节变化、节假日的影响以及各种促销活动等都对销售产生直接影响从而造成销量起伏,而这些丰富的变化也使预测模型能更好把握其中蕴含季节性和趋势性。


五、结论与对策建议

本研究基于自动售货机咖啡品类销售数据,对比了ARIMA-auto、LightGBM、XGBoost、TabTransformer等模型,发现梯度提升树模型(LightGBM、XGBoost)预测精度高且可解释性强,优于传统时序模型与部分深度学习架构。在此基础上提出的QuantumStack AI ForecasterTM集成预测框架,融合STL时序分解、多层次特征工程、异构基模型并行建模、RidgeCV动态加权融合、滚动预测及残差自助法不确定性量化,实验表明该框架的RMSE(0.14)、MAE(0.09)和R²(0.99)均优于单一模型,能有效控制多步预测误差,生成未来30天带置信区间的日销售额预测,为自动售货机从“经验驱动”转向“数据驱动”运营提供了端到端的可行方案。


未来应引入天气、周边竞品、节假日、社交媒体等外部数据,增强预测的全面性与准确性;探索模型轻量化与边缘部署,将集成模型压缩后运行于售货机本地处理器,实现实时预测与决策;拓展预测维度至SKU级销量、库存耗尽风险、设备故障率等,构建运营健康度预警系统,并与动态定价、智能补货联动,形成自动化决策闭环;同时利用SHAP等工具增强模型可解释性,通过因果推断评估促销、调价等干预措施的实际影响,为企业精细化运营提供科学依据。




参考文献



[1]Eglīte L, Birzniece I. Retail sales forecasting using deep learning: systematic literature review[J]. Complex Systems Informatics and Modeling Quarterly, 2022(30): 53-62.


[2]Cao Y, Ikenoya Y, Kawaguchi T, et al. A real-time application for the analysis of multi-purpose vending machines with machine learning[J]. Sensors,2023,23(4): 1935.


[3]Hasan M N.Predictive maintenance optimization for smart vending machines using IoT and machine learning[J]. arXiv,2025,preprint arXiv:2507.02934.


[4]王志刚,冯云超,江勇.基于深度学习的连锁超市销售预测研究[J].现代计算机,2020,(34):31-35.


[5]吴庚奇,牛东晓,耿世平,等.多价值链视角下基于深度学习算法的制造企业产品需求预测[J].科学技术与工程,2021,21(31):13413-13420.


[6]范俊明,刘洪久,胡彦蓉.基于LSTM深度学习的大豆期货价格预测[J].价格月刊,2021,(02):7-15.


[7]卢晨辉,冯硕,易爱华,等.基于深度学习的加油站销量预测与营销策略应用研究[J].郑州大学学报(工学版),2022,43(01):1-6.


[8]王泽菡,徐毓晖,王晓文.基于深度学习的电子商务销售预测[J].科技创新与应用,2024,14(23):40-43+47.


[9]刘彦虹,刘合兵,尚俊平.基于深度学习的农产品期货价格预测研究[J].河南科学,2024,42(03):430-439.


[10]李雨涵,孙景云.基于深度学习的中国黄金期货价格区间预测[J/OL].重庆工商大学学报(自然科学版),2025,10(30):1-13.





数据科学学院智研研究院,专注于行业研究、AI及数据洞察分析,依托大数据技术、人工智能与商业场景融合,为企业提供专业研究服务和定制化解决方案,欢迎合作交流。


联系人:何老师

地址:西安欧亚学院数据科学学院



------- 友情链接 -------

学校地址:陕西省西安市雁塔区东仪路8号    


Copyright 2017 Xi'an Eurasia University , All Rights Reserved , 陕ICP备13005465-1