Result: USE OF MACHINE LEARNING TOOLS AND PYTHON LIBRARIES FOR PREDICTION THROUGH REGRESSIONS

Title:
USE OF MACHINE LEARNING TOOLS AND PYTHON LIBRARIES FOR PREDICTION THROUGH REGRESSIONS
Source:
Scientific Papers of Donetsk National Technical University. Series: “Computer Engineering and Automation"; Vol1, N1(33)'2023; 4-11
Наукові праці Донецького національного технічного університету. Серія: «Обчислювальна техніка та автоматизація»; Т1, N1(33)'2023; 4-11
Publisher Information:
ДНВЗ ДонНТУ, 2024.
Publication Year:
2024
Document Type:
Academic journal Article
File Description:
application/pdf
Language:
Ukrainian
ISSN:
2075-4272
2786-9024
Rights:
CC BY NC ND
Accession Number:
edsair.scientific.p..35534cdd0367d401ad00aa2af4e5c08e
Database:
OpenAIRE

Further Information

The purpose of this work is forecasting the average check amount depending on the time spent by customers in the retail area and forecasting the average check amount based on seasonal demand characteristics considering the constant annual price growth. Forecast methods were analysed. The use of Python libraries was considered. The code was developed for solving the above-mentioned forecasting tasks through linear, polynomial and random forest regressions, specifically, the search for the dependence of the average check amount on the time spent by customers in the retail area and the dependence of the average check amount on seasonal price fluctuations over several years. A comparison of the results of linear and polynomial regression was made under conditions of smaller or larger volumes of the input data, explanations were provided regarding the appropriateness of choosing one or the other when modelling non-cyclical processes and why the random forest model provides adequate results for cyclical processes. The source code and examples of input data were shared for public access. Scientific novelty lies in the ways of applying regressions for modelling and forecasting the average check amount depending on the time customers spend in the retail area as well as the average check amount depending on seasonal demand characteristics with consideration of constant price growth. The selected examples of cyclical and non-cyclical economic phenomena are the most common ones, and practitioners face similar tasks daily. Therefore, the results of this work provide them with ready-made solutions that require minimal adaptation to practical needs. Additionally, it demonstrates the feasibility of deploying them in the AWS cloud environment and the potential for integration with various data sources and other information systems.
Мета роботи полягає в прогнозуванні середньої суми чеку в залежності від часу перебування покупців в торговельному залі та прогнозуванні середньої суми чеку в залежності від сезонних особливостей попиту з урахуванням постійного щорічного зростання цін. Проаналізовано методики з прогнозування. Розглянуто використання Python-бібліотек. Розроблено код розв’язання зазначених вище задач з прогнозування через лінійну, поліноміальну регресії та “випадковий ліс”, а саме, пошук залежності середньої суми чеку від часу, проведеному покупцями в торговельному залі, та залежності середньої суми чеку від сезонних коливань цін протягом кількох років, і відповідного прогнозування. Здійснено порівняння результатів лінійної та поліноміальної регресії за умови меншого або більшого обсягу вхідних даних, надано пояснення щодо доцільності вибору тої чи іншої при моделюванні нециклічних процесів, і чому для циклічних процесів адекватні результати дає модель “випадкового лісу”. Програмний код і приклади вхідних даних викладено у відкритий доступ. Наукова новизна полягає в шляхах застосування регресій для моделювання та прогнозування середньої суми чеку в залежності від часу перебування покупців в торговельному залі, а також середньої суми чеку в залежності від сезонних особливостей попиту з урахуванням постійного зростання цін. Обрані приклади циклічного і нециклічного економічних явищ є найпоширенішими, фахівці-практики щоденно стикаються із аналогічними завданнями, тому результати даної роботи надають їм готові рішення, що потребують мінімальної адаптації під практичні потреби, а також демонструють доступність їхнього розгортання на хмарному середовищі AWS і відповідно можливості інтеграції з різними джерелами даних та іншими інформаційними системами.