Introduction :
Les fonctionnalités de planification prédictive, notamment celle des séries temporelles, sont intégrées depuis plusieurs années dans SAP Analytics Cloud et sont utilisées par de nombreuses organisations pour rationaliser leurs processus de planification. Celles-ci permettent de générer rapidement des scénarios estimatifs basés sur des données historiques mais également sur des facteurs d’influence afin d’améliorer la précision des scénarios.
Dans la mise à jour 2024.Q1 de SAP Analytics Cloud, une nouvelle fonctionnalité a été introduite pour permettre aux utilisateurs d’effectuer une analyse individuelle des valeurs projetées et de comprendre comment ces valeurs sont composées. Cela permet d’identifier le poids des données historiques, des tendances et des influenceurs au sein de l’échantillon. Le but de cet article est d’explorer cette dernière fonctionnalité.
Scénario :
Dans cet exercice, nous allons estimer le nombre quotidien de trajets à vélo sur un corridor important de la ville de Montréal pour l’année 2023 (janvier à décembre). Pour ce scénario, deux ensembles de données historiques de 2018 à 2022 seront combinés. Le premier ensemble concerne les trajets quotidiens à vélo à travers le corridor La jeunesse-Berri-Saint-Denis (faisant partie du réseau de vélo express de Montréal), ces données sont collectées quotidiennement par un compteur de vélos situé à l’intersection Saint-Laurent/Bellechasse. Le deuxième ensemble comprend des données historiques sur les températures maximales et minimales quotidiennes en degrés Celsius, les précipitations de pluie et les quantités de neige en millimètres. Pour ce deuxième ensemble, des données estimées pour 2023 sont disponibles, elles seront utilisées comme influenceurs pour améliorer la simulation. Une fois la prévision prête, l’idée est d’approfondir et d’analyser la composition individuelle d’une valeur prévue.
Modélisation :
Pour modéliser les ensembles de données, un modèle simple nommé Bikes a été créé, comprenant 2 dimensions et 5 mesures :
Dimensions :
Date : Granularité quotidienne
Version : Réel et Prévision
Mesures :
PRCP : Précipitations de pluie (mm)
SNOW : Quantité de neige au sol (mm)
T_MIN : Température minimale (°C)
T_MAX : Température maximale (°C)
BIKES : Nombre de vélos par jour
Scénario Prédictif :
En supposant que les ensembles de données ont déjà été chargés dans le modèle, il est temps de configurer le scénario prédictif (type de série temporelle) :
Pour atteindre l’objectif du scénario, la mesure BIKES (Total des vélos) sera utilisée, la dimension Date avec un niveau de granularité quotidien, et 365 périodes de prévision :
Pour pouvoir voir l’impact des influenceurs, l’entraînement du modèle devrait être effectué avec une fenêtre d’observation d’un an jusqu’à la dernière observation. De plus, les valeurs négatives prévues seront converties en zéro (puisque des comptages négatifs de vélos ne font pas de sens) :
Enfin, ce scénario utilisera certains influenceurs tels que la température (max et min), les précipitations de pluie et la neige au sol :
Résultat Initial:
Après l’exécution de la fonction «Train and Forecast», les résultats ressemblent à ceci :
Initialement, le résultat observé est cohérent avec la tendance de l’année précédente, avec des variations significatives au jour le jour mais globalement cohérentes avec les données historiques utilisées. C’est ici qu’il est possible d’analyser valeur par valeur, comment chacune des estimations est composée, grâce à la nouvelle fonctionnalité sortie en 2024 Q1. Prenons, par exemple, le 20 janvier 2023 :
Comme nous pouvons le voir, la valeur totale suggérée par le système pour ce jour-là est de 1 086 trajets, alors que la tendance historique suggère une valeur de 2 604 trajets. Cependant, cette valeur prévue est fortement contrée par les 4 influenceurs inclus pour la prévision. La quantité de neige pour ce jour-là sera de 22 mm au sol, entraînant une diminution de 734 trajets. La température maximale pour ce jour (-1,4 °C) est le deuxième facteur responsable d’une projection de moins de trajets, combinée avec la température minimale au même moment (-6,6 °C) qui influence également le résultat. Enfin, en quatrième position, nous voyons comment des précipitations de pluie prévues pour ce jour-là (6,6 mm d’eau) ont également un impact négatif, bien que très peu significatif.
Plus généralement, nous pouvons également observer comment les influenceurs agissent en pourcentage sur le résultat final de la projection :
Ceci est important pour identifier, à travers de multiples simulations avec différentes variables, lesquelles sont les plus pertinentes pour le scénario que l’entreprise souhaite prévoir et les résultats qu’elle souhaite obtenir.
Conclusion :
Il s’agit d’une fonctionnalité et d’une amélioration importantes pour les scénarios prédictifs et la planification prédictive, car désormais les organisations pourront exécuter plusieurs scénarios avec différents influenceurs et analyser comment les données réagissent aux différentes paramétrisations, comprenant plus clairement les poids et corrélations de chaque variable dans le résultat de chaque simulation, leur permettant ainsi de mieux anticiper une prévision et de prendre des décisions plus éclairées.
Auteur : Andres Romero