Afin de détecter les talents de demain, la Team Arkéa Samsic a eu l’idée de créer un programme novateur exploitant les données collectées par de nombreux coureurs amateurs au cours de leurs entrainements. Pour exploiter efficacement cette data, Arkéa Samsic s’est appuyée sur des services managés AWS.
Montre connectée au poignet ou smartphone dans la poche, de nombreux sportifs amateurs ou professionnels enregistrent fréquemment les données de leurs séances d’entrainement pour ensuite les analyser à l’aide d’une application.
Dans le domaine du cyclisme, des dispositifs connectés spécifiques pour les vélos permettent une étude plus approfondie de l’effort et des capacités physiques. Ce sont des capteurs de puissances, positionnés au niveau de la transmission (pédalier, moyeu, pédales) qui mesurent la vitesse, la puissance, la cadence, le couple de force, la fréquence cardiaque et l’altitude.
Jusqu’à une certaine époque on récupérait les données des capteurs des coureurs “officiels” au travers des montres connectés, aujourd’hui ces données alimentent directement des applications, telles que Training Peaks, pour réaliser un suivi des performances et élaborer des programmes d’entrainement en fonction d’objectifs à atteindre. L’utilisation de plus en plus répandue de ce type d’application aboutit à une masse de données considérable provenant de coureurs professionnels mais aussi d’une multitude de coureurs anonymes de tous âges et de toutes nationalités parmi lesquels se cachent de véritables talents.
Data : détecter les talents dans une masse de données
Dans le cyclisme moderne, le niveau est tellement élevé que tous les éléments comptent pour espérer performer. Il est donc essentiel de déceler les athlètes disposant déjà d’un très fort potentiel.
La Team Arkéa Samsic a eu l’idée de mettre en place un programme de détection de ces talents en analysant les données enregistrées régulièrement par les coureurs. Seules contraintes pour participer à ce programme : posséder un compte « Training Peaks » et être équipé d’un capteur de puissance.
Ce sont ainsi 650 candidats, de 38 nationalités différentes, qui se sont enregistrés en ligne et qui ont téléchargé toutes les données mesurées pendant leurs séances d’entrainement ou lors de compétitions entre avril et juillet 2020. Restait ensuite à exploiter cette mine d’informations pour y déceler les talents les plus prometteurs en mesurant par exemple pour un coureur sa meilleure puissance moyenne développée sur 20 minutes (le Tired 20) après un effort correspondant à une dépense de 3000 kCal.
Il était également utile de pouvoir croiser ces données avec le site public procyclingstats. Pour y réussir, la Team Arkéa Samsic s’est tournée vers les solutions managées d’Amazon Web Services, disposant ainsi des ressources informatiques appropriées tout en évitant de lourds investissements.
Arkéa Samsic et AWS unis autour de la recherche de la performance et du talent
La technologie, aussi complexe soit elle, doit savoir se faire oublier pour que l’effort porte essentiellement sur l’analyse des données. C’est tout l’intérêt du cloud et des services managés.
La Team Arkéa Samsic a créé, à l’aide de services AWS et avec le support de TeamWork, une plateforme spécifique pour le programme de détection de talents. La simplicité de ces outils a permis à Arkéa Samsic d’être autonome sur la partie intégration et architecture d’un datalake en s’appuyant sur le service Amazon S3 et la base de données Amazon DynamoDB.
Les données du datalake, alimenté par l’intermédiaire d’Amazon Kinesis, étaient ensuite extraites avec « Glue Job » à des fins d’analyse. Des modèles de Machine Learning ont pu être déployés rapidement et facilement avec Amazon Sagemaker. A la fin du processus, les directeurs sportifs et les coachs ont effectué leurs sélections, sans formation particulière, à partir de tableaux de bord interactifs créés par Amazon QuickSight.
Le traitement de ces données a été réalisé en conformité avec la RGPD et afin de respecter le droit à l’oubli un job AWS Glue spécifique a été développé pour offrir cette fonctionnalité aux coureurs qui souhaitaient se désengager du programme.