Apprentissage sur flux de données avec détection de changements

Encadrants : 

Occurrences : 

2018

Nombre d'étudiants minimum: 

4

Nombre d'étudiants maximum: 

4

Nombre d'instances : 

1

Les nouvelles sources de génération de données (l’internet des objets et les réseaux sociaux en particulier) ont conduit dans les dernières années à l’émergence d’une nouvelle problématique : le traitement de flux de données. Un certain nombre de contraintes distinguent ce problème des modèles plus classiques d’apprentissage : l’impossibilité de stocker l’intégralité des données en mémoire, la nécessité d’une adaptation rapide aux nouvelles entrées, mais aussi le changement des concepts au cours du temps (par exemple, les comportements des utilisateurs sur Amazon varient au cours de l’année).

Le but de ce projet est de proposer une approche simple pour gérer les flux de données : cette approche combine une modélisation précise des données et un algorithme performant de « détection de changements ». Deux applications sont proposées : analyse de textes (topic modeling) au cours du temps et recommandation de produits à des utilisateurs.

Ce projet requiert des bases en programmation et en probabilités, et permet une découverte de problématiques réelles et actuelles dans le domaine du traitement de l’information.