Récolte de données sur des événements

Encadrants : 

Occurrences : 

2019

Nombre d'étudiants minimum: 

3

Nombre d'étudiants maximum: 

4

Nombre d'instances : 

1

Ce projet vise à récolter sur le web, nettoyer, consolider, structurer des données sur des événements culturels passés, présents ou futurs : dates, lieux, titres, thématiques, avis…

Il permettra au groupe de découvrir et d’exploiter des techniques d’extraction de données du web. Il leur permettra aussi de découvrir comment utiliser les techniques de représentation du web sémantique.

 

Des sources d’informations seront proposées comme base, mais le dispositif mis en œuvre devrait permettre d’ajouter d’autres sources d’informations.

Si le groupe le souhaite, un travail de visualisation des données récupérées et éventuellement des interfaces de validation pourront être proposés.

Ce projet nécessitera de programmer en python en s’appuyant sur des bibliothèques et outils facilitant la plupart des traitements (ex : scrapy pour python).

Ce projet s’adresse à des étudiants désireux de se confronter à l’exploitation des données du web.