Classification de tutoriels Youtube

Encadrants : 

Occurrences : 

2017

Nombre d'étudiants minimum: 

2

Nombre d'étudiants maximum: 

2

Nombre d'instances : 

1

Ce projet a été proposé par un groupe d'étudiants. Il leur sera donc attribué d'office, sauf en cas de désistement.

Le projet a pour but de développer une plateforme web de comparaison/classification de tutoriels vidéo basée sur un système de tags participatifs.

Une partie des tags pourra être proposée automatiquement à partir des informations sur la vidéo –à partir du sous-titrage, par exemple- en utilisant des techniques de web sémantique ou à partir des tags déjà présents. Les utilisateurs pourront ensuite raffiner la classification des tutoriels en ajoutant des tags décrivant les prérequis pour suivre le tutoriel ainsi que les compétences que les utilisateurs pourront acquérir en le regardant.

Récupérer et analyser les tutoriels disponibles sur internet pour la classification automatique, définir et implémenter un système de tagging et développer l'interface utilisateur de la plateforme web.

Un marquage particulier pourra être proposé consistant en des liens vers d’autres tutoriels tels une liste de ‘pré-requis’ et une liste de ‘pour aller plus loin’.
Une attention particulière sera portée à la conservation de traces en vue d’analyse. Par exemple, pour chaque client qui assurera le taggage d’une vidéo, on gardera, bien sûr, les tags qu’il a retenu, mais aussi les tags qui lui avaient été proposés.

Ce projet nécessitera de programmer pour le Web, avec les techniques standard HTML/CSS/JS côté client et une technique au choix pour la partie serveur.
Dans le cadre de votre projet, vous devrez :

  • Calculer les coefficients TfIdf pour les documents du corpus.
  • Trouver des regroupements de mots (cluster, fusion sémantique).
  • Produire une représentation visuelle de l’importance d’un mot ou d’un ensemble de mots dans une suite de documents.

Ce projet s’adresse à des étudiants à l’aise sur le développement Web et désireux de se confronter à la manipulation de vidéo et de données associées sur le Web.