Détection d’opinions dans des conversations entre un internaute et un agent virtuel

Encadrants : 

Occurrences : 

2015

Nombre d'étudiants minimum: 

2

Nombre d'étudiants maximum: 

3

Nombre d'instances : 

1

Pour les accompagner dans leur navigation, de nombreux sites web – marchands ou de services – intègrent des agents virtuels avec lequel les internautes peuvent dialoguer en chat. Dans le cadre de ces conversations, l’utilisateur peut être amené à exprimer ses sentiments et ses goûts. Afin de pouvoir répondre de manière appropriée, l’agent doit être capable de détecter cette composante affective du discours de l’utilisateur et la distinguer de son contenu plus factuel (demande de renseignements, signalement d’un problème technique, etc).

L’objectif de ce projet est de concevoir un système permettant de classifier les énoncés de l’utilisateur selon leur tonalité affective. Ainsi, le système développé devra permettre de classer les énoncés comme positifs (par exemple, si l’utilisateur exprime sa satisfaction « j’aime beaucoup ce produit »), négatif (si l’utilisateur exprime une insatisfaction, « je ne trouve pas ça intéressant ») ou neutre si l’énoncé n’exprime pas de sentiment. Pour concevoir ce système de détection, on pourra s’inspirer des techniques d’apprentissage supervisé (Naives Bayes par exemple) développées en Sentiment Analysis et Opinion Mining pour la classification de phrases subjectives et objectives. La phase d’apprentissage du classifieur se fera sur un corpus annoté manuellement où un agent virtuel interagit avec un utilisateur humain (le corpus et les annotations sont fournis par les encadrants).

Les étudiants seront amenés à développer en python et notamment à utiliser les librairies NLTK – dédiée au traitement du texte – et SciKit Learn – librairie dédiée au data mining et au machine learning.