Logo Lab-STICCDes capteurs à la connaissance : Communiquer et décider

A l'intersection entre théorie du codage et de l'apprentissage: Acceptation du projet CoLearn (Coding for Learning) par le Labex CominLabs

| CODES   SI3  

Chaque minute, 500 heures de vidéo sont téléchargées sur Youtube, et 240 000 images sont ajoutées sur Facebook. Comme il est physiquement impossible que cette énorme masse de données soit entièrement traitée et visualisée par des humains, il est absolument nécessaire de s'appuyer sur des méthodes avancées d'apprentissage automatique pour trier, organiser et recommander le contenu aux utilisateurs. Cependant, la transmission des données de l'endroit où elles sont collectées vers le serveur où elles sont traitées doit être effectuée comme une étape préliminaire. Le cadre conventionnel de transmission des données suppose que les données doivent être complètement reconstruites, même avec quelques distorsions, par le serveur. Cette thèse vise plutôt à développer un nouveau cadre de communication dans lequel le serveur peut également appliquer une tâche d'apprentissage sur les données codées. Nous souhaitons développer une analyse théorique de l'information afin de comprendre les limites fondamentales de tels systèmes, et développer de nouvelles techniques de codage permettant à la fois l'apprentissage et la reconstruction des données à partir des données codées.

Le projet CoLearn sera piloté par Elsa Dupraz, laboratoire Lab-STICC, équipe CODES. C'est le résultat d'une collaboration entre le Lab-STICC (équipes CODES and SI3), l'INRIA Rennes (équipe SIROCCO), et l'IETR (équipe SYSCOM).

Une thèse va être lancée en lien avec le projet, portant sur la théorie de l'information et le codage source-canal pour l'apprentissage automatique. Plus d'information en suivant ce lien.


Toutes les actualités