Apprentissage de représentations en données multi-relationnelles : algorithmes et applications
Auteur / Autrice : | Alberto García Durán |
Direction : | Antoine Bordes, Yves Grandvalet |
Type : | Thèse de doctorat |
Discipline(s) : | Technologies de l'Information et des Systèmes |
Date : | Soutenance le 06/04/2016 |
Etablissement(s) : | Compiègne |
Ecole(s) doctorale(s) : | École doctorale 71, Sciences pour l'ingénieur (Compiègne) |
Partenaire(s) de recherche : | Laboratoire : Heuristique et Diagnostic des Systèmes Complexes [Compiègne] / Heudiasyc |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Internet offre une énorme quantité d’informations à portée de main et dans une telle variété de sujets, que tout le monde est en mesure d’accéder à une énorme variété de connaissances. Une telle grande quantité d’information pourrait apporter un saut en avant dans de nombreux domaines (moteurs de recherche, réponses aux questions, tâches NLP liées) si elle est bien utilisée. De cette façon, un enjeu crucial de la communauté d’intelligence artificielle a été de recueillir, d’organiser et de faire un usage intelligent de cette quantité croissante de connaissances disponibles. Heureusement, depuis un certain temps déjà des efforts importants ont été faits dans la collecte et l’organisation des connaissances, et beaucoup d’informations structurées peuvent être trouvées dans des dépôts appelés Bases des Connaissances (BCs). Freebase, Entity Graph Facebook ou Knowledge Graph de Google sont de bons exemples de BCs. Un grand problème des BCs c’est qu’ils sont loin d’êtres complets. Par exemple, dans Freebase seulement environ 30% des gens ont des informations sur leur nationalité. Cette thèse présente plusieurs méthodes pour ajouter de nouveaux liens entre les entités existantes de la BC basée sur l’apprentissage des représentations qui optimisent une fonction d’énergie définie. Ces modèles peuvent également être utilisés pour attribuer des probabilités à triples extraites du Web. On propose également une nouvelle application pour faire usage de cette information structurée pour générer des informations non structurées (spécifiquement des questions en langage naturel). On pense par rapport à ce problème comme un modèle de traduction automatique, où on n’a pas de langage correct comme entrée, mais un langage structuré. Nous adaptons le RNN codeur-décodeur à ces paramètres pour rendre possible cette traduction.