Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français

par Sandrine Ollinger

Thèse de doctorat en Sciences du langage

Sous la direction de Alain Polguère.

Soutenue le 15-12-2014

à l'Université de Lorraine , dans le cadre de Ecole doctorale Stanislas (Nancy-Metz) , en partenariat avec Analyse et traitement informatique de la langue française (Nancy) (laboratoire) .

Le président du jury était Jean-Marie Pierrel.

Le jury était composé de Marie Candito, Bruno Gaume.

Les rapporteurs étaient Sylvain Kahane, Mathieu Lafourcade.


  • Résumé

    La lexicographie contemporaine met à disposition des ressources offrant de multiples possibilités d’exploitation automatique. Ainsi, le Réseau Lexical du Français, en cours d’élaboration, est un graphe monolingue, constitué de sommets, entre lesquels sont encodées des relations syntaxico-sémantiques. Cette thèse s’intéresse à son exploration par raisonnement analogique. Elle débute par une revue de la formalisation et de l’informatisation de l’analogie pour l’étude du lexique, qui définit les principes de l’exploration  : les sommets sont des objets disposant d’Attributs, les arcs représentent des Relations. Une réflexion est menée sur la nature de ces éléments et les rapports qu’ils entretiennent, réalisée en tenant compte leur évolution dans le temps et de la topologie du graphe. Deux séries d’expériences viennent ensuite. La première montre que la formalisation de la ressource permet de détecter des analogies conformes à l’intuition, que différents types d’exploration sont possibles et que l’approche permet de vérifier la cohérence du réseau et de faire émerger des règles lexicales. La seconde série porte sur la notion de configurations de dérivations lexicales. Elle montre que le regroupement de sous-graphes analogues fait émerger des connexions récurrentes. L’état d’avancement du réseau ne permet pas d’obtenir des règles et des modèles aboutis, mais les résultats sont encourageants. L’analogie est alors considérée comme un guide pour s’assurer de la qualité de la représentation du lexique proposée et acquérir des connaissances sur son organisation. Elle permet d’identifier des phénomènes linguistiques et d’instrumenter l’activité lexicologique.

  • Titre traduit

    The analogical reasoning in lexicography and its computerisation : application to the French Lecial Network


  • Résumé

    Contemporary lexicography provide ressources offering many opportunities for natural language processing tasks. Thus, the French Lexical Network, presently under development, is a graph of lexical units connected by a rich set of lexical relations. This PhD thesis lays the groundwork for an exploration of this ressource by analogical reasonning. It begins with a selective overview of formalisation and computerisation for study of lexicon, wich defines the principle of exploration : the nodes are similar to objects, which have some attributes and edges represent relations. A reflection is conducted on the nature of this constituents and the relations between them. It takes into account the time axis and the topology of the network. Then two sets of exploratory experiments are conducted. The first one shows that the resource formalisation makes it possible to detect automatically analogies consistent with intuition, that several kind of analogical explorations are possible and that the approach allows to check the consistency of the resource and to bring out lexical rules. The second one is focused around the concept of lexical derivation configurations. It shows how grouping of analogous subgraphs reveals recurrent connections. The progress status of the resource doesn't enable us to obtain successfully completed rules and models, but results are nontheless encouraging. Analogy can already be considered as a guide to ensure the quality of lexical resources. It also allows for the acquisition of knowledge about its organisation. Such knowledge can be used to identify linguitic phenomena and to design instruments to support lexicographic activity.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine. Direction de la documentation et de l'édition. BU Ingénieurs.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.