French language DRS parsing - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

French language DRS parsing

L’analyse de la structure de représentation du discours pour le français

Résumé

In the rise of the internet, user-generated content from social networking services is becoming a giant source of information that can be useful to businesses on the aspect where users are viewed as customers or potential customers for companies. Exploitation of user-generated texts can help identify their feelings, intentions, or reduce the effort of the agents who are responsible for collecting or receiving information on social networking services. As part of this thesis, the content of texts such as speeches, statements, conversations from interactive communication on social media platforms become the main data object of our study. We deepen an analysis of structures and components of sentences in texts on the basis of Combinatory Categorial Grammar (CCG) and the Discourse Representation Structure (DRS). We propose a method for extracting a CCG tree from the dependency structure of the sentence, and a general architecture to build a bridge of relationship between syntaxes and semantics of French sentences. As a result, our study achieves representations of natural language texts in a new form of first order logic or the box of DRS.
Dans l’essor d’internet, les contenus générés par les utilisateurs à partir des services de réseaux sociaux deviennent une source géante d’informations qui peuvent être utile aux entreprises sur l’aspect où les utilisateurs sont considérés comme des clients ou des clients potentiels pour les entreprises. L’exploitation des textes générés par les utilisateurs peut aider à identifier leurs sentiments, leurs intentions, ou réduire l’effort des agents qui sont responsables de recueillir ou de recevoir des informations sur les services de réseaux sociaux. Dans le cadre de cette thèse, les contenues de textes tels que discours, énoncés, conversations issues de la communication interactive sur les plateformes de réseaux sociaux deviennent l’objet de données principales de notre étude. Nous approfondissons une analyse de structures et composants des phrases dans les textes sur la base de la Grammaire Catégoriel Combinatoire (GCC) et la théorie des représentations du discours. Nous proposons une méthode pour l’extraction d’un arbre de GCC à partir de l’arbre dépendante de la phrase, et une architecture générale pour construire un pont de relation entre les syntaxes et les sémantiques des phrases françaises. Par conséquent, notre étude obtient de la représentation de textes de la langue naturel sous une nouvelle forme de la logique du premier ordre ou la boîte de la structure des représentations du discours.
Fichier principal
Vignette du fichier
2020IMTA0202_Le-NgocLuyen.pdf (1.77 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03132658 , version 1 (05-02-2021)

Identifiants

  • HAL Id : tel-03132658 , version 1

Citer

Ngoc Luyen Le. French language DRS parsing. Computation and Language [cs.CL]. Ecole nationale supérieure Mines-Télécom Atlantique, 2020. English. ⟨NNT : 2020IMTA0202⟩. ⟨tel-03132658⟩
193 Consultations
1026 Téléchargements

Partager

Gmail Facebook X LinkedIn More