Reconnaissance de grands vocabulaires : une étude syntaxique et lexicale
Auteur / Autrice : | Gilles Adda |
Direction : | Joseph Mariani |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1987 |
Etablissement(s) : | Paris 11 |
Partenaire(s) de recherche : | autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) |
Jury : | Président / Présidente : Christian Fluhr |
Examinateurs / Examinatrices : Joseph Mariani, Jean-Pierre Tubach, Christian Fluhr, Jean-Paul Haton, Alexandre Andreewsky |
Mots clés
Mots clés contrôlés
Résumé
Nous présentons dans cette thèse un certain nombre d'expériences menées dans le cadre d'un projet à long terme de dictée vocale. Ces expériences portent sur l'utilisation de grands vocabulaires (contenant entre 10000 et 300000 mots), et de langage aussi bien syntaxiquement que sémantiquement naturel. On a tout d'abord étudié, en utilisant comme support une maquette de transcription sténotypes/graphèmes destinée au sous-titrage d'émissions télévisées, le modèle syntaxique à développer afin de rendre compte des particularités du langage parlé. Ce modèle repose sur des grammaires stochastiques de successions binaires et ternaires. Nous avons ensuite construit un logiciel d'accès à un lexique de très grande taille (270000 mots), à l'aide d'un treillis phonétique erroné. Les résultats ayant montré les limites d'une telle approche, nous avons étudié la possibilité d'une préclasssification du vocabulaire. Nous avons mené une étude lexicale de l'utilisation de traits robustes, en utilisant différents types de préclassification.