Thèse soutenue

Reconnaissance de grands vocabulaires : une étude syntaxique et lexicale

FR  |  
EN
Auteur / Autrice : Gilles Adda
Direction : Joseph Mariani
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1987
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)
Jury : Président / Présidente : Christian Fluhr
Examinateurs / Examinatrices : Joseph Mariani, Jean-Pierre Tubach, Christian Fluhr, Jean-Paul Haton, Alexandre Andreewsky

Mots clés

FR

Résumé

FR

Nous présentons dans cette thèse un certain nombre d'expériences menées dans le cadre d'un projet à long terme de dictée vocale. Ces expériences portent sur l'utilisation de grands vocabulaires (contenant entre 10000 et 300000 mots), et de langage aussi bien syntaxiquement que sémantiquement naturel. On a tout d'abord étudié, en utilisant comme support une maquette de transcription sténotypes/graphèmes destinée au sous-titrage d'émissions télévisées, le modèle syntaxique à développer afin de rendre compte des particularités du langage parlé. Ce modèle repose sur des grammaires stochastiques de successions binaires et ternaires. Nous avons ensuite construit un logiciel d'accès à un lexique de très grande taille (270000 mots), à l'aide d'un treillis phonétique erroné. Les résultats ayant montré les limites d'une telle approche, nous avons étudié la possibilité d'une préclasssification du vocabulaire. Nous avons mené une étude lexicale de l'utilisation de traits robustes, en utilisant différents types de préclassification.