Thèse soutenue

Analyse syntaxique automatique de l'oral : étude des disfluences

FR
Auteur / Autrice : Rémi Bove
Direction : Jean Véronis
Type : Thèse de doctorat
Discipline(s) : Langage et parole
Date : Soutenance en 2008
Etablissement(s) : Aix-Marseille 1
Partenaire(s) de recherche : autre partenaire : Université de Provence. Faculté des lettres et sciences humaines (1969-2011)

Mots clés

FR

Résumé

FR

Le but de cette thèse est d'étudier de façon détaillée l'impact des disfluences en français parlé (répétitions, auto-corrections, amorces, etc. ) sur l'analyse syntaxique automatique de l'oral et de propose un modèle théorique permettant de les intégrer dans cette analyse. Notre axe de recherche se fonde sur l'hypothèse selon laquelle une analyse détaillée des énoncés oraux (principalement en termes morphosyntaxiques) peut permettre un traitement efficace pour ce type de données, et s'avère incontournable dans une optique de développement d'applications génériques dans le domaine des technologies de la parole. Dans le cadre de ce travail, nous proposons à la fois une étude linguistique détaillée et une stratégie d'analyse syntaxique automatique partielle des disfluences (en syntagmes minimaux non récursifs ou "chunks"). Le corpus final obtenu est ainsi segmenté en chunks non-disfluents d'une part, à côté des chunks disfluents d'autre part après prise en compte des régularités observées dans notre corpus. Les résultats de l'analyse automatique sont finalement évalués de façon quantitative sur le corpus permettant ainsi de valider le modèle théorique de façon empirique.