Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole

Sahar Ghannay

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Sahar Ghannay
Direction :	Yannick Estève, Nathalie Camelin
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 20/09/2017
Etablissement(s) :	Le Mans
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de l'Université du Mans - Laboratoire d'Informatique de l'Université du Maine / LIUM

Mots clés

FR |

EN

Mots clés contrôlés

Réseaux neuronaux (informatique)

Incongruité

Fautes de langage

Reconnaissance automatique de la parole

Mots clés libres

Word embeddings linguistiques

Embeddings aoustiques de signales

Embeddings aoustiques de mots

Détection d’erreurs de reconnaissance de la parole

Post-édition des transcriptions automatiques

Représentations continues de mots

Résumé

FR |

EN

Nous abordons, dans cette thèse, une étude sur les représentations continues de mots (en anglais word embeddings) appliquées à la détection automatique des erreurs dans les transcriptions de la parole. Notre étude se concentre sur l’utilisation d’une approche neuronale pour améliorer la détection automatique des erreurs dans les transcriptions automatiques, en exploitant les word embeddings. L’exploitation des embeddings repose sur l’idée que la détection d’erreurs consiste à trouver les possibles incongruités linguistiques ou acoustiques au sein des transcriptions automatiques. L’intérêt est donc de trouver la représentation appropriée du mot qui permet de capturer des informations pertinentes pour pouvoir détecter ces anomalies. Notre contribution dans le cadre de cette thèse porte sur plusieurs axes. D’abord, nous commençons par une étude préliminaire dans laquelle nous proposons une architecture neuronale capable d’intégrer différents types de descripteurs, y compris les embeddings. Ensuite, nous nous focalisons sur une étude approfondie des représentations continues de mots. Cette étude porte d’une part sur l’évaluation de différents types d’embeddings linguistiques puis sur leurs combinaisons. D’autre part, elle s’intéresse aux embeddings acoustiques de mots. Puis, nous présentons une étude sur l’analyse des erreurs de classifications, qui a pour objectif de percevoir les erreurs difficiles à détecter.Finalement, nous exploitons les embeddings linguistiques et acoustiques ainsi que l’information fournie par notre système de détections d’erreurs dans plusieurs cadres applicatifs.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses