TOM, une architecture connexionniste de traitement de séquences : application à la reconnaissance de la parole

Stéphane Durand

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Stéphane Durand
Direction :	Jean-Paul Haton
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance en 1995
Etablissement(s) :	Nancy 1
Partenaire(s) de recherche :	autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Mots clés

FR

Mots clés contrôlés

Reconnaissance automatique de la parole

Réseaux neuronaux (informatique)

Mots clés libres

Réseau neuronal

Connexionnisme

Reconnaissance parole

Traitement

Séquentiel

Classification

Résumé

FR

La grande majorité des problèmes auxquels l'homme est confronté contient une composante temporelle. Reconnaissance de la parole, langage, motricité, génération de plans et raisonnement sont quelques exemples d'applications que l'on tente aujourd'hui de traiter à l'aide de machines. Le connexionnisme, ou neuromimétisme, pour ses modèles les plus classiques, a montré ses capacités dans des taches de reconnaissance de formes statiques. Il est moins approprié lorsque les taches incluent une composante dynamique, c'est pourquoi de nouveaux systèmes, dits temporels, voient désormais le jour. Dans cette thèse, nous proposons une classification de ces systèmes selon la méthode de codage du temps, puis nous présentons le modèle TOM (temporal organization map). Ce dernier est une carte neuronale dont le but est d'apprendre, de stocker et de reconnaitre des séquences d'évènements. Les unités connexionnistes qui la composent sont plus proches du modèle de la colonne corticale que du neurone formel de MacCulloch et Pitts. Par leur structure et leur fonctionnement, elles fournissent à la carte une tolérance aux distorsions temporelles. Ceci est particulièrement important pour des taches sensorielles de bas niveau comme le traitement acoustique. L’architecture est générique et peut théoriquement s'appliquer à diverses modalités, a l'image du cortex biologique ou une structure de base unique se retrouve sur toute la surface. Nous proposons une application de la carte TOM a la reconnaissance de chiffres parles. Les résultats obtenus ouvrent des perspectives intéressantes pour ce genre d'architecture

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

TOM, une architecture connexionniste de traitement de séquences : application à la reconnaissance de la parole

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

TOM, une architecture connexionniste de traitement de séquences : application à la reconnaissance de la parole

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses