TOM, une architecture connexionniste de traitement de séquences : application à la reconnaissance de la parole

par Stéphane Durand

Thèse de doctorat en Informatique

Sous la direction de Jean-Paul Haton.

Soutenue en 1995

à Nancy 1 , en partenariat avec Université Henri Poincaré Nancy 1. Faculté des sciences et techniques (autre partenaire) .


  • Résumé

    La grande majorité des problèmes auxquels l'homme est confronté contient une composante temporelle. Reconnaissance de la parole, langage, motricité, génération de plans et raisonnement sont quelques exemples d'applications que l'on tente aujourd'hui de traiter à l'aide de machines. Le connexionnisme, ou neuromimétisme, pour ses modèles les plus classiques, a montré ses capacités dans des taches de reconnaissance de formes statiques. Il est moins approprié lorsque les taches incluent une composante dynamique, c'est pourquoi de nouveaux systèmes, dits temporels, voient désormais le jour. Dans cette thèse, nous proposons une classification de ces systèmes selon la méthode de codage du temps, puis nous présentons le modèle TOM (temporal organization map). Ce dernier est une carte neuronale dont le but est d'apprendre, de stocker et de reconnaitre des séquences d'évènements. Les unités connexionnistes qui la composent sont plus proches du modèle de la colonne corticale que du neurone formel de MacCulloch et Pitts. Par leur structure et leur fonctionnement, elles fournissent à la carte une tolérance aux distorsions temporelles. Ceci est particulièrement important pour des taches sensorielles de bas niveau comme le traitement acoustique. L’architecture est générique et peut théoriquement s'appliquer à diverses modalités, a l'image du cortex biologique ou une structure de base unique se retrouve sur toute la surface. Nous proposons une application de la carte TOM a la reconnaissance de chiffres parles. Les résultats obtenus ouvrent des perspectives intéressantes pour ce genre d'architecture

  • Titre traduit

    TOM, a connectionist architecture for sequence processing : application to speech recognition


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (185 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Notes bibliogr.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation - BU Sciences et Techniques.
  • Accessible pour le PEB
  • Bibliothèque :
  • PEB soumis à condition
  • Cote : DURAND t

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Non disponible pour le PEB
  • Cote : MF-1995-DUR
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.