Décomposition adaptative du signal de parole appliquée au cas de l'arabe standard et dialectal

par Christian Guilleminot

Thèse de doctorat en Sciences du langage. Traitement automatique des langues naturelles

Sous la direction de Henri Madec.


  • Résumé

    Le présent travail introduit en phonétique la décomposition atomique du signal, appelée aussi Matching Pursuit, traite les fichiers d'atomes par compression sans perte et enfin mesure la distance des fichiers comprimés par des algorithmes de Kolmogorov. L’étalonnage est basé sur une première analyse classique de la coarticulation de séquences sonores VCV et CV, (ou V ∈ {[i] [u] [a]} et C ∈ {[t] [d] [s] [δ]}∪{[tʕ] [dʕ] [sʕ [δʕ]}, extraites d’un corpus issu de quatre régions arabophones. L’équation de locus de CV vs CʕV, permet de différencier les variétés de langue. La deuxième analyse applique un algorithme de décomposition atomique adaptative ou Matching Pursuit sur des séquences VCV et VCʕV du même corpus. Les séquences atomiques représentant VCV et VCʕV sont ensuite compressées sans perte et la distance entre elles est recherchée par des algorithmes de Kolmogorov. La classification des productions phonétiques et des régions arabophones obtenue est équivalente à celle de la première méthode. Ce travail montre l’intérêt de l’introduction de Matching Pursuit en phonétique, la grande robustesse des algorithmes utilisés et suggère d’importantes possibilités d’automatisation des processus mis en oeuvre, tout en ouvrant de nouvelles directions d’investigation

  • Titre traduit

    Adaptative decompositions of speech signals applied to the tase of standard and dialectal arabic


  • Résumé

    The present work introduces in phonetics, the atomic decomposition of the signal also known as the Matching Pursuit and treats a group of atoms by compression without losses and finally measures the distance of the list of atoms compressed using the Kolmogorov's algorithms. The calibration is based on an initial classical analysis of the co-articulation of sound sequences of VCV and CV, or V ∈ {[i] [u] [a]} and C ∈ {[t] [d] [s] [δ]}∪ [tʕ] [dʕ] [sʕ [δʕ]} the excerpts culled from a corpus made up of four arabic speaking areas. The locus equation of CV vs CʕV, makes it possible to differentiate the varieties of the language. In the second analysis, an algorithm of atomic adaptative decomposition or Matching Pursuit is applied to the sequences VCV and VCʕV still on the same corpus. The atomic sequences representing VCV et VCʕV are then compressed without losses and the distances between them are searched for by Kolmogorov's algorithms. The classification of phonetic recordings obtained from these arabic speaking areas is equivalent to that of the first method. The findings of the study show how the introduction of Matching Pursuit's in phonetics works, the great robustness of the use of algorithms and suggesting important possibilities of automation of processes put in place, while opening new grounds for further investigations

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (155 f.)
  • Annexes : Bibliogr. f. 132-144. Index

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Non disponible pour le PEB
  • Cote : LET.BESA.2009.1030
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.