Reconnaissance de partitions musicales par modélisation floue des informations extraites et des règles de notation

par Florence Rossant

Thèse de doctorat en Signal et images

Sous la direction de Isabelle Bloch.

Soutenue en 2006

à Paris, ENST .


  • Résumé

    Nous présentons dans cette thèse une méthode complète de reconnaissance de partitions musicales imprimées, dans le cas monodique. Le système procède en deux phases distinctes : la segmentation et l'analyse des symboles (essentiellement par corrélation), conçues pour surmonter les difficultés liées aux interconnexions et aux défauts d'impression, aboutissant à des hypothèses de reconnaissance. L'interprétation de haut niveau, fondée sur une modélisation floue des informations extraites de l'image et des règles de notation, menant à la décision. Dans cette approche, la décision est reportée tant que le contexte n'est pas entièrement connu. Toutes les configurations d’hypothèses sont successivement évaluées, et la plus cohérente est retenue, par optimisation de tous les critères. Le formalisme utilisé, fondé sur la théorie des ensembles flous et des possibilités, permet de prendre en compte les différentes sources d'imprécision et d'incertitude, ainsi que la souplesse et la flexibilité de l'écriture musicale. Afin de gagner en fiabilité, nous proposons également des méthodes d'indication automatique des erreurs potentielles de reconnaissance, ainsi qu'une procédure d'apprentissage, optimisant les paramètres du système pour le traitement d'une partition particulière. Les performances obtenues sur une large base de données ont permis de montrer l'intérêt de la méthode proposée.

  • Titre traduit

    Optical music recognition based on the fuzzy modeling of the extracted image information and of music notation rules


  • Résumé

    This thesis deals with Optical Music Recognition (OMR), in case of monophonic typeset music. The proposed method relies on two separated stages : the symbol segmentation and analysis step, designed in order to deal with common printing defects and numerous symbol interconnexions. A set of recognition hypotheses is generated, based on correlation scores with class reference models. A high-level interpretation step, based on the fuzzy modeling of the extracted information and of musical rules, leading to the decision. In this approach, the decision is delayed until the entirely context can be evaluated. All the hypothesis configurations are considered, and the decision is taken through a global consistency evaluation. This high-level interpretation step relies on the fuzzy sets and possibility framework, since it allows dealing with symbol variability, the flexibility and the imprecision of music rules, and merging all these heterogeneous pieces of information. Other innovative features are the indication of potential errors, and the possibility of applying learning procedures, in order to gain in robustness. Experiments conducted on a large data base show that the proposed method constitutes an interesting contribution to OMR.

Autre version

Cette thèse a donné lieu à une publication en 2007 par École nationale supérieure des télécommunications à Paris

Reconnaissance de partitions musicales par modélisation floue des informations extraites et des règles de notation


Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (232 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 87 réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.345 ROSS
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.
Cette thèse a donné lieu à 1 publication .

Consulter en bibliothèque

Cette thèse a donné lieu à une publication en 2007 par École nationale supérieure des télécommunications à Paris

Informations

  • Sous le titre : Reconnaissance de partitions musicales par modélisation floue des informations extraites et des règles de notation
  • Dans la collection : ENST , 2006E023 , 0751-1353
  • Détails : 1 vol. (232 p.)
  • Annexes : Bibliogr. p. 209-214. Résumé en français et en anglais
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.