Thèse soutenue

Decouverte automatique de regularites dans les sequences et application a l'analyse musicale

FR
Auteur / Autrice : PIERRE-YVES ROLLAND
Direction : Jean-Gabriel Ganascia
Type : Thèse de doctorat
Discipline(s) : Physique
Date : Soutenance en 1998
Etablissement(s) : Paris 6

Résumé

FR

La decouverte de regularites dans les sequences (drs) intervient dans un eventail tres general de domaines d'application : biologie moleculaire, finance, telecommunications, analyse musicale, etc. Nous nous interessons plus particulierement a la decouverte de patterns sequentiels, definis par des ensembles (blocs) de segments de sequence identiques ou equipollents, c'est a dire significativement similaires. Le critere d'equipollence est base sur un modele de similitude donne entre segments. Le premier volet de ce travail de these a ete de montrer, experimentations a l'appui, les limitations principales des approches existantes dans un domaine d'application comme la musique. Ces limitations se rapportent principalement a la representation des sequences et de leurs elements, aux modeles de similitude entre segments employes (distance de hamming par exemple), et aux algorithmes (combinatoires) de drs eux-memes. Pour pallier ces limitations, nous proposons : (1) l'insertion, au sein du processus de drs, d'une phase d'enrichissement (ou de changement) de la representation, partiellement ou totalement automatique. A partir de connaissances du domaine, on adjoint aux descriptions de base des sequences et de leurs elements une hierarchie eventuellement redondante de descriptions traduisant des proprietes supplementaires, structurelles, locales ou globales ; (2) un nouveau modele general de similitude entre segments de sequences, le modele d'edition value multi-descriptions (mevm), pouvant integrer simultanement, de facon ponderee, plusieurs descriptions ; et (3) un nouvel algorithme combinatoire de drs, appele flexpat, utilisant le mevm. Notre logiciel imprology implemente le mevm et flexpat. Ses resultats experimentaux sur des sequences musicales (melodies) illustrent tres clairement la validite de nos concepts et algorithmes. Ceux-ci sont generaux, et applicables a d'autres domaines que la musique.