Analyse et conception d’algorithmes de recherche de motifs.

par Omar AIT MOUS

Thèse de doctorat en Informatique

Sous la direction de Frédérique Bassino.

Thèses en préparation à Paris 13 , dans le cadre de Galilée depuis le 20-10-2008 .


  • Résumé

    Dans cette thèse, on s’intéresse à la construction efficace de l’automate minimal de A où X est un motif sur un alphabet A, qui intervient dans la recherche de motifs. Lorsque le motif est un mot seul, l’automate de Knuth-Morris-Pratt est minimal, et la complexité de sa construction est linéaire en la longueur du mot. Pour un ensemble fini de mots, la construction classique de Aho et Corasick produit un automate qui reconnaît le langage A*X, mais qui n’est pas toujours minimal. On propose dans un premier temps un algorithme qui construit génériquement l’automate minimal de A*X, lorsque X contient m mots (pour m fixé). Cette construction, inspirée par l’algorithme de minimisation de Brzozowski, utilise des listes creuses pour obtenir une complexité linéaire en temps. Une autre approche pour la construction de cet automate minimal consiste en la minimisation de l’automate de Aho-Corasick, et on présente un algorithme de pseudo-minimisation, de complexité linéaire, qui produit un automate dont la taille est entre celle de l’automate en entrée et celle de l’automate minimal. On démontre ensuite que l’automate obtenu est génériquement minimal, pourvu que le motif satisfasse aux conditions de faible corrélation que l’on définit. On donne ensuite un algorithme de complexité génériquement linéaire qui produit avec certitude l’automate minimal. Finalement, on présente une construction directe de l’automate pseudo-minimal, évitant ainsi la construction au préalable de l’automate de Aho-Corasick.


  • Pas de résumé disponible.