Apprentissage de modèles Markoviens pour l'analyse de séquences

par Henri Binsztok

Thèse de doctorat en Informatique

Sous la direction de Patrick Gallinari.

Soutenue en 2007

à Paris 6 .


  • Résumé

    Initialement, l'apprentissage supervisé a permis d'apprendre des modèles à partir de données étiquetées. Mais, pour de nombreuses tâches, notamment dans le cadre de la modélisation utilisateur, si la quantité de données disponible est potentiellement sans limite, la quantité de données étiquetées est quasi-nulle. Dans le cadre de cette thèse, nous nous intéressons à l'apprentissage non-supervisé de modèles de séquences. L'information de séquence constitue le premier niveau de données structurées, où les données ne sont plus de simples vecteurs de caractéristiques. Nous proposons des approches d'apprentissage non-supervisé de séquences que nous appliquons à l'apprentissage automatique de modèles de Markov cachés (MMC) et modèles de Markov cachés hiérarchiques (MMCH) notamment. Notre but est d'apprendre simultanément la structure et les paramètres de modèles markoviens, pour minimiser la quantité d'information a priori nécessaire.

  • Titre traduit

    Learning markovian models for the analysis of sequences


  • Résumé

    Initially, Machine Learning allowed to learn models from labeled data. But, for numerous tasks, notably for the task of user modeling, if the available quantity of data is potentially without limit, the quantity of labeled data is almost nonexistent. Within the framework of this thesis, we are interested in the unsupervised learning of sequence models. The information of sequence constitutes the first level of structured data, where the data are no more simple vectors of characteristics. We propose approaches that we apply to the automatic learning of Hidden Markov Models ( HMMs) and Hierarchical HMMs (HHMMs). Our purpose is to learn simultaneously the structure and the parameters of these Markovian Models, to minimize the quantity of prior information necessary to learn them.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 174 p.)
  • Annexes : Bibliogr. p. 167-174. 105 réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie . Section Mathématiques-Informatique Recherche.
  • Consultable sur place dans l'établissement demandeur
  • Cote : T Paris 6 2007 568
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.