Apprentissage de systemes d'inference floue par des methodes de renforcement : application a la regulation d'ambiance dans un batiment d'elevage porcin

par LIONEL JOUFFE

Thèse de doctorat en Informatique

Sous la direction de PIERRE-YVES GLORENNEL.

Soutenue en 1997

à Rennes 1 .

    mots clés mots clés


  • Résumé

    Afin de s'adapter a leur environnement, les systemes biologiques superieurs mettent en jeu des mecanismes internes. Parmi ceux-ci, certain entrainent des modifications stables de l'activite psychologique qui constituent alors l'apprentissage. Dans la communaute informatique, l'apprentissage est apprehende comme un calcul, i. E. Une serie de modifications des caracteristiques de l'apprenti. Bien entendu, cet apprenti n'est plus un systeme biologique mais un programme informatique adaptatif. Le type d'apprentissage considere dans cette these s'apparente a celui mis en evidence par les behavioristes dans le conditionnement operant, i. E. L'acquisition d'un comportement uniquement en fonction de renforcements. Le dispositif calculatoire utilise pour implementer l'apprenti est un systeme d'inference floue (sif). Ces systemes reposent sur des regles si-alors formulees avec des termes linguistiques. Ils sont en cela proches du langage naturel et d'une grande lisibilite. Quoique cette derniere permette parfois une mise au point de sif par extraction naturelle des connaissances, il s'avere necessaire de recourir a des methodes d'apprentissage lorsque les connaissances expertes ne sont pas disponibles ou exploitables. C'est la raison pour laquelle nous avons mis au point le fuzzy actor-critic learning (facl) et le fuzzy q-learning (fql), deux methodes permettant a l'apprenti d'acquerir une politique de controle de processus uniquement par le seul biais de son interaction avec l'environnement (i. E. Les recompenses et les punitions). Apres avoir valide ces methodes sur des problemes a caractere pedagogique, nous soumettons au sif l'apprentissage d'une politique de regulation de l'ambiance dans les batiments d'elevage porcin. La partie sensorielle de l'apprenti est prealablement mise au point apres une phase d'extraction naturelle des connaissances. L'unique moyen dont il dispose pour resoudre cette tache reside dans la variation des debits de ventilation. Par le biais des methodes sus-citees, il adapte alors incrementalement son comportement de facon optimiser les renforcements. Les experimentations menees avec le regulateur flou permettent de constater que la politique obtenue satisfait completement les contraintes decrites par les fonctions de renforcements.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 198 P.
  • Annexes : 163 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bretagne-Sud (Vannes). Bibliothèque universitaire.
  • Disponible pour le PEB
  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 1997/119
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.