Filtrage adaptatif bayesien

par Tayeb Sadiki

Thèse de doctorat en Informatique, automatique et traitement du signal

Sous la direction de Dirk Slock.


  • Résumé

    Quand un utilisateur accède à un site WEB ou utilise un service à valeur ajoutée, il recherche un accès efficace pour obtenir les informations le plus vite possible. Une méthode pour atteindre cet objectif est de mémoriser ses actions antérieures pour lui offrir un menu et une méthode d’accès qui soient fidèles à ses préférences, lui évitant ainsi toute perte de temps et donc d’argent. L’utilisateur peut aussi espérer qu’un agent, répondant à ses demandes, a une bonne connaissance des sujets qu’il préfère. L’analyse de ses actions passées, permet d’obtenir ce qu’il souhaite. Cela signifie un système capable d’analyser automatiquement les actions de l’utilisateur et de choisir le meilleur agent pour lui répondre dans son contexte. Il doit dans le même temps présenter à cet agent des informations aisées à comprendre sur l’appelant. Bien entendu, toutes ces opérations doivent être réalisées en temps réel. Les actions de l’utilisateur se définissent par l’âge de l’action, sa durée, son taux de répétition et sa période de répétition. L’usage et la gestion de ces informations ne doivent cependant pas porter atteinte à la vie privée des utilisateurs du service. Enfin, de nouveaux services doivent pouvoir être créés sans constituer une charge lourde d’exploitation. Le principal problème est de trouver un moyen de décrire un phénomène qui se décrit par une fonction de la forme 1/ t avec 2 équations : Une équation à l’origine, Une équation après la première consultation. La psychologie nous donne 2 règles de base : l’intérêt pour un objet est une fonction inverse du temps entre le dernier usage et le précédent, l’intérêt pour un objet est une fonction de la répétition de l’usage. Cela peut être décrit par un modèle additif conforme à la théorie de Bellman. Pour ce faire, nous allons comparer trois modèles : Une analogie avec la gravité (la métaphore de la « fontaine d’informations ») Une analogie avec le comportement des fourmis selon deux méthodes, l’une analogue au comportement des fourmis réelles telles que décrites par l’Université de Toulouse (Dussutour), l’autre utilisant une adaptation de l’algorithme de Dorigo. Un apprentissage par sanction-renforcement Ces modèles sont évalués selon 2 critères, leur aptitude à créer le bon menu et leur aptitude à gérer un nombre important de requêtes en temps réel. Cette analyse met en évidence que : l’algorithme de Dorigo donne des résultats non conformes , l’apprentissage par sanction-renforcement, s’il donne des résultats conformes, est plus consommateur de ressources que les deux autres et pour cela est écarté. Les deux algorithmes restants (gravité et fourmis selon Dussutour) nous donnent des résultats assez différents correspondants tous les deux à une forme de réalité cohérente avec le but recherché. Des tests complémentaires permettront de déterminer lequel est le plus proche de la réalité des utilisateurs. Pour réaliser un test comparatif nous avons défini des utilisateurs simulés disposant de 12 stratégies différentes. Ces utilisateurs simulés permettront une expérimentation pour différencier ces deux algorithmes et affiner le paramétrage de la méthode choisie. Enfin le point de vue psychologique est présenté et ouvre un vaste champ de questions, auxquelles seule une expérimentation sur un site réel avec des utilisateurs réels apportera une réponse.

  • Titre traduit

    Bayesian adaptive filtering


  • Pas de résumé disponible.


  • Résumé

    When a user wants to access to a Web site or uses a value added service, he needs to get information as soon as possible using an efficient service. A way to get this goal is to have a memory of his past actions and to create a specific menu and a way to access the web site according to his preferences, in order to avoid him to lost time and then money. Users could also expect that people answering questions, knows his preferred topics. Analysis of past actions makes it possible to get this information. This means a system able of an automatic analysis of the user’s actions and to choose the best people to answer to him. In the same time system has to present to agent, easy to understand information about user. Of course, all of this must be done in real time. User actions are defined by age of the action, duration, repetition and repetition rate. Usage and management of these information must avoid to affect private life of service users. Finally, new services have to be created without establishing a load for exploitation. The main problem is to find a way to describe a phenomenon using a function like 1/ t but with 2 equations: an equation originally, an equation after the first consultation. The psychology gives us two basic rules: The interest for an object is an inverse function of time between the last usage and the precedent, The interest for an object is a function of the repetition of the usage. It can be described by an additive model corresponding to the theory of Bellman:To do it, we are going to compare three models: An analogy with the gravity (the metaphor of the " fountain of information ") An analogy with the behavior of ants according to two methods, the one similar to the behavior of the real ants, the other one using an adaptation of the algorithm of Dorigo A learning by penalty-intensification. These models are estimated according to 2 criteria, their capacity to create the right menu and their capacity to manage an important number of real-time requests. This analysis brings to light that: the algorithm of Dorigo gives not corresponding results the learning by penalty-intensification, if it gives corresponding results, is more consumer of resources than the two others and for it is pushed aside Both remaining algorithms (gravity and ants according to Dussutour) give us corresponding rather different results. Both give a kind of reality coherent with our goal. Additional tests will allow to determine which one is the closest to the reality of the users. To achieve a comparative test we defined feigned users having 12 different strategies. These feigned users will allow an experiment to differentiate these two algorithms and refine the parameter setting of the chosen method. Finally the psychological point of view is presented and opens a vast field of questions, to which only an experiment on a real site with real users will bring an answer.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (178 p.)
  • Annexes : Bibliogr. p. 165-178. Résumé en français

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Non disponible pour le PEB
  • Cote : 07NICE4039
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.