Un système multi-agent adaptatif pour la construction d'ontologies à partir de textes

by Kévin Ottens

Doctoral thesis in Informatique

Under the supervision of Pierre Glize and Nathalie Aussenac-Gilles.

defended on 2007

in Toulouse 3 .

  • Alternative Title

    An adaptive multi-agent system for ontology building from texts


  • Abstract

    Semantic Web refers to a set of technologies trying to make the World Wide Web resources content available and usable by programs and software agents. Then, it should ease users access to information. Its raising requires the availability of ontologies which are formalized knowledge models usable by a software systems for their communication. Unfortunately their construction is generally slow and costly, and their maintenance raises issues generally underestimated. The usage of texts for designing ontologies is considered as a possible solution to their cost, despite the fact that this task is still difficult. Since ontologies must be maintained, and because they can be seen as complex systems of concepts, we propose to use adaptive multi-agent systems to semi-automate the process of building ontologies from texts. The stable state of those systems comes from the cooperative interactions between the constituting software agents. In our case, the agents use distributed algorithms of statistical analysis to find the most satisfying structure from a syntactical and distributional analysis of texts. Then, the user can validate, criticize or modify parts of the agent structure, which is the base of the ontology in progress, to make it fulfil his objectives and his own vision of the modeled domain. In return, the agents reorganize themselves to satisfy the newly introduced constraints. Ontologies which are generally fixed become here dynamic, they become a "living design". Those are the underlying principles used in our system named Dynamo. The relevance of this approach has been tested thanks to experiments aiming at evaluating the performances of our system, and by its use in real operations. In this thesis, we present and analyse the obtained results.


  • Abstract

    Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels. Ainsi, il doit faciliter l'accès à l'information pour les utilisateurs. Or, un des enjeux du succès du Web sémantique est la disponibilité d'ontologies qui sont des représentations de connaissances formalisées et exploitables par des systèmes informatiques pour leur communication. Malheureusement leur construction est généralement longue et coûteuse, et leur maintenance soulève des problèmes jusqu'ici sous-estimés. S'appuyer sur des textes pour la conception d'ontologies est vu comme une issue possible à leur coût, malgré les difficultés inhérentes à l'exploration d'analyses textuelles. Parce que l'ontologie doit être maintenue, et parce qu'elle peut-être vue comme un système complexe constitué de concepts, nous proposons d'utiliser les systèmes multi-agents adaptatifs pour semi-automatiser le processus de construction des ontologies à partir de texte. L'état stable de ces systèmes résulte des interactions coopératives entre les agents logiciels qui les constituent. Dans notre cas, les agents utilisent des algorithmes distribués d'analyse statistique pour trouver la structure la plus satisfaisante d'après une analyse syntaxique et distributionnelle des textes. L'utilisateur peut alors valider, critiquer ou modifier des parties de cette structure d'agents, qui est la base de l'ontologie en devenir, pour la rendre conforme à ses objectifs et à sa vision du domaine modélisé. En retour, les agents se réorganisent pour satisfaire les nouvelles contraintes introduites. Les ontologies habituellement fixées deviennent ici dynamiques, leur conception devient « vivante ». Ce sont les principes sous-jacents de notre système nommé Dynamo. La pertinence de cette approche a été mise à l'épreuve par des expérimentations visant à évaluer la complexité algorithmique de notre système, et par son utilisation en conditions réelles. Dans ce mémoire, nous présentons et analysons les résultats obtenus.

Consult library

Version is available as a paper

Informations

  • Details : 1 vol. (131 p.)
  • Annexes : Bibliogr. p. 121-127

Where is this thesis?

  • Library : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Available for PEB
  • Odds : 2007TOU30102
See the Sudoc catalog libraries of higher education and research.