Thèse de doctorat en Sciences et techniques communes
Sous la direction de A. JAOUA.
Soutenue en 1993
à Nice .
La plupart des travaux relatifs aux bases de donnees documentaires (bdd) montrent que le thesaurus constitue un outil necessaire et utile pour l'indexation et la recherche. Dans la majorite des bdd sa construction reste manuelle et tres couteuse. De plus, les approches utilisees pour la conception des bdd sont soit complexes a mettre en uvre (approche linguistique) soit utilisant des outils de calcul definis d'une maniere ad-hoc sans base theorique suffisante (approche statistique). Pour pallier a ces problemes, nous proposons une methode de construction automatique de thesaurus (probleme crucial) et de representation intermediaire d'une bdd. Notre methode de construction est justifiee par une base theorique. En effet, dans la premiere partie de cette these, nous presentons la theorie sur laquelle nous nous appuyons pour donner une vision unifiee de l'indexation et la recherche dans une bdd. Ensuite, nous definissons des heuristiques pour donner une solution approchee a deux problemes np-complets: extraction de rectangles optimaux d'une relation binaire r et la recherche d'une couverture minimale de r. Ces heuristiques sont evaluees de deux points de vue: temps d'execution et espace de stockage. Dans la deuxieme partie, nous appliquons cette methode pour generer automatiquement le thesaurus rectangulaire a partir d'une matrice binaire (terme, terme) et pour definir une representation intermediaire du bdd a partir d'une matrice (terme, document) sous forme d'un graphe de rectangles (gr). Les connexions de galois nous permettent de formuler ou de reformuler une requete documentaire, exprimee sous forme d'un systeme d'inequation. La resolution de ce systeme consiste a retrouver un ou plusieurs rectangles dans un gr
Rectangular decomposition method of binary relation: a formal and uniform tools for automatic thesaurus generation and information retrieval
Pas de résumé disponible.