Thèse soutenue

Tolerance aux fautes par recouvrement arriere dans les systemes informatiques repartis

FR  |  
EN
Auteur / Autrice : Denis Conan
Direction : GUY BERNARD
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1996
Etablissement(s) : Paris 6

Résumé

FR

Cette these traite de la reprise sur fautes par recouvrement arriere. Les applications reparties cibles tolerent des interruptions momentanees du service, pourvu que les retablissements soient automatiques, et, s'executent sur les nuds de reseaux de stations de travail faiblement couples. Le mode de defaillance est le mode silence sur defaillance. Apres une etude approfondie des problemes, des objectifs, des mecanismes existants, et, des politiques possibles (efficaces) et souhaitables (efficientes) du recouvrement arriere, nous presentons un mecanisme de recouvrement arriere original bien adapte aux reseaux etendus. Un reseau etendu est vu comme une agglomeration de reseaux locaux, chacun d'eux constituant une unite de reprise repartie independante et controlee par un gestionnaire. A la base, le mecanisme de recouvrement arriere supporte les applications presque-deterministes et est transparent pour l'utilisateur. Il comprend les mecanismes de constitution de points de reprise, de journalisation des messages et de recouvrement arriere composes de leurs optimisations les plus efficientes. En outre, il supporte de facon optionelle les applications composees de processus presque-deterministes et de processus indeterministes, ceci en contre-partie de l'intervention de l'utilisateur. Deux prototypes ont ete realises. Le premier, au dessus du noyau sunos, est entierement portable. Il a permis l'evaluation des limites de la portabilite : la non-transparence (complete) du recouvrement arriere, l'impossibilite d'optimiser les constitutions de points de reprise. Le deuxieme prototype est realise dans chorus/mix. Il a permis l'evaluation des apports de la technologie micro-noyau : l'acces a toutes les ressources d'un processus par la connaissance du nom de l'acteur correspondant, la manipulation aisee de la memoire virtuelle, la transparence du nommage et de la localisation, et, le parallelisme. Enfin, pour les deux types de systeme d'exploitation, nous soulignons la difficulte actuelle de construire des coupures coherentes.