Thèse soutenue

Archives, fragments Web et diasporas : pour une exploration désagrégée de corpus d'archives Web liées aux représentations en ligne des diasporas

FR  |  
EN
Auteur / Autrice : Quentin Lobbé
Direction : Pierre SenellartDana Diminescu
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/11/2018
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Télécom Paris (Palaiseau ; 1977-....)
Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....)
Jury : Président / Présidente : Bruno Defude
Examinateurs / Examinatrices : Pierre Senellart, Anat Ben-David, Valérie Schafer
Rapporteurs / Rapporteuses : Bruno Bachimont, Marc Spaniol

Résumé

FR  |  
EN

Le Web est un environnement éphémère. Alors que de nouveaux sites Web émergent chaque jour, il arrive que certaines communautés disparaissent entièrement de la surface de la toile, ne laissant derrière elles que des traces incomplètes voire inexistantes. Face à la volatilité du Web vivant, plusieurs initiatives d’archivage cherchent malgré tout à préserver la mémoire du Web passé. Mais aujourd’hui, force est de constater qu’un mystère demeure : Pourquoi, alors qu’elles n’ont jamais été aussi vastes et aussi nombreuses, les archives Web ne font-elles pas déjà l’objet de multiples recherches historiques ? Initialement construites pour inscrire la mémoire de la toile sur un support durable, ces archives ne doivent pourtant pas être considérées comme une représentation fidèle du Web vivant. Elles sont les traces directes des outils de collecte qui les arrachent à leur temporalité d’origine. Partant de là, cette thèse ambitionne de redonner aux chercheurs les moyens théoriques et techniques d’une plus grande maniabilité du Web passé, en définissant une nouvelle unité d’exploration des archives Web : le fragment Web, un sous-ensemble cohérent et auto-suffisant d’une page Web. Pour ce faire, nous nous inscrirons dans l’héritage des travaux pionniers de l’Atlas e-Diasporas qui permit, dans les années 2000, de cartographier et d’archiver plusieurs milliers de sites Web migrants. Source principale de données à partir desquelles nous déploierons nos réflexions, c’est à travers l’angle particulier des représentations en ligne des diasporas que nous chercherons à explorer les archives Web de l’Atlas.