Archives, fragments Web et diasporas : pour une exploration désagrégée de corpus d'archives Web liées aux représentations en ligne des diasporas
Auteur / Autrice : | Quentin Lobbé |
Direction : | Pierre Senellart, Dana Diminescu |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 09/11/2018 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : Télécom Paris (Palaiseau ; 1977-....) |
Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) | |
Jury : | Président / Présidente : Bruno Defude |
Examinateurs / Examinatrices : Pierre Senellart, Anat Ben-David, Valérie Schafer | |
Rapporteurs / Rapporteuses : Bruno Bachimont, Marc Spaniol |
Mots clés
Mots clés contrôlés
Résumé
Le Web est un environnement éphémère. Alors que de nouveaux sites Web émergent chaque jour, il arrive que certaines communautés disparaissent entièrement de la surface de la toile, ne laissant derrière elles que des traces incomplètes voire inexistantes. Face à la volatilité du Web vivant, plusieurs initiatives d’archivage cherchent malgré tout à préserver la mémoire du Web passé. Mais aujourd’hui, force est de constater qu’un mystère demeure : Pourquoi, alors qu’elles n’ont jamais été aussi vastes et aussi nombreuses, les archives Web ne font-elles pas déjà l’objet de multiples recherches historiques ? Initialement construites pour inscrire la mémoire de la toile sur un support durable, ces archives ne doivent pourtant pas être considérées comme une représentation fidèle du Web vivant. Elles sont les traces directes des outils de collecte qui les arrachent à leur temporalité d’origine. Partant de là, cette thèse ambitionne de redonner aux chercheurs les moyens théoriques et techniques d’une plus grande maniabilité du Web passé, en définissant une nouvelle unité d’exploration des archives Web : le fragment Web, un sous-ensemble cohérent et auto-suffisant d’une page Web. Pour ce faire, nous nous inscrirons dans l’héritage des travaux pionniers de l’Atlas e-Diasporas qui permit, dans les années 2000, de cartographier et d’archiver plusieurs milliers de sites Web migrants. Source principale de données à partir desquelles nous déploierons nos réflexions, c’est à travers l’angle particulier des représentations en ligne des diasporas que nous chercherons à explorer les archives Web de l’Atlas.