Archives, fragments Web et diasporas : pour une exploration désagrégée de corpus d'archives Web liées aux représentations en ligne des diasporas

par Quentin Lobbe

Thèse de doctorat en Informatique

Sous la direction de Pierre Senellart et de Dana Diminescu.

Soutenue le 09-11-2018

à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec Télécom ParisTech (établissement opérateur d'inscription) et de Laboratoire traitement et communication de l'information (Paris) (laboratoire) .

Le président du jury était Bruno Defude.

Le jury était composé de Pierre Senellart, Anat Ben-David, Valérie Schafer.

Les rapporteurs étaient Bruno Bachimont, Marc Spaniol.


  • Résumé

    Le Web est un environnement éphémère. Alors que de nouveaux sites Web émergent chaque jour, il arrive que certaines communautés disparaissent entièrement de la surface de la toile, ne laissant derrière elles que des traces incomplètes voire inexistantes. Face à la volatilité du Web vivant, plusieurs initiatives d’archivage cherchent malgré tout à préserver la mémoire du Web passé. Mais aujourd’hui, force est de constater qu’un mystère demeure : Pourquoi, alors qu’elles n’ont jamais été aussi vastes et aussi nombreuses, les archives Web ne font-elles pas déjà l’objet de multiples recherches historiques ? Initialement construites pour inscrire la mémoire de la toile sur un support durable, ces archives ne doivent pourtant pas être considérées comme une représentation fidèle du Web vivant. Elles sont les traces directes des outils de collecte qui les arrachent à leur temporalité d’origine. Partant de là, cette thèse ambitionne de redonner aux chercheurs les moyens théoriques et techniques d’une plus grande maniabilité du Web passé, en définissant une nouvelle unité d’exploration des archives Web : le fragment Web, un sous-ensemble cohérent et auto-suffisant d’une page Web. Pour ce faire, nous nous inscrirons dans l’héritage des travaux pionniers de l’Atlas e-Diasporas qui permit, dans les années 2000, de cartographier et d’archiver plusieurs milliers de sites Web migrants. Source principale de données à partir desquelles nous déploierons nos réflexions, c’est à travers l’angle particulier des représentations en ligne des diasporas que nous chercherons à explorer les archives Web de l’Atlas.

  • Titre traduit

    Archives, Web fragments and diasporas : for a disaggregated exploration of Web archives related to the online representations of diasporas


  • Résumé

    The Web is an unsteady environment. As Web sites emerge every days, whole communities may fade away over time by leaving too few or incomplete traces on the living Web. Facing this phenomenon, several archiving initiatives try to preserve the memory of the Web. But today, a mystery remains : While they have never been so vast and numerous, why are the Web archives not already the subject of many historical researches ? In reality, Web archives should not be considered as a faithful representation of the living Web. In fact, they are the direct traces of the archiving tools that tear them away from their original temporality. Thus, this thesis aims to give researchers the theoretical and technical means for a greater manageability of the Web archives, by defining a new unit of exploration : the Web fragment, a coherent and self-sufficient subset of a Web page. To that end, we will follow the pioneering work of the e-Diasporas Atlas which allowed, in the 2000s, to map and archive thousands of migrant Web sites. Main source of data from which we will unfold our reflections, it is through the particular angle of online representations of diasporas that we will explore the Web archives of the Atlas.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.