Thèse de doctorat en Informatique linguistique
Sous la direction de Jean-Luc Minel.
Soutenue en 2006
à Paris 4 , dans le cadre de École doctorale Concepts et langages (Paris) .
Le jury était composé de Patrice Enjalbert, Yves Jeanneret, Lita Lundquist, Jean-Paul Sansonnet, Dina Wonsever.
Au long de l'histoire, des instruments de recherche d'information ou d'aide à la lecture, fondés sur la notion de page, tels que la table des matières, les index, les renvoi, etc. , ont été introduits. Dès l'arrivée de l'informatique, ces instruments, de nature typiquement statique, se sont multipliés et ils ont vu croître leur puissance. Dans le cadre général de l'histoire du texte numérique, l'hypertexte place un jalon du point de vue conceptuel, et l'utilisation massive d'Internet a répandu son utilisation à grande échelle. Le terme de navigation textuelle reçoit de multiples interprétations, la plus commune renvoyant inévitablement au processus mis en oeuvre par les outils de navigation utilisés pour circuler dans les documents hypertextes. Néanmoins, notre conception de la navigation textuelle se démarque de la navigation hypertextuelle traditionnelle car nous considérons que circuler ou naviguer dans un texte est l'expression d'un processus cognitif qui convoque des connaissances qui sont propres à la finalité de la navigation. Nous formulons l'hypothèse que la démarche du lecteur peut être assistée par l'exploitation de connaissances, présentes dans les textes, qui peuvent être, en partie, modélisées sous une forme déclarative. Autrement dit, il ne suffit pas de créer des liens mais il est nécessaire d'expliciter l'opération de navigation. De plus, ce processus de définition d'opérations de navigation doit être mis en oeuvre par un " expert " capable d'encoder ces connaissances. Ce travail de thèse présente quatre contributions principales. En premier lieu, une représentation des textes spécifique à la navigation textuelle est définie. En deuxième lieu, un langage formel de modélisation des connaissances de visualisation et de modélisation nommé Sextant est proposé. Les constructions possibles du langage sont données par une syntaxe. Le sens des constructions syntaxiques du langage Sextant est déterminé par une sémantique opérationnelle. En troisième lieu, une plate-forme logicielle dédiée à la navigation textuelle, nommée NaviTexte, a été implémentée. Dans cette implémentation, trois choses ont été développées : une représentation informatique des textes spécifique à la navigation textuelle, fondée sur la proposition d'un encodage XML des textes ; un interpréteur d'une version réduite de Sextant, le langage de modélisation des connaissances, fondé sur la proposition d'un encodage XML de ce langage ; un environnement capable de traiter les textes, d'interpréter le langage Sextant et de gérer l'interaction avec l'utilisateur. En dernier lieu, diverses applications de la plate-forme logicielle NaviTexte à des cas réels d'utilisation ont été mises en oeuvre.
A text navigation system : modeling, architecture, development and applications of NaviTexte
Through history, search information tools based on the notion of page, such as tables of contents, index, references, etc. , had been proposed. With the rise of computers, these tools, typically static in nature, had seen their power increased. In the field of digital texts, Hypertext is a great achievement from a conceptual point of view, and the massive utilization of the Internet has spread his utilization at big scale. Text navigation term has many interpretations. The most known of them refers to the navigation process carried out by traditional browsers. Nevertheless, our conception of text navigation diverges from the traditional hypertext navigation one because we consider that navigating a text is the expression of a cognitive process that involves navigation specific knowledge. We claim that a reader's activity can be assisted by the exploitation of knowledge that exists in texts, and that this knowledge may be modeled in a declarative way. Creation of links is not enough: it is necessary to make explicit the notion of navigation operation, and it has to be done by an “expert” capable of encoding this knowledge. The present work has four main contributions. First, it defines a computer text representation of texts, specific to our text navigation approach. Second, a formal language of visualization and navigational knowledge modeling, named Sextant, is proposed. While the constructions of the language are defined by a syntax, the meaning of these constructions is determined by an operational semantic. Third, a text navigation system, named NaviTexte, has been implemented. Finally, several applications of NaviTexte in real world situations are presented.
Cette thèse a donné lieu à une publication en 2008 par Édilivre à Paris
Une plate-forme informatique de navigation textuelle : modélisation, architecture, réalisation et application de Navitexte