Gestion et extension automatiques du dictionnaire relationnel multilingues de noms propres Prolexbase : mise à jour multilingues et création d'un volume arabe via la Wikipédia

Mouna Elashter

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Mouna Elashter
Direction :	Denis Maurel
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 04/07/2017
Etablissement(s) :	Tours
Ecole(s) doctorale(s) :	École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche :	Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...)
	Laboratoire : École polytechnique universitaire (Tours)
Jury :	Président / Présidente : Béatrice Daille
	Examinateurs / Examinatrices : Béatrice Markhoff
	Rapporteurs / Rapporteuses : Béatrice Daille, Kais Haddar

Mots clés

FR |

EN

Mots clés contrôlés

Hyperliens

Noms propres arabes

Traitement automatique du langage naturel

Automates programmables

Fichiers (informatique) -- Traitement

Arabe (langue)

Modules d'extension (logiciels)

Encyclopédies électroniques

Dictionnaires électroniques

Mots clés libres

Nom propre

Prolexbase

Bases lexicales multilingues

Notoriété

Langue arabe

Wikipédia

Résumé

FR |

EN

Les bases de données lexicales jouent un grand rôle dans le TAL, mais, elles nécessitent un développement et un enrichissement permanents via l’exploitation des ressources libres du web sémantique, entre autres, l’encyclopédie Wikipédia, DBpedia, Geonames et Yago2. Prolexbase, comporte à ce jour dix langues, trois parmi elles sont bien couvertes : le francais, l’anglais et le polonais. Il a été conçu manuellement et une première tentative semi-automatique a été réalisée par le projet ProlexFeeder (Savary et al. 2013). L’objectif de notre travail était d’élaborer un outil de mise à jour et d’extension automatiques de ce lexique, et l'ajout de la langue arabe. Un système automatique a également été mis en place pour calculer via la Wikipédia l’indice de notoriété des entrées de Prolexbase ; cet indice dépend de la langue et participe, d'une part, à la construction d'un module de Prolexbase pour la langue arabe et, d'autre part, à la révision de la notoriété présente pour les autres langues de la base.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Gestion et extension automatiques du dictionnaire relationnel multilingues de noms propres Prolexbase : mise à jour multilingues et création d'un volume arabe via la Wikipédia

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Gestion et extension automatiques du dictionnaire relationnel multilingues de noms propres Prolexbase : mise à jour multilingues et création d'un volume arabe via la Wikipédia

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses