Fouille sémantique : Acquisition automatique de classes sémantiques multilingues à partir de textes

par Zheng Zhang

Projet de thèse en Informatique

Sous la direction de Pierre Zweigenbaum et de Yue Ma.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LIMSI - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (laboratoire) , ILES - Information, Langue Ecrite et Signée (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    Ll s'agit de faire progresser l'état de l'art des méthodes d'acquisition non-supervisée de classes sémantiques multilingues à partir de textes. Voir la description en anglais.

  • Titre traduit

    Semantic mining: Unsupervised acquisition of multilingual semantic classes from texts


  • Résumé

    The automatic extraction of information from texts (sometimes called `text mining') requires knowledge on the addressed languages and domains. This knowledge includes semantic classes, i.e., classes of semantically similar words, such as city names, body parts, or verbs of movement. They provide the basis for modeling the meaning of natural language utterances and for designing ontology concepts. They are useful abstractions for natural language processing, e.g. to mine information from large text collections, and for knowledge acquisition and representation, e.g. for the semantic web. The present thesis proposal aims to advance the state of the art in the unsupervised acquisition of such multilingual semantic classes from texts. See the other fields and the PDF link for more detail.