Modèle de séparation acoustique des flux nasal et oral de la parole pour la caractérisation de processus phonologiques dynamiques. Application aux langues Na (Yunnan, Chine)

par Maxime Fily

Projet de thèse en Sciences du langage Spécialité Didactique et Linguistique

Sous la direction de Nathalie Vallée et de Gang Feng.

Thèses en préparation à Grenoble Alpes , dans le cadre de École doctorale langues, littératures et sciences humaines (Grenoble) , en partenariat avec Grenoble Images Parole Signal Automatique (laboratoire) depuis le 01-10-2018 .


  • Résumé

    Dans la parole, lors de la production de sons nasals, intervient un phénomène de couplage entre les conduits oral et nasal, donnant lieu à une structure acoustique très complexe. Les méthodes de simulation acoustique classiques explorent ce couplage qui dépend de la position du voile du palais (velum). La sortie totale s'obtient ensuite en additionnant la sortie orale (aux lèvres) et la sortie nasale (aux narines). Pourtant couramment utilisée, cette méthode ne permet pas d'expliquer efficacement la structure acoustique des sons nasals de la parole naturelle, tout comme leur grande variation, que ce soit en fonction des frontières syllabiques, des mécanismes laryngés ou des phénomènes prosodiques. Leur structure acoustique complique également la recherche de leurs corrélats perceptifs qui ont pourtant un grand intérêt au vu de l'importance, dans les langues, du rendement du trait nasal dans les oppositions phonologiques. Malgré les difficultés, il y a donc nécessité à étudier cette particularité phonétique qui n'a pas encore été décrite dans toute sa complexité. Déterminer une méthode permettant de caractériser avec pertinence les productions nasales revêt donc un enjeu majeur pour expliquer leur émergence dans les langues, leur évolution, leur perception, leur catégorisation et leur acquisition. Une approche novatrice pour aborder la question consiste à isoler et analyser séparément les signaux oral et nasal. Dans une étude précédente, Feng & Kotenkoff (2006) ont exploité cette idée et montré de manière préliminaire qu'un certain nombre de simplifications étaient possibles si les signaux sont considérés séparément : tout se passe comme si la composante orale avait des caractéristiques d'une configuration orale, tout en gardant l'effet de l'abaissement du velum, et que la composante nasale s'obtenait en considérant le conduit pharyngo-nasal uniquement. Cette nouvelle vision a permis une interprétation pertinente des trois voyelles nasales du français. Afin d'approfondir cette étude, ce projet consiste à d'abord adapter le dispositif de laboratoire d'enregistrement séparé (Feng & Kotenkoff, 2006) à un dispositif de type nomade (portabilité pour les études de terrain) et à approfondir les modèles acoustiques pour les nasales : le projet s'attachera ici à caractériser en laboratoire la nasalité articulatoire (EMA) et acoustique (avec la séparation des sources), et les processus de nasalisation, sur un échantillon de langues ayant un rendement différent du trait nasal au niveau phonémique (français, mandarin de Taiwan et bambara). Ensuite, l'approche du signal séparé sera appliquée au terrain du naxi de Fengke (Chine, province du Yunnan), dont la particularité est de présenter un processus de rhinoglottophilie (nasalisation des voyelles au contact de la fricative glottale /h/) qu'il sera intéressant de caractériser avec le dispositif. Les différences d'harmonie nasale dans les syllabes /h/+voyelle, en fonction du timbre vocalique, seront étudiées grâce à l'acquisition de données multilocuteur sur le terrain à Fengke auprès de locuteurs natifs d'âges différents afin de mettre en évidence une probable dynamique intergénérationnelle d'évolution. Le but est aussi ici d'interpréter l'illusion acoustico-perceptive de la nasalité suggérée dans la littérature depuis 1975 pour expliquer le caractère universel de la rhinoglottophilie. La pertinence du dispositif sera ainsi mise à l'épreuve sur l'étude fine de processus phonétiques complexes et la modélisation de la dynamique du changement. Par ailleurs, la dialectologie du naxi bénéficiera du focus effectué sur cette langue.

  • Titre traduit

    Nasal and oral speech components splitting model for the characterisation of complex dynamic phonological processes. Application to the Na languages (Yunnan, China)


  • Résumé

    In human speech, during the production of nasal sounds, a coupling between oral and nasal tracts occurs, making a very complex acoustic structure. The classical acoustic modeling methods explore this coupling, which depends on the velum position. In those cases, the total output is obtained by summing the oral output (at the lips) and the nasal output (at the nostrils). Despite a widespread use of the method, it does not account efficiently for the acoustic structure of nasalized sounds in natural languages. Nor does it explain their variation, in relationship with syllabic frontiers, laryngeal mechanisms or prosodic phenomena. Their acoustic structure also complicates the research of perceptive correlates. Because nasality is of great interest in human language studies, as evidenced by the productivity of the [±nasal] feature in phonological oppositions, despite the difficulties, there is a necessity to study this phonetic specificity, which has yet to be described in its overall complexity. Determining a methodology to characterize nasalized productions in a relevant manner poses therefore a major challenge in the search for explanations for their emergence in the world's languages, their evolution, their perception, their categorization and their acquisition. An innovative approach to tackle the issue consists in splitting oral and nasal signals before analysis. In a preceding study, Feng & Kotenkoff (2006) have probed this idea and showed preliminarily that certain simplifications were possible when considering the signals separately: it is as if the oral component bore the characteristics of an oral configuration comprising the effect of the velum lowering, and in the meantime the nasal component would be obtained by solely considering the pharyngo-nasal tract. This new approach permitted a reliable analysis of the three french nasal vowels. In order to go further, our project consists in adapting the device, designed originally for laboratory conditions (Feng & Kotenkoff, 2006) and turn it into a nomadic device for fieldwork with the aim of developing an acoustic model for the nasals based on the signal splitting approach and making the link with articulatory data using EMA. As a first step, we will test the approach in studying nasality on French, Taiwan Mandarin and Bambara. In a second phase, the signal splitting approach will be applied to the Fengke Naxi language (China, Yunnan), which presents a rhinoglottophilia process (vowels nasalization when in contact with the glottal fricative /h/) that is worth studying with this device. The differences in nasal harmony in the syllables /h/ + vowel as a function of the vocalic timbre shall be studied thanks to multi speaker data acquisitions on natives with age differences. The purpose is twofold: first, to investigate the possibility of an ongoing phonetic change. Second, to examine the acoustico-perceptive illusion of nasality, found in the literature since 1975 which suggests that rhinoglottophilia is a universal phenomenon. Finally, the Naxi dialectology will benefit from the focus exerted on this language.