Javascript must be enabled to continue!
Pronunciation and disfluency modeling for expressive speech synthesis
View through CrossRef
Modélisation de la prononciation et des disfluences pour la synthèse de la parole expressive
Dans la première partie de cette thèse, nous présentons une nouvelle méthode de production de variantes de prononciations qui adapte des prononciations standards, c'est-à-dire issues d'un dictionnaire, à un style spontané. Cette méthode utilise une vaste gamme d'informations linguistiques, articulatoires et acoustiques, ainsi qu'un cadre probabiliste d'apprentissage automatique, à savoir les champs aléatoires conditionnels (CAC) et les modèles de langage. Nos expériences poussées sur le corpus Buckeye démontrent l'efficacité de l'approche à travers des évaluations objectives et perceptives. Des tests d'écoutes sur de la parole synthétisée montrent que les prononciations adaptées sont jugées plus spontanées que les prononciations standards, et même que celle réalisées par les locuteurs du corpus étudié. Par ailleurs, nous montrons que notre méthode peut être étendue à d'autres tâches d'adaptation, par exemple pour résoudre des problèmes d'incohérences entre les différentes séquences de phonèmes manipulées par un système de synthèse. La seconde partie de la thèse explore une nouvelle approche de production automatique de disfluences dans les énoncés en entrée d'un système de synthèse de la parole. L'approche proposée offre l'avantage de considérer plusieurs types de disfluences, à savoir des pauses, des répétitions et des révisions. Pour cela, nous présentons une formalisation novatrice du processus de production de disfluences à travers un mécanisme de composition de ces disfluences. Nous présentons une première implémentation de notre processus, elle aussi fondée sur des CAC et des modèles de langage, puis conduisons des évaluations objectives et perceptives. Celles-ci nous permettent de conclure à la bonne fonctionnalité de notre proposition et d'en discuter les pistes principales d'amélioration.
Title: Pronunciation and disfluency modeling for expressive speech synthesis
Description:
Modélisation de la prononciation et des disfluences pour la synthèse de la parole expressive
Dans la première partie de cette thèse, nous présentons une nouvelle méthode de production de variantes de prononciations qui adapte des prononciations standards, c'est-à-dire issues d'un dictionnaire, à un style spontané.
Cette méthode utilise une vaste gamme d'informations linguistiques, articulatoires et acoustiques, ainsi qu'un cadre probabiliste d'apprentissage automatique, à savoir les champs aléatoires conditionnels (CAC) et les modèles de langage.
Nos expériences poussées sur le corpus Buckeye démontrent l'efficacité de l'approche à travers des évaluations objectives et perceptives.
Des tests d'écoutes sur de la parole synthétisée montrent que les prononciations adaptées sont jugées plus spontanées que les prononciations standards, et même que celle réalisées par les locuteurs du corpus étudié.
Par ailleurs, nous montrons que notre méthode peut être étendue à d'autres tâches d'adaptation, par exemple pour résoudre des problèmes d'incohérences entre les différentes séquences de phonèmes manipulées par un système de synthèse.
La seconde partie de la thèse explore une nouvelle approche de production automatique de disfluences dans les énoncés en entrée d'un système de synthèse de la parole.
L'approche proposée offre l'avantage de considérer plusieurs types de disfluences, à savoir des pauses, des répétitions et des révisions.
Pour cela, nous présentons une formalisation novatrice du processus de production de disfluences à travers un mécanisme de composition de ces disfluences.
Nous présentons une première implémentation de notre processus, elle aussi fondée sur des CAC et des modèles de langage, puis conduisons des évaluations objectives et perceptives.
Celles-ci nous permettent de conclure à la bonne fonctionnalité de notre proposition et d'en discuter les pistes principales d'amélioration.
Related Results
Speech Disfluency Made by Indonesian EFL Learners in Various Settings
Speech Disfluency Made by Indonesian EFL Learners in Various Settings
This research aimed to find out the types of speech disfluencies, to find out the frequencies of each type of speech disfluency, to find out the most dominant type of speech disflu...
EXPRESSIVE SPEECH ACT AS FOUND ON LA LA LAND MOVIE
EXPRESSIVE SPEECH ACT AS FOUND ON LA LA LAND MOVIE
In analyzing utterances there are some branches of pragmatics that we can used, one of them is speech act. Speech act is language cover an action. Speech act divided into 3 levels;...
Tindak Tutur Ekspresif dalam Akun Instagram Dakwahislamid
Tindak Tutur Ekspresif dalam Akun Instagram Dakwahislamid
This research is motivated by an interest in expressive speech acts in the Dakwahislamid instagram account which involves communication through the comments column so as to explain...
Dictionary Speech Assistant to Improve Students’ Pronunciation
Dictionary Speech Assistant to Improve Students’ Pronunciation
Non-native students often experience difficulty to learn pronunciation which then affects their speaking ability. On the other hand, proper communication requires proper pronunciat...
Tindak Tutur Ekspresif dalam Film Sejuta Sayang Untuknya karya Wiraputra Basri
Tindak Tutur Ekspresif dalam Film Sejuta Sayang Untuknya karya Wiraputra Basri
Exspressive speech act play an innportant role in the portrayal of the characters of the story characters, but they have not have not been studied much in films. This study aims to...
Expressive Illocution Speech in The Novel "Al-Lissu Wa Al-Kilāb" By Naguib Mahfouz (Pragmatic Study)
Expressive Illocution Speech in The Novel "Al-Lissu Wa Al-Kilāb" By Naguib Mahfouz (Pragmatic Study)
The novel Al-Lissu wa Al-Kilaab is one of the novels by Naguib Mahfouz containing the story of a prisoner who wants to take revenge on his best friend. The main character in this n...
Students’ Perception of English Pronunciation Application in Pronouncing Ending –s
Students’ Perception of English Pronunciation Application in Pronouncing Ending –s
Using English Pronunciation in understanding ending –s is one technique to increase the students’ competence, focusing in pronunciation, like in pronouncing ending –s. In digital e...
Tindak Tutur Ekspresif dalam Film Pendek “Kembali Pulang” Karya Klamby
Tindak Tutur Ekspresif dalam Film Pendek “Kembali Pulang” Karya Klamby
In everyday communication, expressive speech acts play an important role in conveying the speaker's emotions, feelings and attitudes towards a situation. Film as a communication me...

