Javascript must be enabled to continue!
Mesure non-invasive du mouvement des cordes vocales en échographie
View through CrossRef
Le projet VOCALISE a pour but d'étudier de manière non invasive la dynamique des cordes vocales, en termes de mouvement et de vibration, à partir d'acquisitions échographiques et d'enregistrements vocaux. Ce projet veut mettre en place une évaluation quantitative afin de diagnostiquer une éventuelle paralysie des cordes vocales (PCV) chez les patients après une chirurgie thyroïdienne/parathyroïdienne, dans l'objectif d'aider à mesurer l'efficacité de la rééducation orthophonique. Cette thèse, qui fait partie intégrante de VOCALISE, se focalise sur la quantification du mouvement des cordes vocales à partir d'acquisitions échographiques translaryngées réalisées en mode B.Dans un premier temps, l'approche proposée consiste à détecter automatiquement dans une séquence d'images le sommet du cartilage thyroïdien et les cartilages aryténoïdes, dont les mouvements constituent des marqueurs de substitution du mouvement des cordes vocales. La base de données locale, qui a servi pour ce travail, comprend 294 vidéos issues de 257 sujets différents (témoins et patients atteints de PCV). Les trois cartilages ont été annotés sur un nombre total de 26 516 images, ce qui a permis d'entraîner et d'évaluer différents modèles de détection reposant sur des approches d'apprentissage profond. La performance de plusieurs modèles a été comparée, incluant des variantes de la famille YOLO, des modèles de type Transformer, ainsi que des modèles intégrant le contexte temporel en entrée de l'apprentissage. Le modèle le plus performant et le plus parcimonieux est le modèle YOLOv7-tiny. Sur la base de test indépendante de la base d'apprentissage, il a réalisé les détections des trois cartilages avec une précision moyenne de 0,748 et un rappel moyen de 0,728 au niveau des images. Finalement, un ensemble de cinq modèles a été construit à partir de l'entièreté de la base de données par validation croisée. Sur les cinq plis, la précision moyenne a été de 0,780±0,023 et le rappel moyen de 0,765±0,016. L'évaluation de ces modèles sur une nouvelle base de données indépendante, construite dans le cadre du projet VOCALISE a cependant montré des performances moindres (précision et rappel autour de 0,60). Les analyses plus approfondies ont montré l'impact majeur de la qualité des images sur les performances du modèle.Dans un second temps, une représentation graphique de la trajectoire des cartilages au cours d'une séquence d'images a été générée à partir des coordonnées extraites par le modèle de détection. Cet outil permet de visualiser la mobilité globale des structures laryngées et facilite la détection d'une éventuelle paralysie. En s'appuyant sur ces coordonnées, des indices de symétrie et des fractions de mobilité (gauche et droite) ont été systématiquement calculés. Une forte association a été établie entre la valeur de ces indices et l'état des cordes vocales (PCV ou non).Enfin, un classificateur de type séparateurs à vaste marge a été développé à partir des détections du modèle YOLOv7-tiny afin de prédire la PCV. Il a atteint une sensibilité de 0,79 et une spécificité de 0,48 sur la base de test. L'amélioration de la précision du suivi des structures laryngées demeure une étape clé pour affiner la classification. A terme, cette approche basée sur le mouvement sera couplée à des données vibratoires pour offrir une analyse multimodale de la fonction vocale.
Title: Mesure non-invasive du mouvement des cordes vocales en échographie
Description:
Le projet VOCALISE a pour but d'étudier de manière non invasive la dynamique des cordes vocales, en termes de mouvement et de vibration, à partir d'acquisitions échographiques et d'enregistrements vocaux.
Ce projet veut mettre en place une évaluation quantitative afin de diagnostiquer une éventuelle paralysie des cordes vocales (PCV) chez les patients après une chirurgie thyroïdienne/parathyroïdienne, dans l'objectif d'aider à mesurer l'efficacité de la rééducation orthophonique.
Cette thèse, qui fait partie intégrante de VOCALISE, se focalise sur la quantification du mouvement des cordes vocales à partir d'acquisitions échographiques translaryngées réalisées en mode B.
Dans un premier temps, l'approche proposée consiste à détecter automatiquement dans une séquence d'images le sommet du cartilage thyroïdien et les cartilages aryténoïdes, dont les mouvements constituent des marqueurs de substitution du mouvement des cordes vocales.
La base de données locale, qui a servi pour ce travail, comprend 294 vidéos issues de 257 sujets différents (témoins et patients atteints de PCV).
Les trois cartilages ont été annotés sur un nombre total de 26 516 images, ce qui a permis d'entraîner et d'évaluer différents modèles de détection reposant sur des approches d'apprentissage profond.
La performance de plusieurs modèles a été comparée, incluant des variantes de la famille YOLO, des modèles de type Transformer, ainsi que des modèles intégrant le contexte temporel en entrée de l'apprentissage.
Le modèle le plus performant et le plus parcimonieux est le modèle YOLOv7-tiny.
Sur la base de test indépendante de la base d'apprentissage, il a réalisé les détections des trois cartilages avec une précision moyenne de 0,748 et un rappel moyen de 0,728 au niveau des images.
Finalement, un ensemble de cinq modèles a été construit à partir de l'entièreté de la base de données par validation croisée.
Sur les cinq plis, la précision moyenne a été de 0,780±0,023 et le rappel moyen de 0,765±0,016.
L'évaluation de ces modèles sur une nouvelle base de données indépendante, construite dans le cadre du projet VOCALISE a cependant montré des performances moindres (précision et rappel autour de 0,60).
Les analyses plus approfondies ont montré l'impact majeur de la qualité des images sur les performances du modèle.
Dans un second temps, une représentation graphique de la trajectoire des cartilages au cours d'une séquence d'images a été générée à partir des coordonnées extraites par le modèle de détection.
Cet outil permet de visualiser la mobilité globale des structures laryngées et facilite la détection d'une éventuelle paralysie.
En s'appuyant sur ces coordonnées, des indices de symétrie et des fractions de mobilité (gauche et droite) ont été systématiquement calculés.
Une forte association a été établie entre la valeur de ces indices et l'état des cordes vocales (PCV ou non).
Enfin, un classificateur de type séparateurs à vaste marge a été développé à partir des détections du modèle YOLOv7-tiny afin de prédire la PCV.
Il a atteint une sensibilité de 0,79 et une spécificité de 0,48 sur la base de test.
L'amélioration de la précision du suivi des structures laryngées demeure une étape clé pour affiner la classification.
A terme, cette approche basée sur le mouvement sera couplée à des données vibratoires pour offrir une analyse multimodale de la fonction vocale.
Related Results
Résumés des conférences JRANF 2021
Résumés des conférences JRANF 2021
able des matières
Résumés. 140
Agenda Formation en Radioprotection JRANF 2021 Ouagadougou. 140
RPF 1 Rappel des unités de doses. 140
RPF 2 Risques déterministes et stochastique...
Acoustics of harps from Central Africa
Acoustics of harps from Central Africa
Acoustique des harpes d'Afrique Centrale
Les harpes d’Afrique Centrale sont des instruments de musique dont les éléments de lutherie présentent une grande diversité...
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and
C. J.
Schwarz
657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Situated Visualization in Motion
Situated Visualization in Motion
Visualisation localisée en mouvement
Dans ma thèse, je définis ce qu'est la visualisation en mouvement et j'apporte plusieurs contributions sur la manière de visual...
Neural Conversion of Social Attitudes in Speech Signals
Neural Conversion of Social Attitudes in Speech Signals
Conversion neuronale des attitudes sociales dans les signaux de parole
En tant qu’animaux sociaux, les humains communiquent entre eux en se transmettant divers type...
Thyrosonics : learning-based detection and classification of thyroid nodules from ultrasound images
Thyrosonics : learning-based detection and classification of thyroid nodules from ultrasound images
Thyrosonics : l'apprentissage automatique pour la détection et classification des nodules thyroïdiens dans les images échographiques
L'échographie est une technique...
Linear and nonlinear supersymmetry in field and string theory
Linear and nonlinear supersymmetry in field and string theory
Supersymétrie linéaire et non linéaire en théorie des champs et des cordes
L'état actuel de la physique des hautes énergies se divise en deux branches. D'un côté, n...
Aspects Clinique Et Paraclinique Des Paralysies Bilatérales Des Cordes Vocales
Aspects Clinique Et Paraclinique Des Paralysies Bilatérales Des Cordes Vocales
L’immobilité bilatérale des cordes vocales peut mettre en jeu le pronostic vital du patient. L’objectif de l’étude a été d’analyser les éléments diagnostiques à évaluer avant la pr...

