Javascript must be enabled to continue!

Méthodes aléatoires pour l’apprentissage de données en grande dimension : application à l'apprentissage partagé

Cette thèse porte sur l’étude de méthodes aléatoires pour l’apprentissage de données en grande dimension. Nous proposons d'abord une approche non supervisée consistant en l'estimation des composantes principales, lorsque la taille de l'échantillon et la dimension de l'observation tendent vers l'infini. Cette approche est basée sur les matrices aléatoires et utilise des estimateurs consistants de valeurs propres et vecteurs propres de la matrice de covariance. Ensuite, dans le cadre de l’apprentissage supervisé, nous proposons une approche qui consiste à, d'abord réduire la dimension grâce à une approximation de la matrice de données originale, et ensuite réaliser une LDA dans l’espace réduit. La réduction de dimension est basée sur l’approximation de matrices de rang faible par l’utilisation de matrices aléatoires. Un algorithme d'approximation rapide de la SVD, puis une version modifiée permettant l’approximation rapide par saut spectral sont développés. Les approches sont appliquées à des données réelles images et textes. Elles permettent, par rapport à d’autres méthodes, d’obtenir un taux d’erreur assez souvent optimal, avec un temps de calcul réduit. Enfin, dans le cadre de l’apprentissage par transfert, notre contribution consiste en l’utilisation de l'alignement des sous-espaces caractéristiques et l’approximation de matrices de rang faible par projections aléatoires. La méthode proposée est appliquée à des données de référence ; elle présente l’avantage d’être performante et adaptée à des données de grande dimension

Agence Bibliographique de l'Enseignement Supérieur

Nassara Elhadji Ille Gado

2026

Title: Méthodes aléatoires pour l’apprentissage de données en grande dimension : application à l'apprentissage partagé

Description:

Cette thèse porte sur l’étude de méthodes aléatoires pour l’apprentissage de données en grande dimension.

Nous proposons d'abord une approche non supervisée consistant en l'estimation des composantes principales, lorsque la taille de l'échantillon et la dimension de l'observation tendent vers l'infini.

Cette approche est basée sur les matrices aléatoires et utilise des estimateurs consistants de valeurs propres et vecteurs propres de la matrice de covariance.

Ensuite, dans le cadre de l’apprentissage supervisé, nous proposons une approche qui consiste à, d'abord réduire la dimension grâce à une approximation de la matrice de données originale, et ensuite réaliser une LDA dans l’espace réduit.

La réduction de dimension est basée sur l’approximation de matrices de rang faible par l’utilisation de matrices aléatoires.

Un algorithme d'approximation rapide de la SVD, puis une version modifiée permettant l’approximation rapide par saut spectral sont développés.

Les approches sont appliquées à des données réelles images et textes.

Elles permettent, par rapport à d’autres méthodes, d’obtenir un taux d’erreur assez souvent optimal, avec un temps de calcul réduit.

Enfin, dans le cadre de l’apprentissage par transfert, notre contribution consiste en l’utilisation de l'alignement des sous-espaces caractéristiques et l’approximation de matrices de rang faible par projections aléatoires.

La méthode proposée est appliquée à des données de référence ; elle présente l’avantage d’être performante et adaptée à des données de grande dimension.

Back

Related Results

REGULAR ARTICLES

L. Cowen and C. J. Schwarz 657Les Radio‐tags, en raison de leur détectabilitéélevée, ...

Barycentric embeddings for geometric manifold learning : with application to shapes and graphs

Plongements barycentriques pour l'apprentissage géométrique de variétés : application aux formes et graphes Une image obtenue par IRM, c'est plus de 60 000 pixels. ...

Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec

Le présent travail a été initié dans le cadre d'un mandat donné à l'INRS-ETE par la Commission géologique du Canada (CGC) et le Ministère du Développement durable, de l'Environneme...

Trust evaluation for stream data services based on data quality and service performance

Évaluation de la fiabilité des services de flux données en se basant sur la qualité de données et la performance du service Ces dernières années ont été marquées pa...

Federated learning in neuroimage segmentation

Apprentissage fédéré en segmentation en imagerie cérébrale L'apprentissage profond en analyse d'image médicale peut amener des outils cliniques intéressants, en acc...

Some problems in Random Matrix Theory and High-Dimensional Statistics

Quelques problèmes de matrices aléatoires et de statistiques en grande dimension Cette thèse explore certains problèmes liés aux grandes matrices aléatoires et aux ...

Prediction of mobility data with prior on the topography of an infrastructure of a road network

Complétion par construction de données de mobilité avec a priori sur la topographie et infrastructure du réseau routier L'évolution de l'acquisition de données de m...

Supervised metric learning with generalization guarantees

Apprentissage supervisé de métriques avec garanties en généralisation Ces dernières années, l'importance cruciale des métriques en apprentissage automatique a mené ...

Email:
Password:

Email: