Javascript must be enabled to continue!
Méthodes aléatoires pour l’apprentissage de données en grande dimension : application à l'apprentissage partagé
View through CrossRef
Cette thèse porte sur l’étude de méthodes aléatoires pour l’apprentissage de données en grande dimension. Nous proposons d'abord une approche non supervisée consistant en l'estimation des composantes principales, lorsque la taille de l'échantillon et la dimension de l'observation tendent vers l'infini. Cette approche est basée sur les matrices aléatoires et utilise des estimateurs consistants de valeurs propres et vecteurs propres de la matrice de covariance. Ensuite, dans le cadre de l’apprentissage supervisé, nous proposons une approche qui consiste à, d'abord réduire la dimension grâce à une approximation de la matrice de données originale, et ensuite réaliser une LDA dans l’espace réduit. La réduction de dimension est basée sur l’approximation de matrices de rang faible par l’utilisation de matrices aléatoires. Un algorithme d'approximation rapide de la SVD, puis une version modifiée permettant l’approximation rapide par saut spectral sont développés. Les approches sont appliquées à des données réelles images et textes. Elles permettent, par rapport à d’autres méthodes, d’obtenir un taux d’erreur assez souvent optimal, avec un temps de calcul réduit. Enfin, dans le cadre de l’apprentissage par transfert, notre contribution consiste en l’utilisation de l'alignement des sous-espaces caractéristiques et l’approximation de matrices de rang faible par projections aléatoires. La méthode proposée est appliquée à des données de référence ; elle présente l’avantage d’être performante et adaptée à des données de grande dimension
Title: Méthodes aléatoires pour l’apprentissage de données en grande dimension : application à l'apprentissage partagé
Description:
Cette thèse porte sur l’étude de méthodes aléatoires pour l’apprentissage de données en grande dimension.
Nous proposons d'abord une approche non supervisée consistant en l'estimation des composantes principales, lorsque la taille de l'échantillon et la dimension de l'observation tendent vers l'infini.
Cette approche est basée sur les matrices aléatoires et utilise des estimateurs consistants de valeurs propres et vecteurs propres de la matrice de covariance.
Ensuite, dans le cadre de l’apprentissage supervisé, nous proposons une approche qui consiste à, d'abord réduire la dimension grâce à une approximation de la matrice de données originale, et ensuite réaliser une LDA dans l’espace réduit.
La réduction de dimension est basée sur l’approximation de matrices de rang faible par l’utilisation de matrices aléatoires.
Un algorithme d'approximation rapide de la SVD, puis une version modifiée permettant l’approximation rapide par saut spectral sont développés.
Les approches sont appliquées à des données réelles images et textes.
Elles permettent, par rapport à d’autres méthodes, d’obtenir un taux d’erreur assez souvent optimal, avec un temps de calcul réduit.
Enfin, dans le cadre de l’apprentissage par transfert, notre contribution consiste en l’utilisation de l'alignement des sous-espaces caractéristiques et l’approximation de matrices de rang faible par projections aléatoires.
La méthode proposée est appliquée à des données de référence ; elle présente l’avantage d’être performante et adaptée à des données de grande dimension.
Related Results
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and
C. J.
Schwarz
657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Barycentric embeddings for geometric manifold learning : with application to shapes and graphs
Barycentric embeddings for geometric manifold learning : with application to shapes and graphs
Plongements barycentriques pour l'apprentissage géométrique de variétés : application aux formes et graphes
Une image obtenue par IRM, c'est plus de 60 000 pixels. ...
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Le présent travail a été initié dans le cadre d'un mandat donné à l'INRS-ETE par la Commission géologique du Canada (CGC) et le Ministère du Développement durable, de l'Environneme...
Trust evaluation for stream data services based on data quality and service performance
Trust evaluation for stream data services based on data quality and service performance
Évaluation de la fiabilité des services de flux données en se basant sur la qualité de données et la performance du service
Ces dernières années ont été marquées pa...
Federated learning in neuroimage segmentation
Federated learning in neuroimage segmentation
Apprentissage fédéré en segmentation en imagerie cérébrale
L'apprentissage profond en analyse d'image médicale peut amener des outils cliniques intéressants, en acc...
Some problems in Random Matrix Theory and High-Dimensional Statistics
Some problems in Random Matrix Theory and High-Dimensional Statistics
Quelques problèmes de matrices aléatoires et de statistiques en grande dimension
Cette thèse explore certains problèmes liés aux grandes matrices aléatoires et aux ...
Prediction of mobility data with prior on the topography of an infrastructure of a road network
Prediction of mobility data with prior on the topography of an infrastructure of a road network
Complétion par construction de données de mobilité avec a priori sur la topographie et infrastructure du réseau routier
L'évolution de l'acquisition de données de m...
Supervised metric learning with generalization guarantees
Supervised metric learning with generalization guarantees
Apprentissage supervisé de métriques avec garanties en généralisation
Ces dernières années, l'importance cruciale des métriques en apprentissage automatique a mené ...

