Javascript must be enabled to continue!
Apprentissage supervisé d’une représentation multi-couches à base de dictionnaires pour la classification d’images et de vidéos
View through CrossRef
Ces dernières années, de nombreux travaux ont été publiés sur l'encodage parcimonieux et l'apprentissage de dictionnaires. Leur utilisation s'est initialement développée dans des applications de reconstruction et de restauration d'images. Plus récemment, des recherches ont été réalisées sur l'utilisation des dictionnaires pour des tâches de classification en raison de la capacité de ces méthodes à chercher des motifs sous-jacents dans les images et de bons résultats ont été obtenus dans certaines conditions : objet d'intérêt centré, de même taille, même point de vue. Cependant, hors de ce cadre restrictif, les résultats sont plus mitigés. Dans cette thèse, nous nous intéressons à la recherche de dictionnaires adaptés à la classification. Les méthodes d'apprentissage classiquement utilisées pour les dictionnaires s'appuient sur des algorithmes d'apprentissage non supervisé. Nous allons étudier ici un moyen d'effectuer l'apprentissage de dictionnaires de manière supervisée. Dans l'objectif de pousser encore plus loin le caractère discriminant des codes obtenus par les dictionnaires proposés, nous introduisons également une architecture multicouche de dictionnaires. L'architecture proposée s'appuie sur la description locale d'une image en entrée et sa transformation grâce à une succession d'encodage et de traitements, et fournit en sortie un ensemble de descripteurs adaptés à la classification. La méthode d'apprentissage que nous avons développé est basée sur l'algorithme de rétro-propagation du gradient permettant un apprentissage coordonné des différents dictionnaires et une optimisation uniquement par rapport à un coût de classification. L’architecture proposée a été testée sur les bases de données d’images MNIST, CIFAR-10 et STL-10 avec de bons résultats par rapport aux autres méthodes basées sur l’utilisation de dictionnaires. La structure proposée peut être étendue à l’analyse de vidéos.
Title: Apprentissage supervisé d’une représentation multi-couches à base de dictionnaires pour la classification d’images et de vidéos
Description:
Ces dernières années, de nombreux travaux ont été publiés sur l'encodage parcimonieux et l'apprentissage de dictionnaires.
Leur utilisation s'est initialement développée dans des applications de reconstruction et de restauration d'images.
Plus récemment, des recherches ont été réalisées sur l'utilisation des dictionnaires pour des tâches de classification en raison de la capacité de ces méthodes à chercher des motifs sous-jacents dans les images et de bons résultats ont été obtenus dans certaines conditions : objet d'intérêt centré, de même taille, même point de vue.
Cependant, hors de ce cadre restrictif, les résultats sont plus mitigés.
Dans cette thèse, nous nous intéressons à la recherche de dictionnaires adaptés à la classification.
Les méthodes d'apprentissage classiquement utilisées pour les dictionnaires s'appuient sur des algorithmes d'apprentissage non supervisé.
Nous allons étudier ici un moyen d'effectuer l'apprentissage de dictionnaires de manière supervisée.
Dans l'objectif de pousser encore plus loin le caractère discriminant des codes obtenus par les dictionnaires proposés, nous introduisons également une architecture multicouche de dictionnaires.
L'architecture proposée s'appuie sur la description locale d'une image en entrée et sa transformation grâce à une succession d'encodage et de traitements, et fournit en sortie un ensemble de descripteurs adaptés à la classification.
La méthode d'apprentissage que nous avons développé est basée sur l'algorithme de rétro-propagation du gradient permettant un apprentissage coordonné des différents dictionnaires et une optimisation uniquement par rapport à un coût de classification.
L’architecture proposée a été testée sur les bases de données d’images MNIST, CIFAR-10 et STL-10 avec de bons résultats par rapport aux autres méthodes basées sur l’utilisation de dictionnaires.
La structure proposée peut être étendue à l’analyse de vidéos.
Related Results
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and
C. J.
Schwarz
657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Efficient supervised training of shallow and deep temporally-coded spiking neural networks
Efficient supervised training of shallow and deep temporally-coded spiking neural networks
Apprentissage supervisé efficace pour les réseaux de neurones impulsionnels à codage temporel
L'informatique neuromorphique avec les réseaux de neurones impulsionne...
Standard-based lexical models for automatically structured dictionnaries
Standard-based lexical models for automatically structured dictionnaries
Modèles lexicaux standardisés pour les dictionnaires à structure automatique
Les dictionnaires peuvent être considérés comme le réservoir le plus compréhensible de ...
Supervised learning for distribution of centralised multiagent patrolling strategies
Supervised learning for distribution of centralised multiagent patrolling strategies
Apprentissage supervisé pour la distribution de stratégies de patrouille multi-agents centralisées
Depuis presque deux décennies, la tâche de la patrouille a fait l...
Diminution de la quantité d'Indium dans les cellules SHJ en vue d’améliorer la performance, la durabilité et la dépendance aux éléments rares
Diminution de la quantité d'Indium dans les cellules SHJ en vue d’améliorer la performance, la durabilité et la dépendance aux éléments rares
La technologie de cellules solaires dite à « hétérojonction de silicium » (SHJ) est la technologie basée sur un absorbeur en silicium atteignant les plus hauts rendements de conver...
Supervised metric learning with generalization guarantees
Supervised metric learning with generalization guarantees
Apprentissage supervisé de métriques avec garanties en généralisation
Ces dernières années, l'importance cruciale des métriques en apprentissage automatique a mené ...
Geometric deep learning for structural bioinformatics
Geometric deep learning for structural bioinformatics
Apprentissage profond géométrique pour la bioinformatique structurale
L'apprentissage automatique a permis plusieurs percées dans la gestion des données tabulaires,...
Contributions to large-scale learning for image classification
Contributions to large-scale learning for image classification
Contributions à l'apprentissage grande échelle pour la classification d'images
La construction d'algorithmes classifiant des images à grande échelle est devenue une...

