Javascript must be enabled to continue!
Vers un apprentissage protéiforme : accomoder les changements de signature des agents artificiels.
View through CrossRef
Le domaine de l'Apprentissage Automatique (AA) produit des agents apprenants sophistiqués: des programmes dont l'objectif est de découvrir, de façon systématique, des procédures résolvant des tâches difficiles à automatiser comme la vision artificielle, le contrôle robotique, etc. Certaines tâches posent un défi particulier parce que l'ensemble des entrées possibles de l'agent apprenant, ou ses sorties, sont naturellement amenées à changer au fil de l'apprentissage. Nous appelons ces ensembles la "signature" de l'agent. Par exemple, un capteur robotique qui cesse de fonctionner entraîne un changement de signature appelé "suppression d'entrée". Quand un nouveau moteur est branché, il y a "ajout de sortie". Ces évènements, que nous appelons "changements de signature", affectent n'importe quel agent traitant des flux de données dont la pertinence ou la disponibilité varient, pourvu qu'il vive assez longtemps. Mais quand la signature change, l'espace de recherche exploré devient indéfini, et il est coûteux, en termes de calcul, de reprendre l'apprentissage de zéro. Comment mieux accomoder les changements de signature chez les agents apprenants ?Dans tout l'AA, les algorithmes d'apprentissage sont conçus pour être robustes aux changements. En particulier, les domaines de l'Apprentissage Continu, de la Dérive Conceptuelle ou de l'Apprentissage par Transfert se soucient d'améliorer la réaction d'agents apprenants dans des contextes changeants, comme des distributions changeantes de données dans l'Apprentissage Supervisé Incrémental (ASI), ou des environments changeants dans l'Apprentissage par Reinforcement (AR). Cependant, la question d'accomoder explicitement les changements de signature n'a pas encore, à notre connaissance, été abordée par la communauté. Dans ce travail, nous suggérons qu'elle représente un important nouveau contexte d'apprentissage, l'Apprentissage Protéiforme (AP), et nous entreprenons d'initier ce domaine avec trois contributions.Premièrement, nous développons une formalisation rigoureuse de l'AP et du problème des changements de signature. En particulier, nous nous intéressons à l'ajout et la suppression d'entrée, qui constituent le sous-domaine restreint de l'AP d'Entrée (APE). Nous montrons qu'il plusieurs contextes d'APE différents et non-triviaux, et qu'un jeu de projections naturelles permet d'accomoder les évenèments APE de façon générique indépendamment de la tâche entreprise. Deuxièmement, nous concevons et conduisons une expérience synthétique pour étudier la démarche APE dans un contexte d'ASI. Nous montrons que les projections naturelles tendent à produire de meilleures accomodations que les méthodes naïves, et nous discutons cet avantage au regard des différentes propriétés de la tâche entreprise. Troisièmement, nous concevons et conduisons une autre expérience pour montrer que ces résultats s'appliquent aussi dans un contexte d'AR tabulaire. En analysant soigneusement les traces d'apprentissage, nous décomposons et documentons les nombreux effets en jeu pendant l'accomodation APE. Nous concluons que l'AP n'est pas seulement intéressant pour l'importance des défis qu'il pose, mais aussi parce qu'il existe des techniques génériques, comme les projections naturelles que nous exhibons, qui les relèvent correctement dans les contextes testés.
Title: Vers un apprentissage protéiforme : accomoder les changements de signature des agents artificiels.
Description:
Le domaine de l'Apprentissage Automatique (AA) produit des agents apprenants sophistiqués: des programmes dont l'objectif est de découvrir, de façon systématique, des procédures résolvant des tâches difficiles à automatiser comme la vision artificielle, le contrôle robotique, etc.
Certaines tâches posent un défi particulier parce que l'ensemble des entrées possibles de l'agent apprenant, ou ses sorties, sont naturellement amenées à changer au fil de l'apprentissage.
Nous appelons ces ensembles la "signature" de l'agent.
Par exemple, un capteur robotique qui cesse de fonctionner entraîne un changement de signature appelé "suppression d'entrée".
Quand un nouveau moteur est branché, il y a "ajout de sortie".
Ces évènements, que nous appelons "changements de signature", affectent n'importe quel agent traitant des flux de données dont la pertinence ou la disponibilité varient, pourvu qu'il vive assez longtemps.
Mais quand la signature change, l'espace de recherche exploré devient indéfini, et il est coûteux, en termes de calcul, de reprendre l'apprentissage de zéro.
Comment mieux accomoder les changements de signature chez les agents apprenants ?Dans tout l'AA, les algorithmes d'apprentissage sont conçus pour être robustes aux changements.
En particulier, les domaines de l'Apprentissage Continu, de la Dérive Conceptuelle ou de l'Apprentissage par Transfert se soucient d'améliorer la réaction d'agents apprenants dans des contextes changeants, comme des distributions changeantes de données dans l'Apprentissage Supervisé Incrémental (ASI), ou des environments changeants dans l'Apprentissage par Reinforcement (AR).
Cependant, la question d'accomoder explicitement les changements de signature n'a pas encore, à notre connaissance, été abordée par la communauté.
Dans ce travail, nous suggérons qu'elle représente un important nouveau contexte d'apprentissage, l'Apprentissage Protéiforme (AP), et nous entreprenons d'initier ce domaine avec trois contributions.
Premièrement, nous développons une formalisation rigoureuse de l'AP et du problème des changements de signature.
En particulier, nous nous intéressons à l'ajout et la suppression d'entrée, qui constituent le sous-domaine restreint de l'AP d'Entrée (APE).
Nous montrons qu'il plusieurs contextes d'APE différents et non-triviaux, et qu'un jeu de projections naturelles permet d'accomoder les évenèments APE de façon générique indépendamment de la tâche entreprise.
Deuxièmement, nous concevons et conduisons une expérience synthétique pour étudier la démarche APE dans un contexte d'ASI.
Nous montrons que les projections naturelles tendent à produire de meilleures accomodations que les méthodes naïves, et nous discutons cet avantage au regard des différentes propriétés de la tâche entreprise.
Troisièmement, nous concevons et conduisons une autre expérience pour montrer que ces résultats s'appliquent aussi dans un contexte d'AR tabulaire.
En analysant soigneusement les traces d'apprentissage, nous décomposons et documentons les nombreux effets en jeu pendant l'accomodation APE.
Nous concluons que l'AP n'est pas seulement intéressant pour l'importance des défis qu'il pose, mais aussi parce qu'il existe des techniques génériques, comme les projections naturelles que nous exhibons, qui les relèvent correctement dans les contextes testés.
Related Results
Increased life expectancy of heart failure patients in a rural center by a multidisciplinary program
Increased life expectancy of heart failure patients in a rural center by a multidisciplinary program
Abstract
Funding Acknowledgements
Type of funding sources: None.
INTRODUCTION Patients with heart failure (HF)...
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Le présent travail a été initié dans le cadre d'un mandat donné à l'INRS-ETE par la Commission géologique du Canada (CGC) et le Ministère du Développement durable, de l'Environneme...
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and
C. J.
Schwarz
657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Dual memory system to overcome catastrophic forgetting
Dual memory system to overcome catastrophic forgetting
Modèle de mémoire double pour de l'apprentissage incrémental
L'une des principales caractéristiques qui rendent l'être humain unique est sa capacité à apprendre en ...
Résumés des conférences JRANF 2021
Résumés des conférences JRANF 2021
able des matières
Résumés. 140
Agenda Formation en Radioprotection JRANF 2021 Ouagadougou. 140
RPF 1 Rappel des unités de doses. 140
RPF 2 Risques déterministes et stochastique...
Avant-propos
Avant-propos
L’Agriculture Biologique (AB) se présente comme un mode de production agricole spécifique basé sur le respect d’un certain nombre de principes et de pratiques visant à réduire au m...
De la poésie à la peinture
De la poésie à la peinture
La poésie et la peinture étaient toujours deux différentes expressions de l’esprit et de l’âme de l’homme qui sont dédiées à présenter absolument chacune à sa façon ce qui était di...
Trustworthy collaborative learning : Personalization, privacy, and robustness at the edge
Trustworthy collaborative learning : Personalization, privacy, and robustness at the edge
Apprentissage collaboratif de confiance : Personnalisation, confidentialité et cobustesse en environnements décentralisés
Il y a une vingtaine d'années, l'émergence...

