Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Algorithmes stochastiques pour l'apprentissage, l'optimisation et l'approximation du régime stationnaire

View through CrossRef
Dans cette thèse, nous étudions des thématiques autour des algorithmes stochastiques et c'est pour cette raison que nous débuterons ce manuscrit par des éléments généraux sur ces algorithmes en donnant des résultats historiques pour poser les bases de nos travaux. Ensuite, nous étudierons un algorithme de bandit issu des travaux de N arendra et Shapiro dont l'objectif est de déterminer parmi un choix de plusieurs sources laquelle profite le plus à l'utilisateur en évitant toutefois de passer trop de temps à tester celles qui sont moins per­formantes. Notre but est dans un premier temps de comprendre les faiblesses structurelles de cet algorithme pour ensuite proposer une procédure optimale pour une quantité qui mesure les performances d'un algorithme de bandit, le regret. Dans nos résultats, nous proposerons un algorithme appelé NS sur-pénalisé qui permet d'obtenir une borne de regret optimale au sens minimax au travers d'une étude fine de l'algorithme stochastique sous-jacent à cette procédure. Un second travail sera de donner des vitesses de convergence pour le processus apparaissant dans l'étude de la convergence en loi de l'algorithme NS sur-pénalisé. La par­ticularité de l'algorithme est qu'il ne converge pas en loi vers une diffusion comme la plupart des algorithmes stochastiques mais vers un processus à sauts non-diffusif ce qui rend l'étude de la convergence à l'équilibre plus technique. Nous emploierons une technique de couplage afin d'étudier cette convergence. Le second travail de cette thèse s'inscrit dans le cadre de l'optimisation d'une fonc­tion au moyen d'un algorithme stochastique. Nous étudierons une version stochastique de l'algorithme déterministe de boule pesante avec amortissement. La particularité de cet al­gorithme est d'être articulé autour d'une dynamique qui utilise une moyennisation sur tout le passé de sa trajectoire. La procédure fait appelle à une fonction dite de mémoire qui, selon les formes qu'elle prend, offre des comportements intéressants. Dans notre étude, nous verrons que deux types de mémoire sont pertinents : les mémoires exponentielles et poly­nomiales. Nous établirons pour commencer des résultats de convergence dans le cas général où la fonction à minimiser est non-convexe. Dans le cas de fonctions fortement convexes, nous obtenons des vitesses de convergence optimales en un sens que nous définirons. En­fin, l'étude se termine par un résultat de convergence en loi du processus après une bonne renormalisation. La troisième partie s'articule autour des algorithmes de McKean-Vlasov qui furent intro­duit par Anatoly Vlasov et étudié, pour la première fois, par Henry McKean dans l'optique de la modélisation de la loi de distribution du plasma. Notre objectif est de proposer un al­gorithme stochastique capable d'approcher la mesure invariante du processus. Les méthodes pour approcher une mesure invariante sont connues dans le cas des diffusions et de certains autre processus mais ici la particularité du processus de McKean-Vlasov est de ne pas être une diffusion linéaire. En effet, le processus a de la mémoire comme les processus de boule pesante. De ce fait, il nous faudra développer une méthode alternative pour contourner ce problème. Nous aurons besoin d'introduire la notion de pseudo-trajectoires afin de proposer une procédure efficace.
Agence Bibliographique de l'Enseignement Supérieur
Title: Algorithmes stochastiques pour l'apprentissage, l'optimisation et l'approximation du régime stationnaire
Description:
Dans cette thèse, nous étudions des thématiques autour des algorithmes stochastiques et c'est pour cette raison que nous débuterons ce manuscrit par des éléments généraux sur ces algorithmes en donnant des résultats historiques pour poser les bases de nos travaux.
Ensuite, nous étudierons un algorithme de bandit issu des travaux de N arendra et Shapiro dont l'objectif est de déterminer parmi un choix de plusieurs sources laquelle profite le plus à l'utilisateur en évitant toutefois de passer trop de temps à tester celles qui sont moins per­formantes.
Notre but est dans un premier temps de comprendre les faiblesses structurelles de cet algorithme pour ensuite proposer une procédure optimale pour une quantité qui mesure les performances d'un algorithme de bandit, le regret.
Dans nos résultats, nous proposerons un algorithme appelé NS sur-pénalisé qui permet d'obtenir une borne de regret optimale au sens minimax au travers d'une étude fine de l'algorithme stochastique sous-jacent à cette procédure.
Un second travail sera de donner des vitesses de convergence pour le processus apparaissant dans l'étude de la convergence en loi de l'algorithme NS sur-pénalisé.
La par­ticularité de l'algorithme est qu'il ne converge pas en loi vers une diffusion comme la plupart des algorithmes stochastiques mais vers un processus à sauts non-diffusif ce qui rend l'étude de la convergence à l'équilibre plus technique.
Nous emploierons une technique de couplage afin d'étudier cette convergence.
Le second travail de cette thèse s'inscrit dans le cadre de l'optimisation d'une fonc­tion au moyen d'un algorithme stochastique.
Nous étudierons une version stochastique de l'algorithme déterministe de boule pesante avec amortissement.
La particularité de cet al­gorithme est d'être articulé autour d'une dynamique qui utilise une moyennisation sur tout le passé de sa trajectoire.
La procédure fait appelle à une fonction dite de mémoire qui, selon les formes qu'elle prend, offre des comportements intéressants.
Dans notre étude, nous verrons que deux types de mémoire sont pertinents : les mémoires exponentielles et poly­nomiales.
Nous établirons pour commencer des résultats de convergence dans le cas général où la fonction à minimiser est non-convexe.
Dans le cas de fonctions fortement convexes, nous obtenons des vitesses de convergence optimales en un sens que nous définirons.
En­fin, l'étude se termine par un résultat de convergence en loi du processus après une bonne renormalisation.
La troisième partie s'articule autour des algorithmes de McKean-Vlasov qui furent intro­duit par Anatoly Vlasov et étudié, pour la première fois, par Henry McKean dans l'optique de la modélisation de la loi de distribution du plasma.
Notre objectif est de proposer un al­gorithme stochastique capable d'approcher la mesure invariante du processus.
Les méthodes pour approcher une mesure invariante sont connues dans le cas des diffusions et de certains autre processus mais ici la particularité du processus de McKean-Vlasov est de ne pas être une diffusion linéaire.
En effet, le processus a de la mémoire comme les processus de boule pesante.
De ce fait, il nous faudra développer une méthode alternative pour contourner ce problème.
Nous aurons besoin d'introduire la notion de pseudo-trajectoires afin de proposer une procédure efficace.

Related Results

Supervised metric learning with generalization guarantees
Supervised metric learning with generalization guarantees
Apprentissage supervisé de métriques avec garanties en généralisation Ces dernières années, l'importance cruciale des métriques en apprentissage automatique a mené ...
Quantum algorithms for machine learning
Quantum algorithms for machine learning
Algorithmes quantique d’apprentissage automatique Cette thèse présente de nouveaux algorithmes quantiques pour l'apprentissage automatique. L'ordinateur quantique p...
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and C. J. Schwarz       657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Thyrosonics : learning-based detection and classification of thyroid nodules from ultrasound images
Thyrosonics : learning-based detection and classification of thyroid nodules from ultrasound images
Thyrosonics : l'apprentissage automatique pour la détection et classification des nodules thyroïdiens dans les images échographiques L'échographie est une technique...
Robust design optimization of electrical machines for electric and hybrid vehicles
Robust design optimization of electrical machines for electric and hybrid vehicles
Contribution méthodologique au dimensionnement optimal et robuste des machines électriques dédiées aux chaines de traction VE et VEH Face aux préoccupations croissa...
Compression and federated learning : an approach to frugal machine learning
Compression and federated learning : an approach to frugal machine learning
Compression et apprentissage fédéré : une approche pour l'apprentissage machine frugal Les appareils et outils “intelligents” deviennent progressivement la norme, l...
Visual learning in Apis mellifera under virtual reality conditions
Visual learning in Apis mellifera under virtual reality conditions
Apprentissage visuel en réalité virtuelle chez Apis mellifera Dotées d'un cerveau de moins d'un millimètre cube et contenant environ 950 000 neurones, les abeilles ...
Constrained Exploration in Reinforcement Learning
Constrained Exploration in Reinforcement Learning
Exploration sous contrainte dans l'apprentissage par renforcement Une application majeure de l'apprentissage machine automatisée est la personnalisation des différe...

Back to Top