Javascript must be enabled to continue!

Algorithmes stochastiques pour l'apprentissage, l'optimisation et l'approximation du régime stationnaire

Dans cette thèse, nous étudions des thématiques autour des algorithmes stochastiques et c'est pour cette raison que nous débuterons ce manuscrit par des éléments généraux sur ces algorithmes en donnant des résultats historiques pour poser les bases de nos travaux. Ensuite, nous étudierons un algorithme de bandit issu des travaux de N arendra et Shapiro dont l'objectif est de déterminer parmi un choix de plusieurs sources laquelle profite le plus à l'utilisateur en évitant toutefois de passer trop de temps à tester celles qui sont moins performantes. Notre but est dans un premier temps de comprendre les faiblesses structurelles de cet algorithme pour ensuite proposer une procédure optimale pour une quantité qui mesure les performances d'un algorithme de bandit, le regret. Dans nos résultats, nous proposerons un algorithme appelé NS sur-pénalisé qui permet d'obtenir une borne de regret optimale au sens minimax au travers d'une étude fine de l'algorithme stochastique sous-jacent à cette procédure. Un second travail sera de donner des vitesses de convergence pour le processus apparaissant dans l'étude de la convergence en loi de l'algorithme NS sur-pénalisé. La particularité de l'algorithme est qu'il ne converge pas en loi vers une diffusion comme la plupart des algorithmes stochastiques mais vers un processus à sauts non-diffusif ce qui rend l'étude de la convergence à l'équilibre plus technique. Nous emploierons une technique de couplage afin d'étudier cette convergence. Le second travail de cette thèse s'inscrit dans le cadre de l'optimisation d'une fonction au moyen d'un algorithme stochastique. Nous étudierons une version stochastique de l'algorithme déterministe de boule pesante avec amortissement. La particularité de cet algorithme est d'être articulé autour d'une dynamique qui utilise une moyennisation sur tout le passé de sa trajectoire. La procédure fait appelle à une fonction dite de mémoire qui, selon les formes qu'elle prend, offre des comportements intéressants. Dans notre étude, nous verrons que deux types de mémoire sont pertinents : les mémoires exponentielles et polynomiales. Nous établirons pour commencer des résultats de convergence dans le cas général où la fonction à minimiser est non-convexe. Dans le cas de fonctions fortement convexes, nous obtenons des vitesses de convergence optimales en un sens que nous définirons. Enfin, l'étude se termine par un résultat de convergence en loi du processus après une bonne renormalisation. La troisième partie s'articule autour des algorithmes de McKean-Vlasov qui furent introduit par Anatoly Vlasov et étudié, pour la première fois, par Henry McKean dans l'optique de la modélisation de la loi de distribution du plasma. Notre objectif est de proposer un algorithme stochastique capable d'approcher la mesure invariante du processus. Les méthodes pour approcher une mesure invariante sont connues dans le cas des diffusions et de certains autre processus mais ici la particularité du processus de McKean-Vlasov est de ne pas être une diffusion linéaire. En effet, le processus a de la mémoire comme les processus de boule pesante. De ce fait, il nous faudra développer une méthode alternative pour contourner ce problème. Nous aurons besoin d'introduire la notion de pseudo-trajectoires afin de proposer une procédure efficace.

Agence Bibliographique de l'Enseignement Supérieur

Sofiane Saadane

2026

Title: Algorithmes stochastiques pour l'apprentissage, l'optimisation et l'approximation du régime stationnaire

Description:

Ensuite, nous étudierons un algorithme de bandit issu des travaux de N arendra et Shapiro dont l'objectif est de déterminer parmi un choix de plusieurs sources laquelle profite le plus à l'utilisateur en évitant toutefois de passer trop de temps à tester celles qui sont moins performantes.

Notre but est dans un premier temps de comprendre les faiblesses structurelles de cet algorithme pour ensuite proposer une procédure optimale pour une quantité qui mesure les performances d'un algorithme de bandit, le regret.

Dans nos résultats, nous proposerons un algorithme appelé NS sur-pénalisé qui permet d'obtenir une borne de regret optimale au sens minimax au travers d'une étude fine de l'algorithme stochastique sous-jacent à cette procédure.

Un second travail sera de donner des vitesses de convergence pour le processus apparaissant dans l'étude de la convergence en loi de l'algorithme NS sur-pénalisé.

La particularité de l'algorithme est qu'il ne converge pas en loi vers une diffusion comme la plupart des algorithmes stochastiques mais vers un processus à sauts non-diffusif ce qui rend l'étude de la convergence à l'équilibre plus technique.

Nous emploierons une technique de couplage afin d'étudier cette convergence.

Le second travail de cette thèse s'inscrit dans le cadre de l'optimisation d'une fonction au moyen d'un algorithme stochastique.

Nous étudierons une version stochastique de l'algorithme déterministe de boule pesante avec amortissement.

La particularité de cet algorithme est d'être articulé autour d'une dynamique qui utilise une moyennisation sur tout le passé de sa trajectoire.

La procédure fait appelle à une fonction dite de mémoire qui, selon les formes qu'elle prend, offre des comportements intéressants.

Dans notre étude, nous verrons que deux types de mémoire sont pertinents : les mémoires exponentielles et polynomiales.

Nous établirons pour commencer des résultats de convergence dans le cas général où la fonction à minimiser est non-convexe.

Dans le cas de fonctions fortement convexes, nous obtenons des vitesses de convergence optimales en un sens que nous définirons.

Enfin, l'étude se termine par un résultat de convergence en loi du processus après une bonne renormalisation.

La troisième partie s'articule autour des algorithmes de McKean-Vlasov qui furent introduit par Anatoly Vlasov et étudié, pour la première fois, par Henry McKean dans l'optique de la modélisation de la loi de distribution du plasma.

Notre objectif est de proposer un algorithme stochastique capable d'approcher la mesure invariante du processus.

Les méthodes pour approcher une mesure invariante sont connues dans le cas des diffusions et de certains autre processus mais ici la particularité du processus de McKean-Vlasov est de ne pas être une diffusion linéaire.

En effet, le processus a de la mémoire comme les processus de boule pesante.

De ce fait, il nous faudra développer une méthode alternative pour contourner ce problème.

Nous aurons besoin d'introduire la notion de pseudo-trajectoires afin de proposer une procédure efficace.

Back

Apprentissage supervisé de métriques avec garanties en généralisation Ces dernières années, l'importance cruciale des métriques en apprentissage automatique a mené ...

Quantum algorithms for machine learning

Algorithmes quantique d’apprentissage automatique Cette thèse présente de nouveaux algorithmes quantiques pour l'apprentissage automatique. L'ordinateur quantique p...

REGULAR ARTICLES

L. Cowen and C. J. Schwarz 657Les Radio‐tags, en raison de leur détectabilitéélevée, ...

Thyrosonics : learning-based detection and classification of thyroid nodules from ultrasound images

Thyrosonics : l'apprentissage automatique pour la détection et classification des nodules thyroïdiens dans les images échographiques L'échographie est une technique...

Robust design optimization of electrical machines for electric and hybrid vehicles

Contribution méthodologique au dimensionnement optimal et robuste des machines électriques dédiées aux chaines de traction VE et VEH Face aux préoccupations croissa...

Compression and federated learning : an approach to frugal machine learning

Compression et apprentissage fédéré : une approche pour l'apprentissage machine frugal Les appareils et outils “intelligents” deviennent progressivement la norme, l...

Visual learning in Apis mellifera under virtual reality conditions

Apprentissage visuel en réalité virtuelle chez Apis mellifera Dotées d'un cerveau de moins d'un millimètre cube et contenant environ 950 000 neurones, les abeilles ...

Constrained Exploration in Reinforcement Learning

Exploration sous contrainte dans l'apprentissage par renforcement Une application majeure de l'apprentissage machine automatisée est la personnalisation des différe...

Email:
Password:

Email:

Algorithmes stochastiques pour l'apprentissage, l'optimisation et l'approximation du régime stationnaire

Related Results