Javascript must be enabled to continue!
Linear convergence of evolution strategies with covariance matrix adaptation
View through CrossRef
Convergence linéaire de stratégies d'évolution à matrices de covariances adaptatives
En tant que méthode à l’état de l’art parmis les stratégies d’évolution, CMA-ES un algorithme d’optimisation sans dérivées avec de nombreuses applications, mais dont la convergence est restée un problème ouvert depuis plus de 20 ans. Le but de cette thèse est d’apporter des garanties théoriques de convergence de CMA-ES. Ainsi, nous prouvons que CMA-ES approche le minimum de fonctions ellipsoïdes avec une erreur géometrique, et nous vérifions la conjecture de la matrice de covariance dans CMA-ES qui estime l’inverse de la Hessienne d’une fonction convexe-quadratique.Notre démonstration s’appuie sur l’analyse de processus stochastiques et est établie en plusieurs étapes.En effet, nous définissons un processus par la normalisation des variables de CMA-ES. Cette approche aréussi à analyser des ES avec adaptation du pas : en normalisant la variable de moyenne (translaté parl’optimum) par le pas, cela forme une chaîne de Markov lorsque la fonction objective est invariante parchangement d’échelle. Sous des hypothèses supplémentaires, cette chaîne est géometriquement ergodique, ce qui permet de prouver la convergence de l’algorithme. Pour CMA-ES, nous devons inclure la matrice de covariance. Nous introduisons d’abord une fonction de normalisation R sur l’espace des matrices définies positives, et la normalisation de la moyenne par le pas et la fonction R appliquée à la matrice de covariance, nous espérons obtenir un processus stationaire. Avec une matrice de covariance normalisée et des chemins d’évolution normalisés, ce processus est une chaîne de Markov pour des fonctions objectives invariantes par changement d’échelle. La preuve de sa convergence vers une probabilité stationnaire est la clé de notre démonstration et occupera les chapitres 2 et 4.Tout d’abord, nous donnons dans le chapitre 1 une méthode pour établir l’irréductibilité, l’apériodicitéet des propriétés topologiques de chaînes de Markov homogènes, à valeurs dans des variétés et avecdes mises à jour non lisses. Ceci est la généralisation d’une analyse de modèles d’espace d’état non-linéaires qui n’incluaient que des espaces d’états euclidiens et des fonctions de mise à jour continuementdifférentiables. En s’appuyant sur des résultats de l’analyse non-lisse et de la théorie de la mesure sur desvariétés topologique, nous avons pu étendre ce travail.Ces résultats préliminaires permettent une preuve de convergence de CMA-ES qui repose sur l’analysede stabilité de chaînes de Markov sous-jacentes, puisque la normalisation de la matrice de covariancedéfinit un espace d’état qui est une variété, et car les adaptations de pas standards peuvents être non-lisses. Le chapitre 2 explique comment utiliser la méthode mentionnée ci-dessus pour prover que la chaîne normalisée est une T-chaîne irréductible et apériodique.Nous démontrons ensuite son ergodicité en utilisant une méthode de Foster-Lyapunov. Dans lechapitre 4, nous trouvons une fonction de potentiel qui satisfait une condition de dérive en-dehors d’uncompact. Puisque la chaîne est une T-chaîne, les compacts sont petits et puisqu’elle est irréductible etapériodique, une condition de dérive géométrique en-dehors d’un ensemble petit démontre l’ergodicitégéometrique. Cependant, la complexité de la chaîne (avec plusieurs variables dont une matrice decovariance normalisée) nous impose to restreindre notre preuve à des fonctions objectifs ellipsoïdales.L’étape finale de notre démonstration est donnée dans le chapitre 5. Nous utilisons un théorèmeergodique et une loi des grands nombres pour déduire la convergence linéaire de CMA-ES. De plus, nousutilisons l’invariance par transformations affines de l’algorithme pour établir que la matrice de covariancede CMA-ES apprend l’inverse de la Hessienne de fonctions convexe-quadratiques, et que le taux deconvergence est indépendant de quelle fonction ellipsoïdale est minimsée.
Title: Linear convergence of evolution strategies with covariance matrix adaptation
Description:
Convergence linéaire de stratégies d'évolution à matrices de covariances adaptatives
En tant que méthode à l’état de l’art parmis les stratégies d’évolution, CMA-ES un algorithme d’optimisation sans dérivées avec de nombreuses applications, mais dont la convergence est restée un problème ouvert depuis plus de 20 ans.
Le but de cette thèse est d’apporter des garanties théoriques de convergence de CMA-ES.
Ainsi, nous prouvons que CMA-ES approche le minimum de fonctions ellipsoïdes avec une erreur géometrique, et nous vérifions la conjecture de la matrice de covariance dans CMA-ES qui estime l’inverse de la Hessienne d’une fonction convexe-quadratique.
Notre démonstration s’appuie sur l’analyse de processus stochastiques et est établie en plusieurs étapes.
En effet, nous définissons un processus par la normalisation des variables de CMA-ES.
Cette approche aréussi à analyser des ES avec adaptation du pas : en normalisant la variable de moyenne (translaté parl’optimum) par le pas, cela forme une chaîne de Markov lorsque la fonction objective est invariante parchangement d’échelle.
Sous des hypothèses supplémentaires, cette chaîne est géometriquement ergodique, ce qui permet de prouver la convergence de l’algorithme.
Pour CMA-ES, nous devons inclure la matrice de covariance.
Nous introduisons d’abord une fonction de normalisation R sur l’espace des matrices définies positives, et la normalisation de la moyenne par le pas et la fonction R appliquée à la matrice de covariance, nous espérons obtenir un processus stationaire.
Avec une matrice de covariance normalisée et des chemins d’évolution normalisés, ce processus est une chaîne de Markov pour des fonctions objectives invariantes par changement d’échelle.
La preuve de sa convergence vers une probabilité stationnaire est la clé de notre démonstration et occupera les chapitres 2 et 4.
Tout d’abord, nous donnons dans le chapitre 1 une méthode pour établir l’irréductibilité, l’apériodicitéet des propriétés topologiques de chaînes de Markov homogènes, à valeurs dans des variétés et avecdes mises à jour non lisses.
Ceci est la généralisation d’une analyse de modèles d’espace d’état non-linéaires qui n’incluaient que des espaces d’états euclidiens et des fonctions de mise à jour continuementdifférentiables.
En s’appuyant sur des résultats de l’analyse non-lisse et de la théorie de la mesure sur desvariétés topologique, nous avons pu étendre ce travail.
Ces résultats préliminaires permettent une preuve de convergence de CMA-ES qui repose sur l’analysede stabilité de chaînes de Markov sous-jacentes, puisque la normalisation de la matrice de covariancedéfinit un espace d’état qui est une variété, et car les adaptations de pas standards peuvents être non-lisses.
Le chapitre 2 explique comment utiliser la méthode mentionnée ci-dessus pour prover que la chaîne normalisée est une T-chaîne irréductible et apériodique.
Nous démontrons ensuite son ergodicité en utilisant une méthode de Foster-Lyapunov.
Dans lechapitre 4, nous trouvons une fonction de potentiel qui satisfait une condition de dérive en-dehors d’uncompact.
Puisque la chaîne est une T-chaîne, les compacts sont petits et puisqu’elle est irréductible etapériodique, une condition de dérive géométrique en-dehors d’un ensemble petit démontre l’ergodicitégéometrique.
Cependant, la complexité de la chaîne (avec plusieurs variables dont une matrice decovariance normalisée) nous impose to restreindre notre preuve à des fonctions objectifs ellipsoïdales.
L’étape finale de notre démonstration est donnée dans le chapitre 5.
Nous utilisons un théorèmeergodique et une loi des grands nombres pour déduire la convergence linéaire de CMA-ES.
De plus, nousutilisons l’invariance par transformations affines de l’algorithme pour établir que la matrice de covariancede CMA-ES apprend l’inverse de la Hessienne de fonctions convexe-quadratiques, et que le taux deconvergence est indépendant de quelle fonction ellipsoïdale est minimsée.
Related Results
Low-cost eddy covariance: a case study of evapotranspiration over agroforestry in Germany
Low-cost eddy covariance: a case study of evapotranspiration over agroforestry in Germany
Abstract. Eddy covariance has evolved as the method of choice for measurements of the ecosystem-atmosphere exchange of water vapour, sensible heat and trace gases. Under ideal cond...
Adaptive Planning for Resilient Coastal Waterfronts
Adaptive Planning for Resilient Coastal Waterfronts
Many delta and coastal cities worldwide face increasing flood risk due to changing climate conditions and sea level rise. The question is how to develop measures and strategies for...
Successful coastal adaptation projects? The role of multi-lateral climate funding.
Successful coastal adaptation projects? The role of multi-lateral climate funding.
<p><strong>This thesis investigates the evaluation of climate change adaptation success of projects in coastal zones of developing countries, specifically focusing on t...
Algorithmes d’estimation et de détection en contexte hétérogène rang faible
Algorithmes d’estimation et de détection en contexte hétérogène rang faible
Une des finalités du traitement d’antenne est la détection et la localisation de cibles en milieu bruité. Dans la plupart des cas pratiques, comme par exemple le RADAR ou le SONAR ...
Unbounded Star Convergence in Lattices
Unbounded Star Convergence in Lattices
Let L be a vector lattice, "(" x_α ") " be a L-valued net, and x∈L . If |x_α-x|∧u→┴o 0 for every u ∈〖 L〗_+ then it is said that the net "(" x_α ")" unbounded order converges ...
Generation of correlated pseudorandom varibales
Generation of correlated pseudorandom varibales
When Monte Carlo method is used to study many problems, it is sometimes necessary to sample correlated pseudorandom variables. Previous studies have shown that the Cholesky decompo...
Convergence des ensembles analytiques et des applications méromorphes
Convergence des ensembles analytiques et des applications méromorphes
L'objectif de cette thèse, est l'étude de la convergence d'applications méromorphes entre deux variétés U et X. D'abord nous rappelons trois types de convergence d'applications mér...
Matrix Subgridding and Its Effects in Dual Porosity Simulators
Matrix Subgridding and Its Effects in Dual Porosity Simulators
Abstract
Naturally fractured reservoirs are found throughout the world and contain significant amounts of oil reserves. The so-called dual porosity model is one o...

