Javascript must be enabled to continue!
Optimisation de requêtes en environnements multi-clouds
View through CrossRef
La massification des données publiques pousse leurs producteurs à sous-traiter leur diffusion auprès de fournisseurs cloud, parfois sous la forme de bases de données relationnelles hébergées sous des offres de type Database-as-a-Service (DBaaS). L'étude de ces jeux de données peut passer par leur analyse croisée, qui peut être effectuée à l'aide de requêtes multi-clouds lorsque les relations sur lesquelles elles portent sont hébergées par des fournisseurs cloud différents. Dans cette perspective, un middleware gérant l'orchestration de la sous-traitance des requêtes multi-clouds auprès des fournisseurs qu'elles impliquent a été proposé. Il calcule des devis pour ses utilisateurs, afin de les informer des performances et du coût monétaire de leurs requêtes. Ces devis sont dérivés de plans d'exécution multi-clouds, produits par un optimiseur s'appuyant sur estimations sur les résultats intermédiaires des sous-requêtes. Deux stratégies de recherche ont été proposées. La première, exhaustive, permet de trouver de bons plans d'exécution pour des requêtes impliquant peu de fournisseurs. Cependant, sa complexité factorielle a conduit au développement d'une seconde stratégie, aléatoire et itérative. Celle-ci est conçue pour explorer plus rapidement une grande variété de plans d'exécution tout en ne produisant pas d'explosion combinatoire. Les estimations peuvent être erronées, diminuant ainsi la précision des devis et conduisant à l'exécution de plans sous-optimaux. Afin de protéger le middleware et ses utilisateurs des conséquences de ces erreurs, un modèle de coûts multi-clouds et une méthode d'optimisation dynamique ont été proposés. Le premier corrige les estimations fournies à l'optimiseur à l'aide de modèles d'apprentissage automatique en ligne. La seconde réoptimise les plans d'exécution multi-clouds à l'aune des valeurs constatées sur les résultats intermédiaires grâce à un système multi-agent. Le volet expérimental de cette thèse a montré que la sous-traitance des requêtes multi-clouds étaient financièrement pertinentes par rapport à un téléchargement des données qu'elles manipulent suivi d'une exécution chez un seul fournisseur cloud. Les apports de chacune des stratégies de recherche, du modèle de coûts multi-clouds et de la méthode d'optimisation dynamique, ont également été évalués.
Title: Optimisation de requêtes en environnements multi-clouds
Description:
La massification des données publiques pousse leurs producteurs à sous-traiter leur diffusion auprès de fournisseurs cloud, parfois sous la forme de bases de données relationnelles hébergées sous des offres de type Database-as-a-Service (DBaaS).
L'étude de ces jeux de données peut passer par leur analyse croisée, qui peut être effectuée à l'aide de requêtes multi-clouds lorsque les relations sur lesquelles elles portent sont hébergées par des fournisseurs cloud différents.
Dans cette perspective, un middleware gérant l'orchestration de la sous-traitance des requêtes multi-clouds auprès des fournisseurs qu'elles impliquent a été proposé.
Il calcule des devis pour ses utilisateurs, afin de les informer des performances et du coût monétaire de leurs requêtes.
Ces devis sont dérivés de plans d'exécution multi-clouds, produits par un optimiseur s'appuyant sur estimations sur les résultats intermédiaires des sous-requêtes.
Deux stratégies de recherche ont été proposées.
La première, exhaustive, permet de trouver de bons plans d'exécution pour des requêtes impliquant peu de fournisseurs.
Cependant, sa complexité factorielle a conduit au développement d'une seconde stratégie, aléatoire et itérative.
Celle-ci est conçue pour explorer plus rapidement une grande variété de plans d'exécution tout en ne produisant pas d'explosion combinatoire.
Les estimations peuvent être erronées, diminuant ainsi la précision des devis et conduisant à l'exécution de plans sous-optimaux.
Afin de protéger le middleware et ses utilisateurs des conséquences de ces erreurs, un modèle de coûts multi-clouds et une méthode d'optimisation dynamique ont été proposés.
Le premier corrige les estimations fournies à l'optimiseur à l'aide de modèles d'apprentissage automatique en ligne.
La seconde réoptimise les plans d'exécution multi-clouds à l'aune des valeurs constatées sur les résultats intermédiaires grâce à un système multi-agent.
Le volet expérimental de cette thèse a montré que la sous-traitance des requêtes multi-clouds étaient financièrement pertinentes par rapport à un téléchargement des données qu'elles manipulent suivi d'une exécution chez un seul fournisseur cloud.
Les apports de chacune des stratégies de recherche, du modèle de coûts multi-clouds et de la méthode d'optimisation dynamique, ont également été évalués.
Related Results
Optimizing similarity queries in metric spaces meeting user's expectation
Optimizing similarity queries in metric spaces meeting user's expectation
Optimisation des requêtes de similarité dans les espaces métriques répondant aux besoins des usagers
La complexité des données contenues dans les grandes bases de d...
Logics for n-ary queries in trees
Logics for n-ary queries in trees
Logiques pour requêtes n-aires dans les arbres
Beaucoup de données infrmatiques sont structurées de manière arborescente. Dans le contexte du Web, c'est le cas en p...
Privacy preserving top-k query processing over outsourced data
Privacy preserving top-k query processing over outsourced data
Préservation de la confidentialité des données externalisées dans le traitement des requêtes top-k
L’externalisation de données d’entreprise ou individuelles chez u...
Robust design optimization of electrical machines for electric and hybrid vehicles
Robust design optimization of electrical machines for electric and hybrid vehicles
Contribution méthodologique au dimensionnement optimal et robuste des machines électriques dédiées aux chaines de traction VE et VEH
Face aux préoccupations croissa...
Event detection in connected environments
Event detection in connected environments
Détection d’évènements dans des environnements connectés
L’intérêt croissant pour les environnements connectés (bâtiments, villes, usines intelligents) etl’évolutio...
Physical processes in polar stratospheric ice clouds
Physical processes in polar stratospheric ice clouds
A one‐dimensional model of cloud microphysics has been used to simulate the formation and evolution of polar stratospheric ice clouds. The model results are in general agreement wi...
Mid-level clouds are frequent above the southeast Atlantic stratocumulus clouds
Mid-level clouds are frequent above the southeast Atlantic stratocumulus clouds
Abstract. Shortwave-absorbing aerosols seasonally overlay extensive low-level stratocumulus clouds over the southeast Atlantic. While a lot of attention has been focused on the int...
Improving data engineering in connected environments with data propagation and data obsolescence detection
Improving data engineering in connected environments with data propagation and data obsolescence detection
Amélioration de l'ingénierie des données dans les environnements connectés grâce à la détection de la propagation et de l'obsolescence des données
La croissance inc...

