Javascript must be enabled to continue!
Dynamic optimization of data-flow task-parallel applications for large-scale NUMA systems
View through CrossRef
Optimisation dynamique des applications à base de tâches data-flow pour des machines NUMA
Au milieu des années deux mille, le développement de microprocesseurs a atteint un point à partir duquel l'augmentation de la fréquence de fonctionnement et la complexification des micro-architectures devenaient moins efficaces en termes de consommation d'énergie, poussant ainsi la densité d'énergie au delà du raisonnable. Par conséquent, l'industrie a opté pour des architectures multi-cœurs intégrant plusieurs unités de calcul sur une même puce. Les sytèmes hautes performances d'aujourd'hui sont composés de centaines de cœurs et les systèmes futurs intègreront des milliers d'unités de calcul. Afin de fournir une bande passante mémoire suffisante dans ces systèmes, la mémoire vive est distribuée physiquement sur plusieurs contrôleurs mémoire avec un accès non-uniforme à la mémoire (NUMA). Des travaux de recherche récents ont identifié les modèles de programmation à base de tâches dépendantes à granularité fine comme une approche clé pour exploiter la puissance de calcul des architectures généralistes massivement parallèles. Toutefois, peu de recherches ont été conduites sur l'optimisation dynamique des programmes parallèles à base de tâches afin de réduire l'impact négatif sur les performances résultant de la non-uniformité des accès à la mémoire. L'objectif de cette thèse est de déterminer les enjeux et les opportunités concernant l'exploitation efficace de machines many-core NUMA par des applications à base de tâches et de proposer des mécanismes efficaces, portables et entièrement automatiques pour le placement de tâches et de données, améliorant la localité des accès à la mémoire ainsi que les performances. Les décisions de placement sont basées sur l'exploitation des informations sur les dépendances entre tâches disponibles dans les run-times de langages de programmation à base de tâches modernes. Les évaluations expérimentales réalisées reposent sur notre implémentation dans le run-time du langage OpenStream et un ensemble de benchmarks scientifiques hautes performances. Enfin, nous avons développé et implémenté Aftermath, un outil d'analyse et de débogage de performances pour des applications à base de tâches et leurs run-times.
Title: Dynamic optimization of data-flow task-parallel applications for large-scale NUMA systems
Description:
Optimisation dynamique des applications à base de tâches data-flow pour des machines NUMA
Au milieu des années deux mille, le développement de microprocesseurs a atteint un point à partir duquel l'augmentation de la fréquence de fonctionnement et la complexification des micro-architectures devenaient moins efficaces en termes de consommation d'énergie, poussant ainsi la densité d'énergie au delà du raisonnable.
Par conséquent, l'industrie a opté pour des architectures multi-cœurs intégrant plusieurs unités de calcul sur une même puce.
Les sytèmes hautes performances d'aujourd'hui sont composés de centaines de cœurs et les systèmes futurs intègreront des milliers d'unités de calcul.
Afin de fournir une bande passante mémoire suffisante dans ces systèmes, la mémoire vive est distribuée physiquement sur plusieurs contrôleurs mémoire avec un accès non-uniforme à la mémoire (NUMA).
Des travaux de recherche récents ont identifié les modèles de programmation à base de tâches dépendantes à granularité fine comme une approche clé pour exploiter la puissance de calcul des architectures généralistes massivement parallèles.
Toutefois, peu de recherches ont été conduites sur l'optimisation dynamique des programmes parallèles à base de tâches afin de réduire l'impact négatif sur les performances résultant de la non-uniformité des accès à la mémoire.
L'objectif de cette thèse est de déterminer les enjeux et les opportunités concernant l'exploitation efficace de machines many-core NUMA par des applications à base de tâches et de proposer des mécanismes efficaces, portables et entièrement automatiques pour le placement de tâches et de données, améliorant la localité des accès à la mémoire ainsi que les performances.
Les décisions de placement sont basées sur l'exploitation des informations sur les dépendances entre tâches disponibles dans les run-times de langages de programmation à base de tâches modernes.
Les évaluations expérimentales réalisées reposent sur notre implémentation dans le run-time du langage OpenStream et un ensemble de benchmarks scientifiques hautes performances.
Enfin, nous avons développé et implémenté Aftermath, un outil d'analyse et de débogage de performances pour des applications à base de tâches et leurs run-times.
Related Results
Kaji efisiensi temperatur penukar panas dengan variasi aliran untuk aplikasi pengering
Kaji efisiensi temperatur penukar panas dengan variasi aliran untuk aplikasi pengering
Abstrak Heat exchanger atau alat penukar panas adalah alat-alat yang digunakan untuk mengubah temperatur fluida atau mengubah fasa fluida dengan cara mempertukarkan panasnya dengan...
CDK1-dependent N-terminal NuMA phosphorylation promotes dynein-dynactin-NuMA assembly for accurate chromosome segregation
CDK1-dependent N-terminal NuMA phosphorylation promotes dynein-dynactin-NuMA assembly for accurate chromosome segregation
Abstract
The microtubule-based motor dynein and its cofactor dynactin fulfil essential functions throughout the cell cycle, including organelle t...
Creative Flow States and Subjective Time Progression
Creative Flow States and Subjective Time Progression
There has yet to be a formal understanding of the differences between types of flow tasks and their relationships with time distortion. Anecdotal accounts of time distortions have ...
Multiphase Flow Metering:An Evaluation of Discharge Coefficients
Multiphase Flow Metering:An Evaluation of Discharge Coefficients
Abstract
The orifice discharge coefficient (CD) is the constant required to correct theoretical flow rate to actual flow rate. It is known that single phase orifi...
Pressure Analysis of DST Flow Period Or Slug Flow For Horizontal Wells In Homogeneous Reservoir
Pressure Analysis of DST Flow Period Or Slug Flow For Horizontal Wells In Homogeneous Reservoir
Abstract
By the transient pressure for horizontal well with constant flow rate and Duhamel's principle, this paper presents the method to calculate the transient ...
Determinants of Cerebrovascular Reserve in Patients with Significant Carotid Stenosis
Determinants of Cerebrovascular Reserve in Patients with Significant Carotid Stenosis
Abstract
Introduction
In patients with 70% to 99% diameter carotid artery stenosis cerebral blood flow reserve may be protectiv...
Virtual machine design for parallel dynamic programming languages
Virtual machine design for parallel dynamic programming languages
To leverage the benefits of modern hardware, dynamic languages must support parallelism, and parallelism requires a virtual machine (VM) capable of parallel execution — a parallel ...
ANALISIS KETERKAITAN KEKERASAN DENGAN PERBUATAN CABUL TERHADAP ANAK
ANALISIS KETERKAITAN KEKERASAN DENGAN PERBUATAN CABUL TERHADAP ANAK
<span id="page3R_mcid85" class="markedContent"><em><span style="left: calc(var(--scale-factor)*85.10px); top: calc(var(--scale-factor)*399.05px); font-size: calc(var...

