Javascript must be enabled to continue!

Dynamic optimization of data-flow task-parallel applications for large-scale NUMA systems

Optimisation dynamique des applications à base de tâches data-flow pour des machines NUMA Au milieu des années deux mille, le développement de microprocesseurs a atteint un point à partir duquel l'augmentation de la fréquence de fonctionnement et la complexification des micro-architectures devenaient moins efficaces en termes de consommation d'énergie, poussant ainsi la densité d'énergie au delà du raisonnable. Par conséquent, l'industrie a opté pour des architectures multi-cœurs intégrant plusieurs unités de calcul sur une même puce. Les sytèmes hautes performances d'aujourd'hui sont composés de centaines de cœurs et les systèmes futurs intègreront des milliers d'unités de calcul. Afin de fournir une bande passante mémoire suffisante dans ces systèmes, la mémoire vive est distribuée physiquement sur plusieurs contrôleurs mémoire avec un accès non-uniforme à la mémoire (NUMA). Des travaux de recherche récents ont identifié les modèles de programmation à base de tâches dépendantes à granularité fine comme une approche clé pour exploiter la puissance de calcul des architectures généralistes massivement parallèles. Toutefois, peu de recherches ont été conduites sur l'optimisation dynamique des programmes parallèles à base de tâches afin de réduire l'impact négatif sur les performances résultant de la non-uniformité des accès à la mémoire. L'objectif de cette thèse est de déterminer les enjeux et les opportunités concernant l'exploitation efficace de machines many-core NUMA par des applications à base de tâches et de proposer des mécanismes efficaces, portables et entièrement automatiques pour le placement de tâches et de données, améliorant la localité des accès à la mémoire ainsi que les performances. Les décisions de placement sont basées sur l'exploitation des informations sur les dépendances entre tâches disponibles dans les run-times de langages de programmation à base de tâches modernes. Les évaluations expérimentales réalisées reposent sur notre implémentation dans le run-time du langage OpenStream et un ensemble de benchmarks scientifiques hautes performances. Enfin, nous avons développé et implémenté Aftermath, un outil d'analyse et de débogage de performances pour des applications à base de tâches et leurs run-times.

Agence Bibliographique de l'Enseignement Supérieur

Andi Drebes

2026

Title: Dynamic optimization of data-flow task-parallel applications for large-scale NUMA systems

Description:

Par conséquent, l'industrie a opté pour des architectures multi-cœurs intégrant plusieurs unités de calcul sur une même puce.

Les sytèmes hautes performances d'aujourd'hui sont composés de centaines de cœurs et les systèmes futurs intègreront des milliers d'unités de calcul.

Afin de fournir une bande passante mémoire suffisante dans ces systèmes, la mémoire vive est distribuée physiquement sur plusieurs contrôleurs mémoire avec un accès non-uniforme à la mémoire (NUMA).

Des travaux de recherche récents ont identifié les modèles de programmation à base de tâches dépendantes à granularité fine comme une approche clé pour exploiter la puissance de calcul des architectures généralistes massivement parallèles.

Toutefois, peu de recherches ont été conduites sur l'optimisation dynamique des programmes parallèles à base de tâches afin de réduire l'impact négatif sur les performances résultant de la non-uniformité des accès à la mémoire.

L'objectif de cette thèse est de déterminer les enjeux et les opportunités concernant l'exploitation efficace de machines many-core NUMA par des applications à base de tâches et de proposer des mécanismes efficaces, portables et entièrement automatiques pour le placement de tâches et de données, améliorant la localité des accès à la mémoire ainsi que les performances.

Les décisions de placement sont basées sur l'exploitation des informations sur les dépendances entre tâches disponibles dans les run-times de langages de programmation à base de tâches modernes.

Les évaluations expérimentales réalisées reposent sur notre implémentation dans le run-time du langage OpenStream et un ensemble de benchmarks scientifiques hautes performances.

Enfin, nous avons développé et implémenté Aftermath, un outil d'analyse et de débogage de performances pour des applications à base de tâches et leurs run-times.

Back

Abstrak Heat exchanger atau alat penukar panas adalah alat-alat yang digunakan untuk mengubah temperatur fluida atau mengubah fasa fluida dengan cara mempertukarkan panasnya dengan...

CDK1-dependent N-terminal NuMA phosphorylation promotes dynein-dynactin-NuMA assembly for accurate chromosome segregation

Abstract The microtubule-based motor dynein and its cofactor dynactin fulfil essential functions throughout the cell cycle, including organelle t...

Creative Flow States and Subjective Time Progression

There has yet to be a formal understanding of the differences between types of flow tasks and their relationships with time distortion. Anecdotal accounts of time distortions have ...

Multiphase Flow Metering:An Evaluation of Discharge Coefficients

Abstract The orifice discharge coefficient (CD) is the constant required to correct theoretical flow rate to actual flow rate. It is known that single phase orifi...

Pressure Analysis of DST Flow Period Or Slug Flow For Horizontal Wells In Homogeneous Reservoir

Abstract By the transient pressure for horizontal well with constant flow rate and Duhamel's principle, this paper presents the method to calculate the transient ...

Determinants of Cerebrovascular Reserve in Patients with Significant Carotid Stenosis

Abstract Introduction In patients with 70% to 99% diameter carotid artery stenosis cerebral blood flow reserve may be protectiv...

Virtual machine design for parallel dynamic programming languages

To leverage the benefits of modern hardware, dynamic languages must support parallelism, and parallelism requires a virtual machine (VM) capable of parallel execution — a parallel ...

ANALISIS KETERKAITAN KEKERASAN DENGAN PERBUATAN CABUL TERHADAP ANAK

<span id="page3R_mcid85" class="markedContent"><em><span style="left: calc(var(--scale-factor)*85.10px); top: calc(var(--scale-factor)*399.05px); font-size: calc(var...

Email:
Password:

Email:

Dynamic optimization of data-flow task-parallel applications for large-scale NUMA systems

Related Results