Javascript must be enabled to continue!
Distributed Topological Data Analysis
View through CrossRef
Analyse topologique de données distribuée
L'Analyse Topologique de Données (TDA) vise à encoder de manière concise les caractéristiques structurelles de jeux de données afin de faciliter leur analyse et leur visualisation. Avec l'augmentation constante de la taille de ces données, qui dépassent de plus en plus souvent la capacité mémoire d'un ordinateur, le recours à des systèmes à mémoire distribuée, ou superordinateurs, offrant des ressources bien plus importantes, devient indispensable. Toutefois, adapter un algorithme aux superordinateurs requiert des modifications substantielles pour assurer à la fois l'exactitude des résultats et l'efficacité des calculs. Les algorithmes de TDA posent notamment des défis dans ce contexte, car ils nécessitent un accès global aux données et plusieurs parcours du jeu de données, avec peu de calculs, une combinaison qui passe généralement mal à l'échelle. De plus, les implémentations existantes pour la mémoire distribuée se concentre sur le calcul d'une seule représentation topologique. Le Topology ToolKit (TTK)vise à fournir un cadre unifié pour les algorithmes TDA avec une structure de données réutilisable et efficace. Cependant, il était jusqu'à présent limité au parallélisme à mémoire partagée. Dans cette thèse, nous ajoutons le support pour la mémoire distribuée à TTK grâce à MPI (Message Passing Interface). Dans un premier temps, nous adaptons la structure de données centrale de TTK et ajoutons le support du distribué à plusieurs algorithmes existants. Les tests de performance montrent l'efficacité de chaque algorithme ainsi que de l'infrastructure logicielle globale. De plus, nous appliquons un pipeline d'analyse topologique réel à deux jeux de données massifs afin de prouver la capacité de notre logiciel à traiter des jeux de données de grande taille. Ensuite, nous concentrons nos efforts sur une abstraction beaucoup plus complexe : le diagramme de persistance. Sa robustesse et sa fiabilité en font l'une des représentations topologiques les plus utilisées. Le Discrete Morse Sandwich (DMS) est actuellement l'algorithme le plus efficace pour calculer le diagramme sur un nœud. Notre nouvelle méthode, le Distributed Discrete Morse Sandwich (DDMS), repose sur DMS et introduit des modifications adaptées à chaque étape du calcul, aboutissant à une implémentation hybride MPI+thread. Des tests de performance montrent les gains de notre approche par rapport à la méthode DMS originale ainsi qu'à Dipha, la méthode de référence pour le calcul des diagrammes de persistance en distribué. Notre approche permet le calcul de diagrammes de persistance sur des jeux de données contenant jusqu'à 6 milliards de sommets.
Title: Distributed Topological Data Analysis
Description:
Analyse topologique de données distribuée
L'Analyse Topologique de Données (TDA) vise à encoder de manière concise les caractéristiques structurelles de jeux de données afin de faciliter leur analyse et leur visualisation.
Avec l'augmentation constante de la taille de ces données, qui dépassent de plus en plus souvent la capacité mémoire d'un ordinateur, le recours à des systèmes à mémoire distribuée, ou superordinateurs, offrant des ressources bien plus importantes, devient indispensable.
Toutefois, adapter un algorithme aux superordinateurs requiert des modifications substantielles pour assurer à la fois l'exactitude des résultats et l'efficacité des calculs.
Les algorithmes de TDA posent notamment des défis dans ce contexte, car ils nécessitent un accès global aux données et plusieurs parcours du jeu de données, avec peu de calculs, une combinaison qui passe généralement mal à l'échelle.
De plus, les implémentations existantes pour la mémoire distribuée se concentre sur le calcul d'une seule représentation topologique.
Le Topology ToolKit (TTK)vise à fournir un cadre unifié pour les algorithmes TDA avec une structure de données réutilisable et efficace.
Cependant, il était jusqu'à présent limité au parallélisme à mémoire partagée.
Dans cette thèse, nous ajoutons le support pour la mémoire distribuée à TTK grâce à MPI (Message Passing Interface).
Dans un premier temps, nous adaptons la structure de données centrale de TTK et ajoutons le support du distribué à plusieurs algorithmes existants.
Les tests de performance montrent l'efficacité de chaque algorithme ainsi que de l'infrastructure logicielle globale.
De plus, nous appliquons un pipeline d'analyse topologique réel à deux jeux de données massifs afin de prouver la capacité de notre logiciel à traiter des jeux de données de grande taille.
Ensuite, nous concentrons nos efforts sur une abstraction beaucoup plus complexe : le diagramme de persistance.
Sa robustesse et sa fiabilité en font l'une des représentations topologiques les plus utilisées.
Le Discrete Morse Sandwich (DMS) est actuellement l'algorithme le plus efficace pour calculer le diagramme sur un nœud.
Notre nouvelle méthode, le Distributed Discrete Morse Sandwich (DDMS), repose sur DMS et introduit des modifications adaptées à chaque étape du calcul, aboutissant à une implémentation hybride MPI+thread.
Des tests de performance montrent les gains de notre approche par rapport à la méthode DMS originale ainsi qu'à Dipha, la méthode de référence pour le calcul des diagrammes de persistance en distribué.
Notre approche permet le calcul de diagrammes de persistance sur des jeux de données contenant jusqu'à 6 milliards de sommets.
Related Results
Distinguishing between topological isomorphism and topological equivalence of power electronic converters
Distinguishing between topological isomorphism and topological equivalence of power electronic converters
In the process of deducing the topology of power electronic converters, scholars often use topological equivalence or topological isomorphism to identify topologies with different ...
Reprogrammable plasmonic topological insulators with ultrafast control
Reprogrammable plasmonic topological insulators with ultrafast control
Abstract
Topological photonics has revolutionized our understanding of light propagation, providing a remarkably robust way to manipulate light. Despite the intensive resea...
Generalized Topological Groupoids
Generalized Topological Groupoids
Our aim in this paper is to give the notion of generalized topological groupoid which is a generalization of the topological groupoid by
using the notion of generalized topology de...
Topological state transitions in electromagnetic topological defects
Topological state transitions in electromagnetic topological defects
Abstract
The recent emergence of electromagnetic topological defects has attracted wide interest in fields from topological photonics to deep-subwavelength light-mater inte...
Understanding topological phases of matter with statistical methods
Understanding topological phases of matter with statistical methods
Topological phases set themselves apart from other phases since they cannot be understood in terms of the usual Landau theory of phase transitions. This fact, which is a consequenc...
Floquet topological physics in photonics
Floquet topological physics in photonics
Floquet topological physics, an area exploring periodically driven systems and leveraging degrees of freedoms in the temporal dimension, has opened new avenues in photonics by enab...
A PRIMER ON SPATIAL CONCEPTS: INTRODUCING BASIC TOPOLOGY IN EARLY EDUCATION
A PRIMER ON SPATIAL CONCEPTS: INTRODUCING BASIC TOPOLOGY IN EARLY EDUCATION
This research introduces a new perspective on teaching basic topological notions in early education, guided by the directives set by the National Ministry of Education and their im...
Cubical homology-based Image Classification - A Comparative Study
Cubical homology-based Image Classification - A Comparative Study
Persistent homology is a powerful tool in topological data analysis (TDA) to compute, study and encode efficiently multi-scale topological features and is being increasingly used i...

