Javascript must be enabled to continue!
Causal discovery from heterogeneous time series with application to IT monitoring data
View through CrossRef
Découverte causale à partir de séries temporelles hétérogènes avec application aux données de surveillance informatique
Cette thèse explore le sujet de la découverte causale à partir de séries temporelles hétérogènes.Après une revue des concepts et algorithmes fondamentaux, cette thèse présente tout d'abord CMIh, une méthode exploitant l'information mutuelle (conditionnelle) pour évaluer l'indépendance (conditionnelle) entre des variables de types hétérogènes, englobant à la fois des données qualitatives et quantitatives. En utilisant cet estimateur, un nouveau test de permutation local est introduit, LocAT (Local Adaptive Test), adapté aux variables hétérogènes. Les expériences démontrent que CMIh et LocAT estiment efficacement l'information mutuelle conditionnelle et détectent l'(in)dépendance conditionnelle pour des variables hétérogènes. De plus, une intégration de LocAT dans PCMCI, une méthode de découverte causale basée sur les contraintes pour les séries temporelles, est présentée. Les tests sur des données réelles de surveillance informatique, y compris des journaux système de l'entreprise, révèlent qu'incorporer une gamme plus large de variables, en particulier hétérogènes, améliore la découverte des relations causales et la compréhension du système.Ensuite, un modèle causal structurel pour représenter les mécanismes causaux basés sur les événements dans les systèmes informatiques basés sur des seuils est présenté, ainsi qu'un nouvel algorithme, T-RCA, pour détecter rapidement les causes racines des anomalies. Cette méthode s'avère efficace lorsque les causes racines ne sont pas liées causalement, et une extension impliquant l'intervention d'agents est proposée pour traiter cette hypothèse. L'algorithme et son extension basée sur les agents utilisent la découverte causale à partir de données hors ligne et appliquent la traversée de sous-graphes pour les nouvelles anomalies dans les données en ligne. Des tests approfondis indiquent que ces méthodes surpassent les autres, même avec des données provenant de modèles causaux structurels alternatifs ou de données réelles de surveillance informatique.Enfin, la question des séries temporelles affichant plusieurs régimes cohérents en morceaux, chacun avec des mécanismes causaux distincts, est abordée. La méthode, regime-CBNB-w, est proposée pour partitionner les séries temporelles en régimes appropriés et identifier le graphe causal de fenêtre correct, incorporant à la fois des connexions instantanées et décalées dans chaque régime. Une analyse théorique soutient que les graphes causaux de fenêtre reconstruits dans chaque régime convergent vers le graphe véritable et que l'affectation des horodatages converge vers la vérité terrain. Les expériences avec des données synthétiques confirment l'efficacité de la méthode à affecter les horodatages aux régimes corrects et à découvrir le graphe causal de fenêtre précis dans chaque régime.
Title: Causal discovery from heterogeneous time series with application to IT monitoring data
Description:
Découverte causale à partir de séries temporelles hétérogènes avec application aux données de surveillance informatique
Cette thèse explore le sujet de la découverte causale à partir de séries temporelles hétérogènes.
Après une revue des concepts et algorithmes fondamentaux, cette thèse présente tout d'abord CMIh, une méthode exploitant l'information mutuelle (conditionnelle) pour évaluer l'indépendance (conditionnelle) entre des variables de types hétérogènes, englobant à la fois des données qualitatives et quantitatives.
En utilisant cet estimateur, un nouveau test de permutation local est introduit, LocAT (Local Adaptive Test), adapté aux variables hétérogènes.
Les expériences démontrent que CMIh et LocAT estiment efficacement l'information mutuelle conditionnelle et détectent l'(in)dépendance conditionnelle pour des variables hétérogènes.
De plus, une intégration de LocAT dans PCMCI, une méthode de découverte causale basée sur les contraintes pour les séries temporelles, est présentée.
Les tests sur des données réelles de surveillance informatique, y compris des journaux système de l'entreprise, révèlent qu'incorporer une gamme plus large de variables, en particulier hétérogènes, améliore la découverte des relations causales et la compréhension du système.
Ensuite, un modèle causal structurel pour représenter les mécanismes causaux basés sur les événements dans les systèmes informatiques basés sur des seuils est présenté, ainsi qu'un nouvel algorithme, T-RCA, pour détecter rapidement les causes racines des anomalies.
Cette méthode s'avère efficace lorsque les causes racines ne sont pas liées causalement, et une extension impliquant l'intervention d'agents est proposée pour traiter cette hypothèse.
L'algorithme et son extension basée sur les agents utilisent la découverte causale à partir de données hors ligne et appliquent la traversée de sous-graphes pour les nouvelles anomalies dans les données en ligne.
Des tests approfondis indiquent que ces méthodes surpassent les autres, même avec des données provenant de modèles causaux structurels alternatifs ou de données réelles de surveillance informatique.
Enfin, la question des séries temporelles affichant plusieurs régimes cohérents en morceaux, chacun avec des mécanismes causaux distincts, est abordée.
La méthode, regime-CBNB-w, est proposée pour partitionner les séries temporelles en régimes appropriés et identifier le graphe causal de fenêtre correct, incorporant à la fois des connexions instantanées et décalées dans chaque régime.
Une analyse théorique soutient que les graphes causaux de fenêtre reconstruits dans chaque régime convergent vers le graphe véritable et que l'affectation des horodatages converge vers la vérité terrain.
Les expériences avec des données synthétiques confirment l'efficacité de la méthode à affecter les horodatages aux régimes corrects et à découvrir le graphe causal de fenêtre précis dans chaque régime.
Related Results
Causal discovery and prediction: methods and algorithms
Causal discovery and prediction: methods and algorithms
(English) This thesis focuses on the discovery of causal relations and on the prediction of causal effects. Regarding causal discovery, this thesis introduces a novel and generic m...
Use of causal claims in observational studies: a research on research study
Use of causal claims in observational studies: a research on research study
Abstract
Objective
To evaluate the consistency of causal statements in the abstracts of observational studies published in The ...
Causality, Information, and Decision-Making
Causality, Information, and Decision-Making
Causal models capture essential aspects of how we conceptualize the world and make decisions about intervening on it.
Accordingly, their study has become a central topic in current...
An introduction to causal discovery
An introduction to causal discovery
AbstractIn social sciences and economics, causal inference traditionally focuses on assessing the impact of predefined treatments (or interventions) on predefined outcomes, such as...
A Practical Guide to Causal Inference in Three-Wave Panel Studies
A Practical Guide to Causal Inference in Three-Wave Panel Studies
Causal inference from observational data poses considerable challenges. This guide explains an approach to estimating causal effects using panel data focussing on the three-wave pa...
The Challenge of Generating Causal Hypotheses Using Network Models
The Challenge of Generating Causal Hypotheses Using Network Models
Statistical network models based on Pairwise Markov Random Fields (PMRFs) are popular tools for analyzing multivariate psychological data, in large part due to their perceived role...
Foundations of causal discovery on groups of variables
Foundations of causal discovery on groups of variables
Abstract
Discovering causal relationships from observational data is a challenging task that relies on assumptions connecting statistical quantities to graphical ...
Discovering cyclic causal models in psycho-logical research
Discovering cyclic causal models in psycho-logical research
Statistical network models have become popular tools for analyzing multivariate psychological data. In empirical practice, network parameters are often interpreted as reflecting ca...

