Javascript must be enabled to continue!
Causal discovery from heterogeneous time series with application to IT monitoring data
View through CrossRef
Découverte causale à partir de séries temporelles hétérogènes avec application aux données de surveillance informatique
Cette thèse explore le sujet de la découverte causale à partir de séries temporelles hétérogènes.Après une revue des concepts et algorithmes fondamentaux, cette thèse présente tout d'abord CMIh, une méthode exploitant l'information mutuelle (conditionnelle) pour évaluer l'indépendance (conditionnelle) entre des variables de types hétérogènes, englobant à la fois des données qualitatives et quantitatives. En utilisant cet estimateur, un nouveau test de permutation local est introduit, LocAT (Local Adaptive Test), adapté aux variables hétérogènes. Les expériences démontrent que CMIh et LocAT estiment efficacement l'information mutuelle conditionnelle et détectent l'(in)dépendance conditionnelle pour des variables hétérogènes. De plus, une intégration de LocAT dans PCMCI, une méthode de découverte causale basée sur les contraintes pour les séries temporelles, est présentée. Les tests sur des données réelles de surveillance informatique, y compris des journaux système de l'entreprise, révèlent qu'incorporer une gamme plus large de variables, en particulier hétérogènes, améliore la découverte des relations causales et la compréhension du système.Ensuite, un modèle causal structurel pour représenter les mécanismes causaux basés sur les événements dans les systèmes informatiques basés sur des seuils est présenté, ainsi qu'un nouvel algorithme, T-RCA, pour détecter rapidement les causes racines des anomalies. Cette méthode s'avère efficace lorsque les causes racines ne sont pas liées causalement, et une extension impliquant l'intervention d'agents est proposée pour traiter cette hypothèse. L'algorithme et son extension basée sur les agents utilisent la découverte causale à partir de données hors ligne et appliquent la traversée de sous-graphes pour les nouvelles anomalies dans les données en ligne. Des tests approfondis indiquent que ces méthodes surpassent les autres, même avec des données provenant de modèles causaux structurels alternatifs ou de données réelles de surveillance informatique.Enfin, la question des séries temporelles affichant plusieurs régimes cohérents en morceaux, chacun avec des mécanismes causaux distincts, est abordée. La méthode, regime-CBNB-w, est proposée pour partitionner les séries temporelles en régimes appropriés et identifier le graphe causal de fenêtre correct, incorporant à la fois des connexions instantanées et décalées dans chaque régime. Une analyse théorique soutient que les graphes causaux de fenêtre reconstruits dans chaque régime convergent vers le graphe véritable et que l'affectation des horodatages converge vers la vérité terrain. Les expériences avec des données synthétiques confirment l'efficacité de la méthode à affecter les horodatages aux régimes corrects et à découvrir le graphe causal de fenêtre précis dans chaque régime.
Title: Causal discovery from heterogeneous time series with application to IT monitoring data
Description:
Découverte causale à partir de séries temporelles hétérogènes avec application aux données de surveillance informatique
Cette thèse explore le sujet de la découverte causale à partir de séries temporelles hétérogènes.
Après une revue des concepts et algorithmes fondamentaux, cette thèse présente tout d'abord CMIh, une méthode exploitant l'information mutuelle (conditionnelle) pour évaluer l'indépendance (conditionnelle) entre des variables de types hétérogènes, englobant à la fois des données qualitatives et quantitatives.
En utilisant cet estimateur, un nouveau test de permutation local est introduit, LocAT (Local Adaptive Test), adapté aux variables hétérogènes.
Les expériences démontrent que CMIh et LocAT estiment efficacement l'information mutuelle conditionnelle et détectent l'(in)dépendance conditionnelle pour des variables hétérogènes.
De plus, une intégration de LocAT dans PCMCI, une méthode de découverte causale basée sur les contraintes pour les séries temporelles, est présentée.
Les tests sur des données réelles de surveillance informatique, y compris des journaux système de l'entreprise, révèlent qu'incorporer une gamme plus large de variables, en particulier hétérogènes, améliore la découverte des relations causales et la compréhension du système.
Ensuite, un modèle causal structurel pour représenter les mécanismes causaux basés sur les événements dans les systèmes informatiques basés sur des seuils est présenté, ainsi qu'un nouvel algorithme, T-RCA, pour détecter rapidement les causes racines des anomalies.
Cette méthode s'avère efficace lorsque les causes racines ne sont pas liées causalement, et une extension impliquant l'intervention d'agents est proposée pour traiter cette hypothèse.
L'algorithme et son extension basée sur les agents utilisent la découverte causale à partir de données hors ligne et appliquent la traversée de sous-graphes pour les nouvelles anomalies dans les données en ligne.
Des tests approfondis indiquent que ces méthodes surpassent les autres, même avec des données provenant de modèles causaux structurels alternatifs ou de données réelles de surveillance informatique.
Enfin, la question des séries temporelles affichant plusieurs régimes cohérents en morceaux, chacun avec des mécanismes causaux distincts, est abordée.
La méthode, regime-CBNB-w, est proposée pour partitionner les séries temporelles en régimes appropriés et identifier le graphe causal de fenêtre correct, incorporant à la fois des connexions instantanées et décalées dans chaque régime.
Une analyse théorique soutient que les graphes causaux de fenêtre reconstruits dans chaque régime convergent vers le graphe véritable et que l'affectation des horodatages converge vers la vérité terrain.
Les expériences avec des données synthétiques confirment l'efficacité de la méthode à affecter les horodatages aux régimes corrects et à découvrir le graphe causal de fenêtre précis dans chaque régime.
Related Results
Causal discovery and prediction: methods and algorithms
Causal discovery and prediction: methods and algorithms
(English) This thesis focuses on the discovery of causal relations and on the prediction of causal effects. Regarding causal discovery, this thesis introduces a novel and generic m...
An introduction to causal discovery
An introduction to causal discovery
AbstractIn social sciences and economics, causal inference traditionally focuses on assessing the impact of predefined treatments (or interventions) on predefined outcomes, such as...
A Practical Guide to Causal Inference in Three-Wave Panel Studies
A Practical Guide to Causal Inference in Three-Wave Panel Studies
Causal inference from observational data poses considerable challenges. This guide explains an approach to estimating causal effects using panel data focussing on the three-wave pa...
Foundations of causal discovery on groups of variables
Foundations of causal discovery on groups of variables
Abstract
Discovering causal relationships from observational data is a challenging task that relies on assumptions connecting statistical quantities to graphical or ...
Extended applicability of causal inference to compositional data by reciprocal logarithmic ratio transformation
Extended applicability of causal inference to compositional data by reciprocal logarithmic ratio transformation
AbstractUnderstanding state transition caused by several intrinsic and extrinsic factors such as environmental change and increased stress of human activities has been a significan...
Causal explanation
Causal explanation
An explanation is an answer to a why-question, and so a causal explanation is an answer to ‘Why X?’ that says something about the causes of X. For example, ‘Because it rained’ as a...
Operational decision-making with machine learning and causal inference
Operational decision-making with machine learning and causal inference
Optimizing operational decisions, routine actions within some business or operational process, is a key challenge across a variety of domains and application areas. The increasing ...
Prior Knowledge-Based Causal Inference Algorithms and Their Applications for China COVID-19 Analysis
Prior Knowledge-Based Causal Inference Algorithms and Their Applications for China COVID-19 Analysis
Causal inference has become an important research direction in the field of computing. Traditional methods have mainly used Bayesian networks to discover the causal effects between...

