Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Fouille de données déclarative basée sur la programmation par contraintes.

View through CrossRef
Declarative Itemset Mining Based on Constraint Programming La fouille de données est l'art de découvrir des informations à partir de bases de données.L'utilisateur spécifie le type de motifs à extraire et le spécialiste utilise des techniques pour trouver les motifs requis.De nombreuses techniques ont été introduites pour l'extraction des motifs classiques tels que les motifs fréquents, les règles d'association, etc.Cependant, l'extraction des motifs avec des propriétés supplémentaires restent un problème pour les spécialistes car des efforts algorithmiques sont requises pour gérer ces propriétés.Récemment, les chercheurs ont profité de la flexibilité de la programmation par contraintes pour modéliser plusieurs problèmes de la fouille de données.En termes de temps d'exécution, les méthodes basées sur la programmation par contraintes ne sont pas encore concurrentes avec les algorithmes spécialisées.Cependant, leur flexibilité permet la modélisation des requêtes complexes sans la nécessité de réviser le processus de résolution.Dans cette thèse, nous proposons d’utiliser la programmation par contraintes pour résoudre des problèmes de la fouille de données.Notre première contribution est un modèle basé sur la programmation par contraintes pour l'extraction des règles d'association.Pour mettre en œuvre notre modèle, nous introduisons une nouvelle contrainte globale,CONFIDENT, pour assurer la confiance des règles.Nous prouvons que propager complètement CONFIDENT est NP-difficile.Nous fournissons donc un propagateur non-complet et une décomposition pour la contrainte CONFIDENT.Nous capturons également les règles minimales non redondantes, une représentation condensée des règles d'association, en introduisant la contrainte globale GENERATOR. GENERATOR est utilisé pour extraire des motifs qui sont des générateurs. Pour cette contrainte, nous proposons un propagateur polynomial complet.Notre deuxième contribution est un model générique basé sur la programmation par contraintes permettant l'extraction des deux frontières des motifs fréquents, à savoir la frontière positive ou les motifs maximaux fréquents et la frontière négative ou les motifs minimaux infréquents.Il est facile de choisir la frontière à extraire en fixant un simple paramètre.Pour cela, nous introduisons deux nouvelles contraintes globales, FREQUENTSUBS et INFREQUENTSUPERS,avec des propagateurs polynomiaux complets.Nous examinons ensuite le problème de l'extraction des frontières avec des contraintes supplémentaires.Nous prouvons que ce problème est coNP-difficile. Cela implique qu’il n’existe aucun CSP représentant ce problème (sauf si coNP est dans NP).
Agence Bibliographique de l'Enseignement Supérieur
Title: Fouille de données déclarative basée sur la programmation par contraintes.
Description:
Declarative Itemset Mining Based on Constraint Programming La fouille de données est l'art de découvrir des informations à partir de bases de données.
L'utilisateur spécifie le type de motifs à extraire et le spécialiste utilise des techniques pour trouver les motifs requis.
De nombreuses techniques ont été introduites pour l'extraction des motifs classiques tels que les motifs fréquents, les règles d'association, etc.
Cependant, l'extraction des motifs avec des propriétés supplémentaires restent un problème pour les spécialistes car des efforts algorithmiques sont requises pour gérer ces propriétés.
Récemment, les chercheurs ont profité de la flexibilité de la programmation par contraintes pour modéliser plusieurs problèmes de la fouille de données.
En termes de temps d'exécution, les méthodes basées sur la programmation par contraintes ne sont pas encore concurrentes avec les algorithmes spécialisées.
Cependant, leur flexibilité permet la modélisation des requêtes complexes sans la nécessité de réviser le processus de résolution.
Dans cette thèse, nous proposons d’utiliser la programmation par contraintes pour résoudre des problèmes de la fouille de données.
Notre première contribution est un modèle basé sur la programmation par contraintes pour l'extraction des règles d'association.
Pour mettre en œuvre notre modèle, nous introduisons une nouvelle contrainte globale,CONFIDENT, pour assurer la confiance des règles.
Nous prouvons que propager complètement CONFIDENT est NP-difficile.
Nous fournissons donc un propagateur non-complet et une décomposition pour la contrainte CONFIDENT.
Nous capturons également les règles minimales non redondantes, une représentation condensée des règles d'association, en introduisant la contrainte globale GENERATOR.
GENERATOR est utilisé pour extraire des motifs qui sont des générateurs.
Pour cette contrainte, nous proposons un propagateur polynomial complet.
Notre deuxième contribution est un model générique basé sur la programmation par contraintes permettant l'extraction des deux frontières des motifs fréquents, à savoir la frontière positive ou les motifs maximaux fréquents et la frontière négative ou les motifs minimaux infréquents.
Il est facile de choisir la frontière à extraire en fixant un simple paramètre.
Pour cela, nous introduisons deux nouvelles contraintes globales, FREQUENTSUBS et INFREQUENTSUPERS,avec des propagateurs polynomiaux complets.
Nous examinons ensuite le problème de l'extraction des frontières avec des contraintes supplémentaires.
Nous prouvons que ce problème est coNP-difficile.
Cela implique qu’il n’existe aucun CSP représentant ce problème (sauf si coNP est dans NP).

Related Results

Sequential Pattern Generalization for Mining Multi-source Data
Sequential Pattern Generalization for Mining Multi-source Data
Généralisation de motifs séquentiels pour la fouille de données multi-sources La digitalisation de notre monde est souvent associée à une production de grandes quan...
Trust evaluation for stream data services based on data quality and service performance
Trust evaluation for stream data services based on data quality and service performance
Évaluation de la fiabilité des services de flux données en se basant sur la qualité de données et la performance du service Ces dernières années ont été marquées pa...
REGULAR ARTICLES
REGULAR ARTICLES
L. Cowen and C. J. Schwarz       657Les Radio‐tags, en raison de leur détectabilitéélevée, ...
Unified control/observers of complex multi-robot systems using multi-objectivesquadratic programming with constraints.
Unified control/observers of complex multi-robot systems using multi-objectivesquadratic programming with constraints.
Commande et observation unifiées par programmation quadratique de systèmes multi-robotiques complexes pour des tâches multi-objectives avec contraintes. La première...
Incremental Alignment of Heterogeneous and Dynamic Data for Decision Support
Incremental Alignment of Heterogeneous and Dynamic Data for Decision Support
Alignement incrémental de données hétérogènes et dynamiques pour l'aide à la décision A l'ère du Big Data, où les données sont massives et leur complexité croissant...
Prediction of mobility data with prior on the topography of an infrastructure of a road network
Prediction of mobility data with prior on the topography of an infrastructure of a road network
Complétion par construction de données de mobilité avec a priori sur la topographie et infrastructure du réseau routier L'évolution de l'acquisition de données de m...
Co-evolution pattern mining in dynamic attributed graphs
Co-evolution pattern mining in dynamic attributed graphs
Fouille de motifs de co-evolution dans des graphes dynamiques attribués Cette thèse s'est déroulée dans le cadre du projet ANR FOSTER, "FOuille de données Spatio-Te...

Back to Top