Javascript must be enabled to continue!

Mining complex data and biclustering using formal concept analysis

Fouille de données complexes et biclustering avec l'analyse formelle de concepts L'extraction de connaissances dans les bases de données (ECBD) est un processus qui s'applique à de (potentiellement larges) volumes de données pour découvrir des motifs qui peuvent être signifiants et utiles. Dans cette thèse, on s'intéresse à deux étapes du processus d'ECBD, la transformation et la fouille, que nous appliquons à des données complexes. Nous présentons de nombreuses expérimentations s'appuyant sur des approches et des types de données variés. La première partie de cette thèse s'intéresse à la tâche de biclustering en s'appuyant sur l'analyse formelle de concepts (FCA) et aux pattern structures. FCA est naturellement liée au biclustering, dont l'objectif consiste à grouper simultanément un ensemble de lignes et de colonnes qui vérifient certaines régularités. Les pattern structures sont une généralisation de la FCA qui permet de travailler avec des données plus complexes. Les "partition pattern structures'' ont été proposées pour du biclustering à colonnes constantes tandis que les "interval pattern structures'' ont été étudiées pour du biclustering à colonnes similaires. Nous proposons ici d'étendre ces approches afin d'énumérer d'autres types de biclusters : additif, multiplicatif, préservant l'ordre, et changement de signes cohérents. Dans la seconde partie, nous nous intéressons à deux expériences de fouille de données complexes. Premièrement, nous présentons une contribution dans laquelle nous analysons les trajectoires des visiteurs d'un musée dans le cadre du projet CrossCult. Nous utilisons du clustering de séquences et de la fouille de motifs séquentiels basée sur l'analyse formelle de concepts pour découvrir des motifs dans les données et classifier les trajectoires. Cette analyse peut ensuite être exploitée par un système de recommandation pour les futurs visiteurs. Deuxièmement, nous présentons un travail sur la découverte de médicaments antibactériens. Les jeux de données pour cette tâche, généralement des matrices numériques, décrivent des molécules par un certain nombre de variables/attributs. Le grand nombre de variables complexifie la classification des molécules par les classifieurs. Ici, nous étudions une approche de sélection de variables basée sur l'analyse log-linéaire qui découvre des associations entre variables.

Agence Bibliographique de l'Enseignement Supérieur

Nyoman Juniarta

2026

Title: Mining complex data and biclustering using formal concept analysis

Description:

Dans cette thèse, on s'intéresse à deux étapes du processus d'ECBD, la transformation et la fouille, que nous appliquons à des données complexes.

Nous présentons de nombreuses expérimentations s'appuyant sur des approches et des types de données variés.

La première partie de cette thèse s'intéresse à la tâche de biclustering en s'appuyant sur l'analyse formelle de concepts (FCA) et aux pattern structures.

FCA est naturellement liée au biclustering, dont l'objectif consiste à grouper simultanément un ensemble de lignes et de colonnes qui vérifient certaines régularités.

Les pattern structures sont une généralisation de la FCA qui permet de travailler avec des données plus complexes.

Les "partition pattern structures'' ont été proposées pour du biclustering à colonnes constantes tandis que les "interval pattern structures'' ont été étudiées pour du biclustering à colonnes similaires.

Nous proposons ici d'étendre ces approches afin d'énumérer d'autres types de biclusters : additif, multiplicatif, préservant l'ordre, et changement de signes cohérents.

Dans la seconde partie, nous nous intéressons à deux expériences de fouille de données complexes.

Premièrement, nous présentons une contribution dans laquelle nous analysons les trajectoires des visiteurs d'un musée dans le cadre du projet CrossCult.

Nous utilisons du clustering de séquences et de la fouille de motifs séquentiels basée sur l'analyse formelle de concepts pour découvrir des motifs dans les données et classifier les trajectoires.

Cette analyse peut ensuite être exploitée par un système de recommandation pour les futurs visiteurs.

Deuxièmement, nous présentons un travail sur la découverte de médicaments antibactériens.

Les jeux de données pour cette tâche, généralement des matrices numériques, décrivent des molécules par un certain nombre de variables/attributs.

Le grand nombre de variables complexifie la classification des molécules par les classifieurs.

Ici, nous étudions une approche de sélection de variables basée sur l'analyse log-linéaire qui découvre des associations entre variables.

Back

Abstract. This study aims to identify simultaneous clustering patterns of infectious diseases and their distribution across three provinces in Java Island in 2023, using the biclus...

Biclustering Models Under Collinearity in Simulated Biological Experiments

Biclustering models allow simultaneous detection of group observations that are related to variables in a data matrix. Such methods have been applied in biological data for classif...

Light at the End of the Tunnel: Mining Justice and Health

The mining industry provides valuable mined commodities and financial support for communities worldwide. Mining has become safer for workers. Significant injustices, however, are c...

A Combinatoric biclustering algorithm

The unsupervised analysis of gene expression data plays a very important role in Genetics experiments. That is why a lot of clustering and biclustering techniques have been propose...

Simultaneous Detection of Cheaters and Compromised Items Using a Biclustering Approach

Traditional methods for detecting cheating in assessments tend to focus on either identifying cheaters or compromised items in isolation, overlooking their interconnection. In this...

Impact of Mining on Socioeconomic Status in Puno, Peru

This study examines the direct and indirect effects of mining activities on key socioeconomic indicators such as per capita income, the Human Development Index (HDI), and education...

Optimisation of potash mining technology for cell and pillar mining method

The diverse demand for inorganic fertilizers has predetermined the intensification of potash mining, which is a raw material for their production. In this regard, it has become nec...

The Significance of Text Mining in Research: A Comprehensive Review

Text mining has emerged as a pivotal tool in various domains of research, revolutionizing the way scholars and scientists extract valuable insights from vast volumes of textual dat...

Email:
Password:

Email:

Mining complex data and biclustering using formal concept analysis

Related Results