Javascript must be enabled to continue!
Contributions à la recherche de sous-groupes : définition, optimisation et exploitabilité
View through CrossRef
La Science des Données est un domaine qui s'intéresse à chaque étape de l'exploitation des données. En effet, ce domaine regroupe aussi bien les méthodes d'extraction de connaissances, l'accessibilité de ces méthodes et leurs applications dans plusieurs domaines tels que la santé, l’agriculture, le marketing ou les investissements financiers. Les travaux en Science des Données s'articulent autour de 4 grands axes de recherche.L’un des premiers axes de recherche de la Science des Données concerne la conception de Méthodes d’analyse. En effet, l'exploitation des connaissances extraites des données influence la gestion de plusieurs domaines. Par conséquent, il est important pour l'utilisateur de savoir identifier le type d'information qu'il souhaite extraire pour ensuite trouver la méthode la mieux adaptée.Un autre axe important de la Science des Données concerne l’Optimisation des approches. Un grand nombre de méthodes a été proposé dans la littérature pour optimiser les méthodes d'analyse. Plusieurs travaux se sont orientés sur l'amélioration des performances des méthodes existantes en se concentrant sur trois grandes problématiques : réduction de la mémoire utilisée, réduction du temps de calcul et l’amélioration des résultats obtenus.Les Outils d'analyse des données concernent l'axe de la Science des Données qui se concentre sur le développement d'outils logiciels qui ont pour objectif de faciliter la mise en œuvre des méthodes d'analyse dans des projets d'étude. En effet, si de nombreux algorithmes sont aujourd'hui proposés dans la littérature pour aborder différentes problématiques de la Science des Données, l'absence de développement ou d'intégration de ces algorithmes à des solutions logicielles est un frein à leur utilisation et à leur mise en application sur le terrain. C'est la raison pour laquelle un des enjeux majeurs de la démocratisation et de la valorisation des approches d'analyse concerne l'implémentation d'outils graphiques ergonomiques qui facilitent l'importation de données, l'utilisation et le paramétrage des méthodes d'analyse ainsi que la visualisation des résultats.Enfin, l'Application à des problèmes réels est un axe qui se consacre à la mise en œuvre des approches issues de la Science des Données dans le but d'aborder des problématiques du monde réel. Cet axe est sans doute le plus connu du grand public et le plus médiatisé, puisque la Science des Données a permis, ces dernières années, d'aborder avec succès une grande variété de problèmes. Ainsi, dans le domaine applicatif, l'objectif consiste à tirer profit des méthodes d'analyse et des outils développés pour apporter des réponses à des problématiques de terrain.Dans ce travail de thèse, nous nous sommes concentrés sur une catégorie de méthodes de la Science des données appelée recherche de sous-groupes. Il s’agit d’une approche descriptive ayant pour but d'identifier des sous-ensembles au sein de jeux de données ayant des caractéristiques particulières, par exemple ceux qui s'éloignent le plus de la moyenne.
Title: Contributions à la recherche de sous-groupes : définition, optimisation et exploitabilité
Description:
La Science des Données est un domaine qui s'intéresse à chaque étape de l'exploitation des données.
En effet, ce domaine regroupe aussi bien les méthodes d'extraction de connaissances, l'accessibilité de ces méthodes et leurs applications dans plusieurs domaines tels que la santé, l’agriculture, le marketing ou les investissements financiers.
Les travaux en Science des Données s'articulent autour de 4 grands axes de recherche.
L’un des premiers axes de recherche de la Science des Données concerne la conception de Méthodes d’analyse.
En effet, l'exploitation des connaissances extraites des données influence la gestion de plusieurs domaines.
Par conséquent, il est important pour l'utilisateur de savoir identifier le type d'information qu'il souhaite extraire pour ensuite trouver la méthode la mieux adaptée.
Un autre axe important de la Science des Données concerne l’Optimisation des approches.
Un grand nombre de méthodes a été proposé dans la littérature pour optimiser les méthodes d'analyse.
Plusieurs travaux se sont orientés sur l'amélioration des performances des méthodes existantes en se concentrant sur trois grandes problématiques : réduction de la mémoire utilisée, réduction du temps de calcul et l’amélioration des résultats obtenus.
Les Outils d'analyse des données concernent l'axe de la Science des Données qui se concentre sur le développement d'outils logiciels qui ont pour objectif de faciliter la mise en œuvre des méthodes d'analyse dans des projets d'étude.
En effet, si de nombreux algorithmes sont aujourd'hui proposés dans la littérature pour aborder différentes problématiques de la Science des Données, l'absence de développement ou d'intégration de ces algorithmes à des solutions logicielles est un frein à leur utilisation et à leur mise en application sur le terrain.
C'est la raison pour laquelle un des enjeux majeurs de la démocratisation et de la valorisation des approches d'analyse concerne l'implémentation d'outils graphiques ergonomiques qui facilitent l'importation de données, l'utilisation et le paramétrage des méthodes d'analyse ainsi que la visualisation des résultats.
Enfin, l'Application à des problèmes réels est un axe qui se consacre à la mise en œuvre des approches issues de la Science des Données dans le but d'aborder des problématiques du monde réel.
Cet axe est sans doute le plus connu du grand public et le plus médiatisé, puisque la Science des Données a permis, ces dernières années, d'aborder avec succès une grande variété de problèmes.
Ainsi, dans le domaine applicatif, l'objectif consiste à tirer profit des méthodes d'analyse et des outils développés pour apporter des réponses à des problématiques de terrain.
Dans ce travail de thèse, nous nous sommes concentrés sur une catégorie de méthodes de la Science des données appelée recherche de sous-groupes.
Il s’agit d’une approche descriptive ayant pour but d'identifier des sous-ensembles au sein de jeux de données ayant des caractéristiques particulières, par exemple ceux qui s'éloignent le plus de la moyenne.
Related Results
Subgroups of Cremona groups
Subgroups of Cremona groups
Sous-groupes des groupes de Cremona
Le groupe de Cremona en n variables Cr_n(C) est le groupe des transformations birationnelles de l'espace projectif complexe de d...
Cartographie globale des essais cliniques
Cartographie globale des essais cliniques
Pour comprendre comment se construisent les connaissances sur l’effet des interventions en médecine, il est nécessaire de savoir où est faite la recherche clinique dans le monde, q...
Sur les représentations de Krammer génériques
Sur les représentations de Krammer génériques
Nous définissons une représentation des groupes d’Artin de type ADE par monodromie de systèmes KZ généralisés, dont nous montrons qu’elle est isomorphe à la représentation de Kramm...
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Synthèse géologique et hydrogéologique du Shale d'Utica et des unités sus-jacentes (Lorraine, Queenston et dépôts meubles), Basses-Terres du Saint-Laurent, Québec
Le présent travail a été initié dans le cadre d'un mandat donné à l'INRS-ETE par la Commission géologique du Canada (CGC) et le Ministère du Développement durable, de l'Environneme...
Recherche par image robuste par apprentissage profond
Recherche par image robuste par apprentissage profond
Cette thèse aborde la problématique de la recherche robuste d'images par apprentissage profond. La recherche par le contenu d'images consiste à trouver des images visuellement simi...
Optimisation of power electronics for regulated transformer rectifier units
Optimisation of power electronics for regulated transformer rectifier units
This study presents a comprehensive approach for the design optimisation of passive components and heatsinks in power electronic converters. The design and selection of passive com...
Emission rate and chemical state estimation by 4-dimensional variational inversion
Emission rate and chemical state estimation by 4-dimensional variational inversion
Abstract. This study aims to assess the potential and limits of an advanced inversion method to estimate pollutant precursor sources mainly from observations. Ozone, sulphur dioxid...
Multi-descriptor retrieval in digitalized photographs collections
Multi-descriptor retrieval in digitalized photographs collections
Recherche multi-descripteurs dans les fonds photographiques numérisés
La recherche d’images par contenu (CBIR) est une discipline de l’informatique qui vise à struc...

