Javascript must be enabled to continue!

Ensemble Learning for Extremely Imbalced Data Flows

Apprentissage Ensembliste sur des flux de données extrêmement déséquilibrés L'apprentissage machine est l'étude de la conception d'algorithmes qui apprennent à partir des données d'apprentissage pour réaliser une tâche spécifique. Le modèle résultant est ensuite utilisé pour prédire de nouveaux points de données (invisibles) sans aucune aide extérieure. Ces données peuvent prendre de nombreuses formes telles que des images (matrice de pixels), des signaux (sons,...), des transactions (âge, montant, commerçant,...), des journaux (temps, alertes, ...). Les ensembles de données peuvent être définis pour traiter une tâche spécifique telle que la reconnaissance d'objets, l'identification vocale, la détection d'anomalies, etc. Dans ces tâches, la connaissance des résultats escomptés encourage une approche d'apprentissage supervisé où chaque donnée observée est assignée à une étiquette qui définit ce que devraient être les prédictions du modèle. Par exemple, dans la reconnaissance d'objets, une image pourrait être associée à l'étiquette "voiture" qui suggère que l'algorithme d'apprentissage doit apprendre qu'une voiture est contenue dans cette image, quelque part. Cela contraste avec l'apprentissage non supervisé où la tâche à accomplir n'a pas d'étiquettes explicites. Par exemple, un sujet populaire dans l'apprentissage non supervisé est de découvrir les structures sous-jacentes contenues dans les données visuelles (images) telles que les formes géométriques des objets, les lignes, la profondeur, avant d'apprendre une tâche spécifique. Ce type d'apprentissage est évidemment beaucoup plus difficile car il peut y avoir un nombre infini de concepts à saisir dans les données. Dans cette thèse, nous nous concentrons sur un scénario spécifique du cadre d'apprentissage supervisé : 1) l'étiquette d'intérêt est sous-représentée (p. ex. anomalies) et 2) l'ensemble de données augmente avec le temps à mesure que nous recevons des données d'événements réels (p. ex. transactions par carte de crédit). En fait, ces deux problèmes sont très fréquents dans le domaine industriel dans lequel cette thèse se déroule.

Agence Bibliographique de l'Enseignement Supérieur

Jordan Frery

2026

Title: Ensemble Learning for Extremely Imbalced Data Flows

Description:

Le modèle résultant est ensuite utilisé pour prédire de nouveaux points de données (invisibles) sans aucune aide extérieure.

Ces données peuvent prendre de nombreuses formes telles que des images (matrice de pixels), des signaux (sons,.

), des transactions (âge, montant, commerçant,.

), des journaux (temps, alertes, .

Les ensembles de données peuvent être définis pour traiter une tâche spécifique telle que la reconnaissance d'objets, l'identification vocale, la détection d'anomalies, etc.

Dans ces tâches, la connaissance des résultats escomptés encourage une approche d'apprentissage supervisé où chaque donnée observée est assignée à une étiquette qui définit ce que devraient être les prédictions du modèle.

Par exemple, dans la reconnaissance d'objets, une image pourrait être associée à l'étiquette "voiture" qui suggère que l'algorithme d'apprentissage doit apprendre qu'une voiture est contenue dans cette image, quelque part.

Cela contraste avec l'apprentissage non supervisé où la tâche à accomplir n'a pas d'étiquettes explicites.

Par exemple, un sujet populaire dans l'apprentissage non supervisé est de découvrir les structures sous-jacentes contenues dans les données visuelles (images) telles que les formes géométriques des objets, les lignes, la profondeur, avant d'apprendre une tâche spécifique.

Ce type d'apprentissage est évidemment beaucoup plus difficile car il peut y avoir un nombre infini de concepts à saisir dans les données.

Dans cette thèse, nous nous concentrons sur un scénario spécifique du cadre d'apprentissage supervisé : 1) l'étiquette d'intérêt est sous-représentée (p.

ex.

anomalies) et 2) l'ensemble de données augmente avec le temps à mesure que nous recevons des données d'événements réels (p.

ex.

transactions par carte de crédit).

En fait, ces deux problèmes sont très fréquents dans le domaine industriel dans lequel cette thèse se déroule.

Back

The pandemic Covid-19 currently demands teachers to be able to use technology in teaching and learning process. But in reality there are still many teachers who have not been able ...

Late Amazonian lateral lava flows coeval with caldera eruptions at Arsia Mons

Introduction: The Tharsis dome is the main volcanic province on Mars. Being the locus of volcanism since at least the lower Hesperian, the age of emplacement and succession of its ...

Detailed stratigraphy of the N 2Grande Ronde Basalt, Columbia River Basalt Group, in the central Columbia Plateau

Stratigraphy of individual basalt flows in the N 2magnetostratigraphic unit of the Grande Ronde Basalt (GRB) within the central Columbia Plateau has been developed using data from ...

Selection of Injectable Drug Product Composition using Machine Learning Models (Preprint)

BACKGROUND As of July 2020, a Web of Science search of “machine learning (ML)” nested within the search of “pharmacokinetics or pharmacodynamics” yielded over 100...

Status and Trends in Research on Deep‐Water Gravity Flow Deposits

AbstractDeep‐water gravity flows are one of the most important sediment transport mechanisms on Earth. After 60 years of study, significant achievements have been made in terms of ...

Volatile Ice Presence Analysis through Mass Wasting Events Mapping in Lunar Permanently Shadowed Regions

Mass wasting events on the Moon have been documented since the Apollo era and are distributed across its surface. On Earth, the morphology and runout distance of landslides, partic...

Measurement of friction in debris flows, floods, and intermediate flows

Many different rheological models describing the behavior of debris flows are available, yet there is no general agreement on the appropriate rheology for a given problem. Here we ...

Analysis of lava flow features on Venus for radar sounder simulations

IntroductionPrevious missions to Venus depicted an environment dominated by volcanic landforms and hostile atmospheric conditions. The surface was imaged by the Magellan mission, a...

Email:
Password:

Email:

Ensemble Learning for Extremely Imbalced Data Flows

Related Results