Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Ensemble Learning for Extremely Imbalced Data Flows

View through CrossRef
Apprentissage Ensembliste sur des flux de données extrêmement déséquilibrés L'apprentissage machine est l'étude de la conception d'algorithmes qui apprennent à partir des données d'apprentissage pour réaliser une tâche spécifique. Le modèle résultant est ensuite utilisé pour prédire de nouveaux points de données (invisibles) sans aucune aide extérieure. Ces données peuvent prendre de nombreuses formes telles que des images (matrice de pixels), des signaux (sons,...), des transactions (âge, montant, commerçant,...), des journaux (temps, alertes, ...). Les ensembles de données peuvent être définis pour traiter une tâche spécifique telle que la reconnaissance d'objets, l'identification vocale, la détection d'anomalies, etc. Dans ces tâches, la connaissance des résultats escomptés encourage une approche d'apprentissage supervisé où chaque donnée observée est assignée à une étiquette qui définit ce que devraient être les prédictions du modèle. Par exemple, dans la reconnaissance d'objets, une image pourrait être associée à l'étiquette "voiture" qui suggère que l'algorithme d'apprentissage doit apprendre qu'une voiture est contenue dans cette image, quelque part. Cela contraste avec l'apprentissage non supervisé où la tâche à accomplir n'a pas d'étiquettes explicites. Par exemple, un sujet populaire dans l'apprentissage non supervisé est de découvrir les structures sous-jacentes contenues dans les données visuelles (images) telles que les formes géométriques des objets, les lignes, la profondeur, avant d'apprendre une tâche spécifique. Ce type d'apprentissage est évidemment beaucoup plus difficile car il peut y avoir un nombre infini de concepts à saisir dans les données. Dans cette thèse, nous nous concentrons sur un scénario spécifique du cadre d'apprentissage supervisé : 1) l'étiquette d'intérêt est sous-représentée (p. ex. anomalies) et 2) l'ensemble de données augmente avec le temps à mesure que nous recevons des données d'événements réels (p. ex. transactions par carte de crédit). En fait, ces deux problèmes sont très fréquents dans le domaine industriel dans lequel cette thèse se déroule.
Agence Bibliographique de l'Enseignement Supérieur
Title: Ensemble Learning for Extremely Imbalced Data Flows
Description:
Apprentissage Ensembliste sur des flux de données extrêmement déséquilibrés L'apprentissage machine est l'étude de la conception d'algorithmes qui apprennent à partir des données d'apprentissage pour réaliser une tâche spécifique.
Le modèle résultant est ensuite utilisé pour prédire de nouveaux points de données (invisibles) sans aucune aide extérieure.
Ces données peuvent prendre de nombreuses formes telles que des images (matrice de pixels), des signaux (sons,.
), des transactions (âge, montant, commerçant,.
), des journaux (temps, alertes, .
).
Les ensembles de données peuvent être définis pour traiter une tâche spécifique telle que la reconnaissance d'objets, l'identification vocale, la détection d'anomalies, etc.
Dans ces tâches, la connaissance des résultats escomptés encourage une approche d'apprentissage supervisé où chaque donnée observée est assignée à une étiquette qui définit ce que devraient être les prédictions du modèle.
Par exemple, dans la reconnaissance d'objets, une image pourrait être associée à l'étiquette "voiture" qui suggère que l'algorithme d'apprentissage doit apprendre qu'une voiture est contenue dans cette image, quelque part.
Cela contraste avec l'apprentissage non supervisé où la tâche à accomplir n'a pas d'étiquettes explicites.
Par exemple, un sujet populaire dans l'apprentissage non supervisé est de découvrir les structures sous-jacentes contenues dans les données visuelles (images) telles que les formes géométriques des objets, les lignes, la profondeur, avant d'apprendre une tâche spécifique.
Ce type d'apprentissage est évidemment beaucoup plus difficile car il peut y avoir un nombre infini de concepts à saisir dans les données.
Dans cette thèse, nous nous concentrons sur un scénario spécifique du cadre d'apprentissage supervisé : 1) l'étiquette d'intérêt est sous-représentée (p.
ex.
anomalies) et 2) l'ensemble de données augmente avec le temps à mesure que nous recevons des données d'événements réels (p.
ex.
transactions par carte de crédit).
En fait, ces deux problèmes sont très fréquents dans le domaine industriel dans lequel cette thèse se déroule.

Related Results

CREATING LEARNING MEDIA IN TEACHING ENGLISH AT SMP MUHAMMADIYAH 2 PAGELARAN ACADEMIC YEAR 2020/2021
CREATING LEARNING MEDIA IN TEACHING ENGLISH AT SMP MUHAMMADIYAH 2 PAGELARAN ACADEMIC YEAR 2020/2021
The pandemic Covid-19 currently demands teachers to be able to use technology in teaching and learning process. But in reality there are still many teachers who have not been able ...
Late Amazonian lateral lava flows coeval with caldera eruptions at Arsia Mons
Late Amazonian lateral lava flows coeval with caldera eruptions at Arsia Mons
Introduction: The Tharsis dome is the main volcanic province on Mars. Being the locus of volcanism since at least the lower Hesperian, the age of emplacement and succession of its ...
Selection of Injectable Drug Product Composition using Machine Learning Models (Preprint)
Selection of Injectable Drug Product Composition using Machine Learning Models (Preprint)
BACKGROUND As of July 2020, a Web of Science search of “machine learning (ML)” nested within the search of “pharmacokinetics or pharmacodynamics” yielded over 100...
Detailed stratigraphy of the N 2Grande Ronde Basalt, Columbia River Basalt Group, in the central Columbia Plateau
Detailed stratigraphy of the N 2Grande Ronde Basalt, Columbia River Basalt Group, in the central Columbia Plateau
Stratigraphy of individual basalt flows in the N 2magnetostratigraphic unit of the Grande Ronde Basalt (GRB) within the central Columbia Plateau has been developed using data from ...
Status and Trends in Research on Deep‐Water Gravity Flow Deposits
Status and Trends in Research on Deep‐Water Gravity Flow Deposits
AbstractDeep‐water gravity flows are one of the most important sediment transport mechanisms on Earth. After 60 years of study, significant achievements have been made in terms of ...
Volatile Ice Presence Analysis through Mass Wasting Events Mapping in Lunar Permanently Shadowed Regions
Volatile Ice Presence Analysis through Mass Wasting Events Mapping in Lunar Permanently Shadowed Regions
Mass wasting events on the Moon have been documented since the Apollo era and are distributed across its surface. On Earth, the morphology and runout distance of landslides, partic...
Measurement of friction in debris flows, floods, and intermediate flows
Measurement of friction in debris flows, floods, and intermediate flows
Many different rheological models describing the behavior of debris flows are available, yet there is no general agreement on the appropriate rheology for a given problem. Here we ...
Analysis of lava flow features on Venus for radar sounder simulations
Analysis of lava flow features on Venus for radar sounder simulations
IntroductionPrevious missions to Venus depicted an environment dominated by volcanic landforms and hostile atmospheric conditions. The surface was imaged by the Magellan mission, a...

Back to Top