Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Deep latent representations for visual servoing

View through CrossRef
Représentations latentes pour l'asservissement visuel L'asservissement visuel (AV) est utilisé pour contrôler des systèmes robotiques, en se servant d'informations visuelles. L'AV permet de résoudre de nombreuses tâches, telles que la saisie d'objets, la navigation ou le suivi de cibles. Les primitives visuelles classiquement utilisées sont de nature géométrique ou photométrique. Cependant, les primitives géométriques peuvent être difficiles à extraire et à suivre à partir d'images brutes. Récemment, l'apprentissage profond a été proposé comme une solution potentielle pour l'asservissement visuel, mais son utilisation s'est limitée à l'extraction des primitives ou de la pose. Dans cette thèse, nous proposons d'aller plus loin en supprimant cette étape d'extraction des primitives. Nous établissons directement le lien entre le mouvement de la caméra et les changements dans l'espace latent. Ce lien peut être directement appris, créant ainsi une approche de l'asservissement reposant intégralement sur l'apprentissage, ou il peut être calculé analytiquement en exploitant la structure des réseaux appris. De plus, l'apprentissage supervisé ou non supervisé peut être utilisé pour créer des représentations utiles à l'AV. Enfin, le fait de formuler l'AV dans un espace latent permet d'exploiter des informations provenant de différentes modalités, telles que les poses de la caméra et les images, conduisant à un asservissement "hybride". Nous montrons que l'espace latent est idéal de par sa flexibilité, et peut être utilisé pour effectuer de grands déplacements, tout en conservant une excellente précision.
Agence Bibliographique de l'Enseignement Supérieur
Title: Deep latent representations for visual servoing
Description:
Représentations latentes pour l'asservissement visuel L'asservissement visuel (AV) est utilisé pour contrôler des systèmes robotiques, en se servant d'informations visuelles.
L'AV permet de résoudre de nombreuses tâches, telles que la saisie d'objets, la navigation ou le suivi de cibles.
Les primitives visuelles classiquement utilisées sont de nature géométrique ou photométrique.
Cependant, les primitives géométriques peuvent être difficiles à extraire et à suivre à partir d'images brutes.
Récemment, l'apprentissage profond a été proposé comme une solution potentielle pour l'asservissement visuel, mais son utilisation s'est limitée à l'extraction des primitives ou de la pose.
Dans cette thèse, nous proposons d'aller plus loin en supprimant cette étape d'extraction des primitives.
Nous établissons directement le lien entre le mouvement de la caméra et les changements dans l'espace latent.
Ce lien peut être directement appris, créant ainsi une approche de l'asservissement reposant intégralement sur l'apprentissage, ou il peut être calculé analytiquement en exploitant la structure des réseaux appris.
De plus, l'apprentissage supervisé ou non supervisé peut être utilisé pour créer des représentations utiles à l'AV.
Enfin, le fait de formuler l'AV dans un espace latent permet d'exploiter des informations provenant de différentes modalités, telles que les poses de la caméra et les images, conduisant à un asservissement "hybride".
Nous montrons que l'espace latent est idéal de par sa flexibilité, et peut être utilisé pour effectuer de grands déplacements, tout en conservant une excellente précision.

Related Results

Robust robotic visual servoing for uncertain systems
Robust robotic visual servoing for uncertain systems
The control of robotic manipulators in unstructured environments is a challenging task. Exploiting the camera images for that purpose, known as visual servoing, offers an interesti...
Robust robotic visual servoing for uncertain systems
Robust robotic visual servoing for uncertain systems
The control of robotic manipulators in unstructured environments is a challenging task. Exploiting the camera images for that purpose, known as visual servoing, offers an interesti...
Epidemiological, diagnostic and medical-social aspects of latent syphilis
Epidemiological, diagnostic and medical-social aspects of latent syphilis
Objective — to study epidemiological, clinical and medical-social aspects of latent syphilis in Ukraine over the past 40 years. Materials and methods. Data of patients with latent ...
Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing
Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing
<span lang="EN-US">This is a novel research paper provides an optimal solution for object tracking using visual servoing control system with programmable gate array technolog...
Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing
Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing
<span style="font-size: 9pt; font-family: 'Times New Roman', serif;">This is a novel research paper provides an optimal solution for object tracking using visual servoing con...
An Eye-To-Hand Panoramic Vision System for 3D Positioning of a Robotic Arm
An Eye-To-Hand Panoramic Vision System for 3D Positioning of a Robotic Arm
A novel visual servoing structure is presented for robot positioning under an eye-to-hand camera configuration using panoramic vision. The proposed algorithm is based upon Image-Ba...
TarDis: Achieving Robust and Structured Disentanglement of Multiple Covariates
TarDis: Achieving Robust and Structured Disentanglement of Multiple Covariates
Summary Addressing challenges in domain invariance within single-cell genomics necessitates innovative strategies to manage the heterogeneity of ...
Meta-Representations as Representations of Processes
Meta-Representations as Representations of Processes
In this study, we explore how the notion of meta-representations in Higher-Order Theories (HOT) of consciousness can be implemented in computational models. HOT suggests that consc...

Back to Top