Javascript must be enabled to continue!

Deep latent representations for visual servoing

Représentations latentes pour l'asservissement visuel L'asservissement visuel (AV) est utilisé pour contrôler des systèmes robotiques, en se servant d'informations visuelles. L'AV permet de résoudre de nombreuses tâches, telles que la saisie d'objets, la navigation ou le suivi de cibles. Les primitives visuelles classiquement utilisées sont de nature géométrique ou photométrique. Cependant, les primitives géométriques peuvent être difficiles à extraire et à suivre à partir d'images brutes. Récemment, l'apprentissage profond a été proposé comme une solution potentielle pour l'asservissement visuel, mais son utilisation s'est limitée à l'extraction des primitives ou de la pose. Dans cette thèse, nous proposons d'aller plus loin en supprimant cette étape d'extraction des primitives. Nous établissons directement le lien entre le mouvement de la caméra et les changements dans l'espace latent. Ce lien peut être directement appris, créant ainsi une approche de l'asservissement reposant intégralement sur l'apprentissage, ou il peut être calculé analytiquement en exploitant la structure des réseaux appris. De plus, l'apprentissage supervisé ou non supervisé peut être utilisé pour créer des représentations utiles à l'AV. Enfin, le fait de formuler l'AV dans un espace latent permet d'exploiter des informations provenant de différentes modalités, telles que les poses de la caméra et les images, conduisant à un asservissement "hybride". Nous montrons que l'espace latent est idéal de par sa flexibilité, et peut être utilisé pour effectuer de grands déplacements, tout en conservant une excellente précision.

Agence Bibliographique de l'Enseignement Supérieur

Samuel Felton

2026

Title: Deep latent representations for visual servoing

Description:

Représentations latentes pour l'asservissement visuel L'asservissement visuel (AV) est utilisé pour contrôler des systèmes robotiques, en se servant d'informations visuelles.

L'AV permet de résoudre de nombreuses tâches, telles que la saisie d'objets, la navigation ou le suivi de cibles.

Les primitives visuelles classiquement utilisées sont de nature géométrique ou photométrique.

Cependant, les primitives géométriques peuvent être difficiles à extraire et à suivre à partir d'images brutes.

Récemment, l'apprentissage profond a été proposé comme une solution potentielle pour l'asservissement visuel, mais son utilisation s'est limitée à l'extraction des primitives ou de la pose.

Dans cette thèse, nous proposons d'aller plus loin en supprimant cette étape d'extraction des primitives.

Nous établissons directement le lien entre le mouvement de la caméra et les changements dans l'espace latent.

Ce lien peut être directement appris, créant ainsi une approche de l'asservissement reposant intégralement sur l'apprentissage, ou il peut être calculé analytiquement en exploitant la structure des réseaux appris.

De plus, l'apprentissage supervisé ou non supervisé peut être utilisé pour créer des représentations utiles à l'AV.

Enfin, le fait de formuler l'AV dans un espace latent permet d'exploiter des informations provenant de différentes modalités, telles que les poses de la caméra et les images, conduisant à un asservissement "hybride".

Nous montrons que l'espace latent est idéal de par sa flexibilité, et peut être utilisé pour effectuer de grands déplacements, tout en conservant une excellente précision.

Back

The control of robotic manipulators in unstructured environments is a challenging task. Exploiting the camera images for that purpose, known as visual servoing, offers an interesti...

Robust robotic visual servoing for uncertain systems

The control of robotic manipulators in unstructured environments is a challenging task. Exploiting the camera images for that purpose, known as visual servoing, offers an interesti...

Epidemiological, diagnostic and medical-social aspects of latent syphilis

Objective — to study epidemiological, clinical and medical-social aspects of latent syphilis in Ukraine over the past 40 years. Materials and methods. Data of patients with latent ...

Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing

<span lang="EN-US">This is a novel research paper provides an optimal solution for object tracking using visual servoing control system with programmable gate array technolog...

Using FPGA Design and HIL Algorithm Simulation to Control Visual Servoing

<span style="font-size: 9pt; font-family: 'Times New Roman', serif;">This is a novel research paper provides an optimal solution for object tracking using visual servoing con...

An Eye-To-Hand Panoramic Vision System for 3D Positioning of a Robotic Arm

A novel visual servoing structure is presented for robot positioning under an eye-to-hand camera configuration using panoramic vision. The proposed algorithm is based upon Image-Ba...

TarDis: Achieving Robust and Structured Disentanglement of Multiple Covariates

Summary Addressing challenges in domain invariance within single-cell genomics necessitates innovative strategies to manage the heterogeneity of ...

Meta-Representations as Representations of Processes

In this study, we explore how the notion of meta-representations in Higher-Order Theories (HOT) of consciousness can be implemented in computational models. HOT suggests that consc...

Email:
Password:

Email:

Deep latent representations for visual servoing

Related Results