Javascript must be enabled to continue!
Handling the speed-accuracy trade-off in deep-learning based pedestrian detection systems
View through CrossRef
Gestion du compromis vitesse-précision dans les systèmes de détection de piétons basés sur apprentissage profond
L'objectif principal de cette thèse est d'améliorer la précision des systèmes de détection de piétons à partir d'image, basés sur l'apprentissage profond sans sacrifier à la vitesse de détection. Pour ce faire, nous effectuons d'abord une analyse quantitative systématique des diverses techniques de détection de piétons à partir d'image. Cette analyse nous permet d'identifier les configurations optimales des différentes composantes d'un système de détection de piétons. Nous examinons ensuite la question de la sélection des meilleures couches convolutionnelles pour extraire les caractéristiques visuelles pour la détection des piétons et proposons un système appelé Multiple-RPN, qui combine plusieurs couches convolutives simultanément. Nous proposons le système Multiple-RPN en deux configurations - une fusion tôt et une fusion-tardive ; nous démontrons ensuite que la fusion-tôt est la plus performante, en particulier pour la détection de piétons de petites tailles et les cas d'occultation de piétons. Cette étude fournit aussi une évaluation quantitative de la sélection des couches convolutionnelles. Nous intégrons ensuite l'approche de la fusion-tôt avec une étape de segmentation pseudo-sémantique pour réduire le cout de traitement. Dans cette approche, la segmentation pseudo-sémantique permet de réduire les faux positifs et les faux négatifs. Ceci, associé à un nombre réduit d'opérations, permet d'améliorer simultanément les performances de détection et la vitesse de traitement (~20 images/seconde) ; les performances sont compétitives avec celles de l'état de l'art sur les bases de données caltech-raisonable (3,79% de taux d'erreurs) et citypersons (7,19% de taux d'erreurs). La dernière contribution de cette thèse est la proposition d'une couche de classification des détections potentielles, qui réduit encore le nombre d'opérations de détection. Il en résulte une réduction de la vitesse de détection (~40 images/seconde) avec une perte minime de performance de détection (3,99% et 8,12% de taux d'erreurs dans les bases de données caltech-raisonable et citypersons respectivement) ce qui reste compétitif avec l'état de l'art.
Title: Handling the speed-accuracy trade-off in deep-learning based pedestrian detection systems
Description:
Gestion du compromis vitesse-précision dans les systèmes de détection de piétons basés sur apprentissage profond
L'objectif principal de cette thèse est d'améliorer la précision des systèmes de détection de piétons à partir d'image, basés sur l'apprentissage profond sans sacrifier à la vitesse de détection.
Pour ce faire, nous effectuons d'abord une analyse quantitative systématique des diverses techniques de détection de piétons à partir d'image.
Cette analyse nous permet d'identifier les configurations optimales des différentes composantes d'un système de détection de piétons.
Nous examinons ensuite la question de la sélection des meilleures couches convolutionnelles pour extraire les caractéristiques visuelles pour la détection des piétons et proposons un système appelé Multiple-RPN, qui combine plusieurs couches convolutives simultanément.
Nous proposons le système Multiple-RPN en deux configurations - une fusion tôt et une fusion-tardive ; nous démontrons ensuite que la fusion-tôt est la plus performante, en particulier pour la détection de piétons de petites tailles et les cas d'occultation de piétons.
Cette étude fournit aussi une évaluation quantitative de la sélection des couches convolutionnelles.
Nous intégrons ensuite l'approche de la fusion-tôt avec une étape de segmentation pseudo-sémantique pour réduire le cout de traitement.
Dans cette approche, la segmentation pseudo-sémantique permet de réduire les faux positifs et les faux négatifs.
Ceci, associé à un nombre réduit d'opérations, permet d'améliorer simultanément les performances de détection et la vitesse de traitement (~20 images/seconde) ; les performances sont compétitives avec celles de l'état de l'art sur les bases de données caltech-raisonable (3,79% de taux d'erreurs) et citypersons (7,19% de taux d'erreurs).
La dernière contribution de cette thèse est la proposition d'une couche de classification des détections potentielles, qui réduit encore le nombre d'opérations de détection.
Il en résulte une réduction de la vitesse de détection (~40 images/seconde) avec une perte minime de performance de détection (3,99% et 8,12% de taux d'erreurs dans les bases de données caltech-raisonable et citypersons respectivement) ce qui reste compétitif avec l'état de l'art.
Related Results
ANALYSIS OF PEDESTRIAN CHARACTERISTICS CROSSING ALONG ROADS
ANALYSIS OF PEDESTRIAN CHARACTERISTICS CROSSING ALONG ROADS
Pedestrian crossing represents a substantial problem. In Iraq, there are no spaces marked specifically for pedestrians, which causes many conflicts between vehicles and pedestrians...
EVALUASI KONSEP RAMAH PEJALAN KAKI PADA PEDESTRIAN MALIOBORO DENGAN PENDEKATAN KONSEP WALKABILITY
EVALUASI KONSEP RAMAH PEJALAN KAKI PADA PEDESTRIAN MALIOBORO DENGAN PENDEKATAN KONSEP WALKABILITY
Abstract: Malioboro Pedestrian is located in the tourist area of Malioboro, which has been arranged by the Yogyakarta Regional Government. The arrangement carried out applies the c...
ANALISIS KINERJA FASILITAS PEDESTRIAN DALAM MENDUKUNG INTEGRASI ANTARMODA ANGKUTAN UMUM DI PERKOTAAN
ANALISIS KINERJA FASILITAS PEDESTRIAN DALAM MENDUKUNG INTEGRASI ANTARMODA ANGKUTAN UMUM DI PERKOTAAN
Pedestrian merupakan salah satu moda yang digunakan dalam pengembangan transportasi antarmoda, terutama dalam pergerakan penumpang saat melakukan perpindahan moda. Permasalahan dal...
SAFE AND EFFICIENT PEDESTRIAN DETECTION FOR AUTONOMOUS VEHICLES THROUGH ADVANCED 3D CNN-BASED SOLUTIONS
SAFE AND EFFICIENT PEDESTRIAN DETECTION FOR AUTONOMOUS VEHICLES THROUGH ADVANCED 3D CNN-BASED SOLUTIONS
Pedestrian detection is another significant special application of object detection in autonomous vehicles. In contrast to universal object detection, it has similarities and speci...
Modelling of Pedestrian Speed-Density and Volume-Density Relationships in Outdoor Walkways
Modelling of Pedestrian Speed-Density and Volume-Density Relationships in Outdoor Walkways
The aim of this study was to model pedestrian flow parameters needed in the design of pedestrian facilities. The study also characterized the flow with a view to understanding pede...
Walkability Index in Commercial Area of Pangkalpinang City
Walkability Index in Commercial Area of Pangkalpinang City
One of the commercial areas in Pangkalpinang City is located in Pangkalpinang Plaza - Bangka Trade Center Area. As a commercial area, this area generates a large number of trips. T...
CREATING LEARNING MEDIA IN TEACHING ENGLISH AT SMP MUHAMMADIYAH 2 PAGELARAN ACADEMIC YEAR 2020/2021
CREATING LEARNING MEDIA IN TEACHING ENGLISH AT SMP MUHAMMADIYAH 2 PAGELARAN ACADEMIC YEAR 2020/2021
The pandemic Covid-19 currently demands teachers to be able to use technology in teaching and learning process. But in reality there are still many teachers who have not been able ...
Application Research on End-To-End Deep Person Re-Identification
Application Research on End-To-End Deep Person Re-Identification
Abstract
Pedestrian detection refers to the technology of predicting and locating the location of pedestrians in video or image. However, the recognition accuracy of existi...

