Javascript must be enabled to continue!
On identifiability of deep ReLU neural networks
View through CrossRef
L'identifiabilité des réseaux de neurones profonds ReLU
Cette thèse étudie la question de l'identifiabilité des réseaux de neurones profonds ReLU. Les réseaux de neurones admettent des paramètres sous forme de poids et de biais, et avec un choix de paramètres donné, un réseau implémente une fonction. La question générale de l'identifiabilité est la suivante : si les fonctions implémentées par deux réseaux sont égales, ou si elles coïncident sur un ensemble donné, ont-elles les mêmes paramètres ? Dans cette thèse, nous proposons trois contributions qui tournent autour de ce sujet.Première contribution : La possibilité de récupérer les paramètres -- poids et biais -- d'un réseau de neurones grâce à la connaissance de sa fonction sur un sous-ensemble de l'espace d'entrée peut être, selon la situation, une malédiction ou une bénédiction. D'un côté, récupérer les paramètres facilite les attaques adversariales et pourrait également révéler des informations sensibles du jeu de données utilisé pour entraîner le réseau. D'un autre côté, si les paramètres d'un réseau peuvent être récupérés, cela garantit à l'utilisateur que les caractéristiques dans les espaces latents peuvent être interprétées. Cela fournit également les bases pour obtenir des garanties formelles sur les performances du réseau. Il est donc important de caractériser les réseaux dont les paramètres peuvent être identifiés et ceux dont les paramètres ne le peuvent pas. Dans ce travail, nous fournissons un ensemble de conditions sur un réseau de neurones profond feedforward fully-connected ReLU, garantissant que les paramètres du réseau sont identifiables de manière unique -- modulo permutation et rescalings positifs-- à partir de la fonction que le réseau implémente sur un sous-ensemble de l'espace d'entrée.Deuxième contribution : Un échantillon est-il suffisamment riche pour déterminer, au moins localement, les paramètres d'un réseau de neurones ? Pour répondre à cette question, nous introduisons une nouvelle paramétrisation locale d'un réseau de neurones ReLU profond donné en fixant les valeurs de certains de ses poids. Cela nous permet de définir des opérateurs de lifting locaux dont les inverses sont des cartes d'une variété lisse d'un espace de grande dimension. La fonction implémentée par le réseau de neurones ReLU profond compose le lifting local avec un opérateur linéaire qui dépend de l'échantillon. Nous dérivons de cette représentation pratique une condition géométrique nécessaire et suffisante d'identifiabilité locale. En examinant les espaces tangents, la condition géométrique fournit : 1/ une condition nécessaire sharp et testable d'identifiabilité et 2/ une condition suffisante sharp et testable d'identifiabilité locale. La validité des conditions peut être testée numériquement à l'aide de la rétropropagation et du calcul du rang des matrices.Troisième contribution : Nous examinons les propriétés et les aspects computationnels des mesures de complexité locale des réseaux de neurones ReLU profonds, récemment introduites dans (Grigsby et al. 2022). Les mesures de complexité considérées sont liées à la géométrie locale d'un ensemble d'images et d'un ensemble de pré-images de la fonction implémentée par le réseau, pour un échantillon donné. La géométrie locale de l'ensemble de pré-images et de l'ensemble d'images est liée par la différentielle des sorties du réseau par rapport aux paramètres, pour un échantillon fini X. En particulier, nous considérons le rang de cette différentielle. L'ensemble de pré-images représente les redondances dans les paramètres d'un réseau. Intuitivement, plus il y a de redondances dans les paramètres, moins l'espace des fonctions représentées par le réseau est riche et complexe. Parmi d'autres propriétés, nous cherchons notamment à comprendre comment ces objets se comportent pendant l'optimisation. Le travail mené dans cette contribution est directement liée à la question de l'identifiabilité, l'ensemble de pré-images représentant les redondances des paramètres du réseau.
Title: On identifiability of deep ReLU neural networks
Description:
L'identifiabilité des réseaux de neurones profonds ReLU
Cette thèse étudie la question de l'identifiabilité des réseaux de neurones profonds ReLU.
Les réseaux de neurones admettent des paramètres sous forme de poids et de biais, et avec un choix de paramètres donné, un réseau implémente une fonction.
La question générale de l'identifiabilité est la suivante : si les fonctions implémentées par deux réseaux sont égales, ou si elles coïncident sur un ensemble donné, ont-elles les mêmes paramètres ? Dans cette thèse, nous proposons trois contributions qui tournent autour de ce sujet.
Première contribution : La possibilité de récupérer les paramètres -- poids et biais -- d'un réseau de neurones grâce à la connaissance de sa fonction sur un sous-ensemble de l'espace d'entrée peut être, selon la situation, une malédiction ou une bénédiction.
D'un côté, récupérer les paramètres facilite les attaques adversariales et pourrait également révéler des informations sensibles du jeu de données utilisé pour entraîner le réseau.
D'un autre côté, si les paramètres d'un réseau peuvent être récupérés, cela garantit à l'utilisateur que les caractéristiques dans les espaces latents peuvent être interprétées.
Cela fournit également les bases pour obtenir des garanties formelles sur les performances du réseau.
Il est donc important de caractériser les réseaux dont les paramètres peuvent être identifiés et ceux dont les paramètres ne le peuvent pas.
Dans ce travail, nous fournissons un ensemble de conditions sur un réseau de neurones profond feedforward fully-connected ReLU, garantissant que les paramètres du réseau sont identifiables de manière unique -- modulo permutation et rescalings positifs-- à partir de la fonction que le réseau implémente sur un sous-ensemble de l'espace d'entrée.
Deuxième contribution : Un échantillon est-il suffisamment riche pour déterminer, au moins localement, les paramètres d'un réseau de neurones ? Pour répondre à cette question, nous introduisons une nouvelle paramétrisation locale d'un réseau de neurones ReLU profond donné en fixant les valeurs de certains de ses poids.
Cela nous permet de définir des opérateurs de lifting locaux dont les inverses sont des cartes d'une variété lisse d'un espace de grande dimension.
La fonction implémentée par le réseau de neurones ReLU profond compose le lifting local avec un opérateur linéaire qui dépend de l'échantillon.
Nous dérivons de cette représentation pratique une condition géométrique nécessaire et suffisante d'identifiabilité locale.
En examinant les espaces tangents, la condition géométrique fournit : 1/ une condition nécessaire sharp et testable d'identifiabilité et 2/ une condition suffisante sharp et testable d'identifiabilité locale.
La validité des conditions peut être testée numériquement à l'aide de la rétropropagation et du calcul du rang des matrices.
Troisième contribution : Nous examinons les propriétés et les aspects computationnels des mesures de complexité locale des réseaux de neurones ReLU profonds, récemment introduites dans (Grigsby et al.
2022).
Les mesures de complexité considérées sont liées à la géométrie locale d'un ensemble d'images et d'un ensemble de pré-images de la fonction implémentée par le réseau, pour un échantillon donné.
La géométrie locale de l'ensemble de pré-images et de l'ensemble d'images est liée par la différentielle des sorties du réseau par rapport aux paramètres, pour un échantillon fini X.
En particulier, nous considérons le rang de cette différentielle.
L'ensemble de pré-images représente les redondances dans les paramètres d'un réseau.
Intuitivement, plus il y a de redondances dans les paramètres, moins l'espace des fonctions représentées par le réseau est riche et complexe.
Parmi d'autres propriétés, nous cherchons notamment à comprendre comment ces objets se comportent pendant l'optimisation.
Le travail mené dans cette contribution est directement liée à la question de l'identifiabilité, l'ensemble de pré-images représentant les redondances des paramètres du réseau.
Related Results
A new method for a priori practical identifiability
A new method for a priori practical identifiability
Abstract
Background and objective
Practical identifiability analysis – to determine whether a model property can be determined ...
SOC Reconfigurable Architecture for Software-Trained Neural Networks on FPGA
SOC Reconfigurable Architecture for Software-Trained Neural Networks on FPGA
Neural networks are extensively used in software and hardware applications. In hardware applications, it is necessary to
implement a small, accelerated, and configurable...
Fuzzy Chaotic Neural Networks
Fuzzy Chaotic Neural Networks
An understanding of the human brain’s local function has improved in recent years. But the cognition of human brain’s working process as a whole is still obscure. Both fuzzy logic ...
On the role of network dynamics for information processing in artificial and biological neural networks
On the role of network dynamics for information processing in artificial and biological neural networks
Understanding how interactions in complex systems give rise to various collective behaviours has been of interest for researchers across a wide range of fields. However, despite ma...
Deep convolutional neural network and IoT technology for healthcare
Deep convolutional neural network and IoT technology for healthcare
Background
Deep Learning is an AI technology that trains computers to analyze data in an approach similar to the human brain. Deep learning algorithms can find ...
Error Bounds for a Matrix-Vector Product Approximation with Deep ReLU Neural Networks
Error Bounds for a Matrix-Vector Product Approximation with Deep ReLU Neural Networks
Abstract—Inspired by the depth and breadth of developments on the theory of deep learning, we pose these fundamental questions: can we accurately approximate an arbitrary matrix-ve...
Error Bounds for a Matrix-Vector Product Approximation with Deep ReLU Neural Networks
Error Bounds for a Matrix-Vector Product Approximation with Deep ReLU Neural Networks
Abstract—Inspired by the depth and breadth of developments on the
theory of deep learning, we pose these fundamental questions: can we
accurately approximate an arbitrary matrix-ve...
Memorization capacity and robustness of neural networks
Memorization capacity and robustness of neural networks
Machine learning, and deep learning in particular, has recently undergone rapid advancements. To contribute to a rigorous understanding of deep learning, this thesis explores two d...

