Lundi 2 mars 2020- LJLL
Sylvain Girard (Phimeca) .

Réduction de dimension par modèles auto-associatifs

Nous considérons le problème d’approximation d’ensembles dans le but de « réduire leur dimension », à savoir trouver des systèmes de coordonnées de faible dimension, soit comme une fin en soi pour rechercher des structures interprétables, soit comme préliminaire à l’optimisation, à la modélisation probabiliste ou à l’approximation d’une fonction avec entrée ou sortie fonctionnelle. L’analyse en composantes principales (ACP) est probablement l’algorithme le plus ancien et le plus largement utilisé pour la réduction des dimensions. Cependant, les ensembles de signaux ou d’images ont souvent une structutre non-linéaire, la plus simple étant la translation ou la rotation, que l’ACP ne parvient pas à saisir. L’algorithme du modèle auto-associatif (AAM) [1] est destiné à surmonter cette limitation. Il procède comme suit :

– Choisir une direction en minimisant une fonction de perte.
– Calculer les coordonnées par projection orthogonale.
– Estimer une correction, c’est-à-dire une approximation de la fonction reliant les coordonnées à données originales.
– Remplacer les données par les résidus de l’approximation et répéter la procédure.

Ceci définit une séquence de variétés imbriquées de dimension croissante d paramétrée par la relation 0 = (I – r 1 ◦p 1 ) ◦ – – – ◦ (I – r d ◦ p d ), où r_k et p_k sont respectivement la correction et la projection à partir de l’itération k. L’ACP est un cas spécial linéaire de l’AAM avec des projections telles que les distances euclidiennes sont les mieux préservées, associées à une carte d’identité pour les recouvrements (l’approximation est donc une séquence croissante d’espaces linéaires). En plus de la correction non linéaire, Girard [Stéphane] et Iovleff [1] ont suggéré d’utiliser une fonction de perte basée sur la préservation du voisin le plus proche, une propriété topologique locale. Nous avons étudié l’AAM de données fonctionnelles, en particulier les entrées et sorties de modèles de dispersion atmosphérique. Bien que l’AAM ait obtenu des résultats nettement supérieurs à l’ACP dans certaines expériences, nous identifions également les limites de son applicabilité générale. Nous avons enfin étudié des modifications de fonctions de perte de la mesure initiale pour améliorer sa robustesse.

[1] Girard, Stéphane and Serge Iovleff (2008). “Auto-Associative Models, Nonlinear Principal
Component Analysis, Manifolds and Projection Pursuit”. In: Lecture Notes in Computational
Science and Enginee. Springer Berlin Heidelberg, pp. 202–218. doi: 10.1007/978-3-540-73750-6_8.
url: https://doi.org/10.1007/978-3-540-73750-6_8.

Les commentaires sont clos.