Result: Convergence du processus de Oja et ACP en ligne

Title:
Convergence du processus de Oja et ACP en ligne
Contributors:
Biology, genetics and statistics (BIGS), Centre Inria de l'Université de Lorraine, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Institut Élie Cartan de Lorraine (IECL), Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Institut Élie Cartan de Lorraine (IECL), Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), ANR-15-RHUS-0004,FIGHT-HF,Combattre l'insuffisance cardiaque(2015)
Source:
51èmes Journées de Statistique, Jun 2019, Nancy, France
Publisher Information:
CCSD, 2019.
Publication Year:
2019
Collection:
collection:CNRS
collection:INRIA
collection:IECN
collection:INSMI
collection:INRIA_TEST
collection:INRIA-NANCY-GRAND-EST
collection:TESTALAIN1
collection:UNIV-LORRAINE
collection:INRIA2
collection:IECLPS
collection:ANR
collection:AM2I-UL
Subject Geographic:
Original Identifier:
HAL: hal-02383570
Document Type:
Conference conferenceObject<br />Conference papers
Language:
French
Rights:
info:eu-repo/semantics/OpenAccess
Accession Number:
edshal.hal.02383570v1
Database:
HAL

Further Information

Using an i.i.d. sample of a random matrix, an eigenvector corresponding to its largest eigenvalue can be sequentially estimated by the currently used process of Oja, then eigenvectors corresponding to its eigenvalues in decreasing order. We propose two extensions of the almost sure convergence assumptions of this process. Applying these extensions to online PCA of a data stream, this allows to study the case where the metric used is unknown and is estimated online and also to prove the convergence of a process using, instead of a mini-batch of observations at each step, all observations until the current step thus the information contained in the previous data without storing them.
Le processus de Oja est couramment utilisé pour estimer séquentiellement un vecteur propre associé à la plus grande valeur propre de l'espérance mathématique d'une matrice aléatoire symétrique en en utilisant un échantillon i.i.d., puis des vecteurs propres associés aux valeurs propres suivantes en ordre décroissant. Nous proposons deux extensions des hypothèses de convergence presque sûre de ce processus. Dans l'ACP en ligne d'un ‡ux de données, ces extensions permettent de traiter des cas où la métrique utilisée est inconnue et est estimée en ligne, et également d'établir la convergence d'un processus où, au lieu d'utiliser plusieurs observations à chaque étape, on utilise toutes les observations jusqu'à l'étape courante, donc toute l'information contenue dans les données précédentes, sans avoir à les stocker.