Deux algorithmes pour la classification non supervisée de données géostatistiques - Mines Paris Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Deux algorithmes pour la classification non supervisée de données géostatistiques

Thomas Romary

Résumé

Avec le développement des plateformes de télédétection, aéroportées ou satellites, et l'évolution des moyens d'échantillonnage des compagnies minières ou pétroli-ères, les jeux de données spatiales deviennent de plus en plus grands, renseignent un nombre croissant de variables et couvrent des étendues de plus en plus larges. De fait, il devient souvent nécessaire de séparer le domaine d'étude en différentes zones homogènes afin de simplifier l'étape de modélisation. La définition de ces zones peut se voir comme un problème de classification non supervisée où l'on cherche à découper le domaine d'étude en zones homogènes en fonction des variables renseignées. L'application des méthodes de classification pour des observations indépendantes ne permet généralement pas de conserver une cohérence spatiale dans les zones ainsi formées. Les algorithmes de segmentation d'image, basés sur des champs de Markov, ne sont quant à eux pas adaptées lorsque le plan d'échantillonnage n'est pas régulier (Ambroise et al., 1995 ). Les approches existantes (cf. e.g. Allard et Guillot, 2000 et Guillot et al., 2006), basées sur une estimation de mélange de fonctions aléatoires gaussiennes par l'algorithme E-M, sont limitées à des tailles d'échantillon raisonnables pour un faible nombre de variables. Nous proposons dans ce travail deux algorithmes basés sur des adaptations d'algorithmes classiques, qui permettent de traiter un large volume de données. Le premier procède par classification ascendante hiérarchique tandis que le second est basé sur la méthode de classification spectrale. Les deux algorithmes sont appliqués à des jeux de données synthétiques et à un jeu de données minières.
Fichier principal
Vignette du fichier
TexteLong_vmodif.pdf (96.42 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00842826 , version 1 (09-07-2013)

Identifiants

  • HAL Id : hal-00842826 , version 1

Citer

Thomas Romary. Deux algorithmes pour la classification non supervisée de données géostatistiques. 45e Journées de Statistique, May 2013, France. ⟨hal-00842826⟩
141 Consultations
1525 Téléchargements

Partager

Gmail Facebook X LinkedIn More