Arbeitsgruppe: Computational Statistics and Data Analysis

Aufgabe, Ziel, Inhalt:

 

Technischer Fortschritt führt zu zunehmend größer werdenden Datensammlungen wachsender Dimension und steigender Messfrequenzen, mit vielen, teils neuen Anwendungskontexten.  Die adäquate Analyse solcher Datensätze ermöglicht die Erforschung oft komplexer Abhängigkeiten und Wechselwirkungen zur Ableitung von kausalen Wirkmechanismen, zur Klassifikation oder zur Vorhersage. Dies erfordert neue und bessere Methoden der statistischen Modellbildung, der statistischen Inferenz und der Validierung, samt neuer Herausforderungen an statistische Algorithmen und Rechentechniken. Im gleichen Zuge erlauben höhere Rechenleistungen und Speicherkapazitäten sowie algorithmische Fortschritte und Möglichkeiten der Parallelisierung die Anwendung raffinierter nichtlinearer Verfahren bei moderaten Stichprobengrößen und einfacher Methoden auch bei extrem großen Datenmengen. Das stetige Verbessern von solchem Skalierungsverhalten ist ein Bestandteil moderner Forschung.

Computationale Statistik liefert essentielle Grundlagen für viele moderne statistische Methoden aus dem Bereich unter anderem der Bayes-Statistik, der robusten und der nichtparametrischen Statistik, der Klassifikation, der Analyse komplexer, hochdimensionaler und massiver Daten,  räumlich-zeitlicher Abhängigkeitsstrukturen oder von Netzwerken. Der Wunsch nach realistischen Modellen für die oft komplexen Wirkmechanismen in modernen Anwendungen erfordert bessere Prozeduren zur statistischen Modellierung und Vorhersage und birgt neue computationale Herausforderungen. Auch kann statistisches Schließen in modernen Szenarien nicht alleine auf asymptotischer Theorie beruhen, sondern benötigt ergänzend gründliche Simulationsexperimente und computationale Instrumente der statistischen Inferenz wie beispielsweise Bootstrap-Techniken.

Die Arbeitsgruppe Computationale Statistik und Datenanalyse beschäftigt sich mit allen computationalen und methodologischen Aspekten der Statistik. Von besonderem Interesse ist die Erforschung wichtiger statistischer Anwendungsgebiete, in denen neue Aspekte der Computation und der Datenanalyse von hoher Bedeutung sind.

 

Themenauswahl:

  • Analyse großer und hochdimensionaler Datenmengen
  • Anpassungstests und Modellvalidierung
  • Bayes-Statistik (MCMC, sequentielle Monte Carlo Techniken)
  • Funktionale Datenanalyse
  • Klassifikation
  • Latente Variablen Modelle
  • Mischungsmodelle
  • Modellselektion und Modelloptimierung
  • Modellvalidierung und Benchmarking
  • Nichtparametrische Regressions- und Kurvenschätzung
  • Optimierungsheuristiken
  • Paralleles Rechnen
  • Räumliche Statistik
  • Robuste statistische Verfahren
  • Sampling und Resampling-Verfahren
  • Statistisches Lernen
  • Statistische Software
  • Wissenschaftliches Rechnen
  • Zeitreihenanalyse

 

Aktivitäten:

 

Die Arbeitsgruppe tagt regelmäßig im Rahmen der Statistischen Woche und organisiert Workshops zur Thematik.