Paracelsus Medizinische Privatuniversität (PMU)

Core Facility Biostatistik
Empfehlung einiger statistischen Methoden

Überblick effizienter Verfahren, die in der Praxis eingesetzt werden:

Wir erlauben uns Ihnen einige Methoden bei der Datenauswertung/Planung zu empfehlen, um das Forschungsziel noch gründlicher zu analysieren.

1. Resampling Methods/Monte Carlo Methods/bootstrapping

Der Vorteil von "Resampling Methods/Monte Carlo Methods/bootstrapping" liegt darin, dass diese Simulationsmethoden einen echten Behandlungseffekt oder Zusammenhang (z.B. beim Vergleich von Blutverlust zweier verschiedener Operationsmethoden, 5-Jahresinzidenzrate für Brustkrebs, Überlegenheit von Therapie A gegen Therapie B, usw.) besser nachweisen können (also mit einer höheren Power) als dies mit herkömmlichen parametrischen, semiparametrischen oder nichtparametrischen Tests der Fall ist.

Das Forschungsbüro verwendet dazu eine Vielzahl von sog. "Monte-Carlo-, Permutations-, Bootstrap- und Jackknife-Methoden", welche klassischen, herkömmlichen Tests in vielen Fällen deutlich überlegen sind.
 

2. Adaptive Group-Sequential Designs

Diese Designs können den zu erwarteten Stichprobenumfang im Vergleich zu Plänen mit festem Stichprobenumfang u.U. beträchtlich senken, sodass die Studiendauer deutlich verkürzt, was dazu beiträgt Zeit-,  Kosten, der Zeit- und Organisationsaufwand zu minimieren.

Zum Beispiel verwenden wir gerne sog. "two stage designs" an, wie z.B. "internal pilot study designs", "Bauer-Köhne Designs" und ähnliches. 

Der Idee dieser Designs besteht darin, dass man sich bereits während Datenerhebung erlaubt einen Blick in die Daten zu werfen, um sich entscheidend wichtige Informationen aus den bereits vorliegenden Daten zu holen. Mit diesem Wissen, kann man dann konstruktiv in den weiteren Verlauf der Studie eingreifen. Dies kann im besten Fall dazu führen, die Studie bereits frühzeitig positiv zu beenden oder wichtige Informationen zu gewinnen, wie lange noch die Rekrutierung der Probanden andauern soll.

 

3. Machine learning/artifical intelligence (AI)

 Hier einige typische Methoden aus dem Bereich des machine learning:

  • Artificial neural networks: feedforward networks, convolutional neural networks (CNN), recurrent neural networks (RNN), 
  • Support vector machines
  • Classification tree analyses
  • Bayes classifier
  • ResNET 50, 101 und 152
  • Inception V1, V3 
  • VGG-16 and VGG-19 (released 2014 Visual Geometry Group University Oxford
  • Squeeze-and-Excitation Net 
  • U-Net (released 2015, University Freiburg, Germany)

Diese werden meist bei sog. "classification problems" sehr erfolgreich eingesetzt. Dazu einige Anwendungsbeispiele aus der Praxis:

  1. in der Ophthalmologie: Entdeckungsraten für die Erkennung von Gefäßen, Exsudaten und Blutungen bei Patienten mit diabetischer Retinopathie mittels neuronaler Netzen.
  2. in der internen Medizin: Prognose von Lungenembolien und ventrikuläre Hypertrophie und Myokardinfarkt.
  3. Pneumologie/Lungenheilkunde: Prognose, ob ein Patient erfolgreich von der mechanischen Beatmung entwöhnt werden kann.
  4. in der Urologie: zur Entscheidung, ob ein Laser zur Zertrümmerung von Nierenstein eingesetzt werden soll.
  5. in der Urologie: zur Entscheidung, wie lange die zu erwartenden Operationsdauer ist.
  6. Dermatologie: neuronale Netztechnologien zur Prognose des Auftretens eines Melanoms.

Diese Modelle unterliegen strengen so genannten "cross-validation tests" in randomisierten, unabhängigen Stichproben um die Generalisierung auf neue Patienten/Objekten zu gewährleisten!

 

4. Generalized Estimation Equation Models (GEE), Mixed models, Generalized linear/nonlinear Models (GLM/GLNM) oder General Additive Models

diese leistungsfährigen Modelle verfügen über einige sehr wichtige Vorteile gegenüber traditionellen Verfahren wie t-test und ANOVA. Warum?

Nun, in der Praxis kommen häufig nichtnormalverteilte Merkmale vor, die dann anderen Verteilungen folgen: z.B. Lognormal-, Beta-, Gamma-, Poisson-, Exponential-, Binomial oder der Familie der Tweedieverteilungen.

Diese wichtige Information kann direkt in diese Modellen eingespeist werden und daher haben diese Methoden gegenüber nichtparametrischen Verfahren wesentliche Vorteile.

Kaplan-Meier Methoden oder Cox-Regressionsmodelle werden von Reviewer oftmals – zu Recht – kritisiert. Es stehen daher eine breitere Palette von Modellen zur Verfügung:


5. Modelle: Continouos-time inhomogeneous Markov processes with discrete state space

Diese stellen eine sehr schöne Verallgemeinerung von Kaplan-Meier-Methoden dar. Dazu zählen insbesondere "illness-death models", "competing risk models" und "Fine-Gray Modelle", welche zu besseren Ergebnissen als Kaplan-Meier Modelle führen.

Medizinische Anwendungsbeispiele dazu finden Sie im pubmed, etwa Fortschreiten von Nierenkrebs, Brustkrebs oder Augenerkrankungen. Ein Beispiel wie so ein Zustandsraum aussehen kann, finden Sie in der folgenden Figure.

Grafik: Zustandsraum eines „Dynamic treatment regimes“ zur Behandlung von HIV basierend auf Zahl der CD4 Zellen. Der zeitliche Prozess wurde mittels eines diskreten, inhomogenen Markovprozesses mit stetiger Zeit mit 5 Zuständen und 7 Übergangen analysiert und beschrieben."