Forschung > Biostatistik

09/13/17

Forschung

Biostatistik

Für wen gilt unser Angebot zur statistischen Kooperation, Betreuung und Bearbeitung ihrer Studie?

Das Biostatistik Service kann von

  • allen Mitarbeitern/innen und Studierenden der Paracelsus Medizinischen Privatuniversität (PMU)
  • allen Angehörigen des Universitätsklinikums des Klinikums Nürnberg
  • allen Angehörigen des Universitätsklinikums Salzburg (SALK)
  • sowie von allen externen Wissenschaftern/innen und interessierten Klinikern/innen jeglicher Universität auf nationaler oder internationaler Ebene in Anspruch genommen werden.

Einen genauen Überblick über die bisherigen Publikationen des Biostatistik Services mit Kooperationspartnern sehen Sie hier in der Publikationsliste (Forschungsdatenbank) oder Publikationsliste (Pubmed).


Die biostatistische Zusammenarbeit/Kollaboration umfasst folgende Bereiche: 

Erstbesprechung

Ziel der Erstbesprechung ist eine Klärung der nächsten Schritte in Ihrer Studie. Diese können – je nach Fortschritt der Studie – recht verschiedenfältig sein: Befindet sich die Studie in der Planungsphase, so werden Themen wie Studiendesign, Ethikkommissionsantrag, saubere Datenerfassung mittels Datenbank, Planung der notwendigen Fallzahlen oder Studiendesign (offen, blind, randomisiert, kontrolliert, mono- oder multizentrisch, Pilotstudie, usw.) begesprochen.

Sind die Daten bereits erhoben, werden die wesentlichen Fragestellungen und Ziele Ihrer Studie besprochen und diskutiert. Wir ersuchen Sie zum Erstberatungsgespräch alle vorliegenden Projektunterlagen mitzubringen. 

Auswertung – Darstellung – Publikation Ihrer Studie

Zur Auswertung werden moderne mathematisch-statistische Analysen werden verwendet.

Warum ist das für Sie und Ihre Publikation wichtig? 

Dies ist deswegen fundamental wichtig, weil diese neuen Methoden signifikante Unterschiede mit einer oftmals deutlich höheren Power als z.B. der ehrwürdige, doch veraltete t-Test oder Chi-Quadrat nachweisen können.

Die mathematische Statistik durchläuft erfreulicherweise rasante Entwicklungen und stellt moderne Verfahren zur Verfügung: wovon Sie - und all Ihre Koautoren - profitieren.

Warum? Schließlich erhöht dies die Publikationschancen beträchtlich!

Werten Sie Ihre wertvollen Daten einmal mit t-Tests aus und vergleichen dies mit modernen Methoden!
Sie werden sehen: Auf einmal ist das Ergebnis signifikant! 

Sie wissen wieviel an Arbeit/organisatorischen Tätigkeiten/Kosten/Personal/usw - (Antragstellung, Planung, Patientenuntersuchung, u.va.m.) - dahinter steht, bis überhaupt einmal Daten vorliegen, so sehen Sie dass es sich sehr wohl lohnt hier moderne/feinere/genauere statistische Verfahren zu verwenden.

In meiner täglichen Arbeit sehe ich das immer wieder auf Neue: auf einmal ist der primäre Endpunkt siginfikant, wenn man z.B. Monte Carlo Methoden verwendet oder generalized linear models oder bootstrapping oder adaptive Designs usw.

 

Hier ein Überblick über moderne Verfahren, die in der Praxis eingesetzt werden:

1. "Resampling Methods/Monte Carlo Methods/bootstrapping":

Der Vorteil von "Resampling Methods/Monte Carlo Methods/bootstrapping" liegt darin, dass diese Methoden einen echten Behandlungseffekt oder Zusammenhang (z.B. beim Vergleich von Blutverlust zweier verschiedener Operationsmethoden, 5-Jahresinzidenzrate für Brustkrebs, Überlegenheit von Therapie A gegen Therapie B, usw.) besser nachweisen können (also mit einer höheren Power) als dies mit herkömmlichen parametrischen oder nichtparametrischen Tests der Fall ist.

Das Forschungsbüro verwendet dazu eine Vielzahl von sog. "Monte-Carlo-, Permutations-, Bootstrap- und Jackknife-Methoden", welche klassischen, herkömmlichen Tests in vielen Fällen deutlich überlegen sind.

 2. "Adaptive Group-Sequential Designs":

Diese können den erwarteten Stichprobenumfang im Vergleich zu Plänen mit festem Stichprobenumfang beträchtlich senken. Die Studiendauer wird daher u.U. deutlich verkürzt, daher werden die Kosten, der Zeit- und Organisationsaufwand überschaubar, manchmal die Studie überhaupt erst realisierbar.

Zum Beispiel verwenden wir gerne sog. "two stage designs" wie "internal pilot study designs", "Bauer-Köhne Designs", usw. Man erlaubt sich sozusagen, während die Daten erhoben werden, mal einen Blick darauf zu werfen, holt sich Informationen aus den bereits vorliegenden Daten, um dann konstruktiv eingreifen zu können und die Studie in die richtige Richtung zu lenken.

3. "Machine learning/artifical intelligence (AI)":

Keine Frage: Machine learning/AI ist in aller Munde. Zu Recht! 

  • Artificial neural networks: feedforward networks, convolutional neural networks (CNN), recurrent neural networks (RNN), usw.
  • gated recurrent units, long short-term memory networks 
  • Support vector machines
  • Bayes classifier
  • Classification tree analyses

Diese werden meist bei sog. "classification problems", "sequence to class", "sequence to regression", "sequence to sequence predicition" angewendet.

Dazu einige Anwendungsbeispiele aus der Praxis:

3.1 in der Ophthalmologie: Entdeckungsraten für die Erkennung von Gefäßen, Exsudaten und Blutungen bei Patienten mit diabetischer Retinopathie mittels neuronaler Netzen.

3.2 in der internen Medizin: Prognose von Lungenembolien und ventrikuläre Hypertrophie und Myokardinfarkt.

3.3 Pneumologie/Lungenheilkunde: Prognose, ob ein Patient erfolgreich von der mechanischen Beatmung entwöhnt werden kann.

3.4 in der Urologie: zur Prostatafrüherkennung.

3.5 Dermatologie: neuronale Netztechnologien zur Prognose des Auftretens eines Melanoms.

3.6. Bioinformatics: 

Die nachfolgenden Beispiele zeigen Anwendungen von sog. "recurrent neural networks", die mit sog. "long-short term memory layers (LSTM)" oder "gated recurrent layers (GRU)" arbeiten:

1. 
Convolutional LSTM Networks for Subcellular Localization of Proteins
2. Protein Secondary Structure Prediction with Long Short Term Memory
3. Prediction of DNA-binding residue from Protein sequence by Combining Long Short-Term Memory and Ensemble Learning.
4. A sequence-based, deep learning model accurately predicts RNA splicing branchpointsDNA-level splice junction prediction using deep recurrent networks

Diese Modelle unterliegen strengen sogenannten"cross-validation tests" in randomisierten, unabhängigen Stichproben um die Generalisierung auf neue Patienten/Objekten zu gewährleisten.  


Recurrent neural networks sehen wir als besondere Herausforderung für die mathematische Modellierung und haben daher besonderes Interesse mit Ihnen zusammenzuarbeiten.

Medizinische Anwendungsbeispiele dazu finden Sie im pubmed, etwa Fortschreiten von Nierenkrebs, Brustkrebs oder Augenerkrankungen.


4. "Generalized Estimation Equation Models (GEE), Mixed models, Generalized linear/nonlinear Models (GLM/GLNM) oder General Additive Models":

verfügen über einige sehr wichtige Vorteile gegenüber traditionellen Verfahren wie t-test, ANOVA, usw. Denn in der Praxis kommen häufig nichtnormalverteilte Merkmale vor, die dann anderen Verteilungen folgen: z.B. inversen Normal-, Beta-, Gamma-, Poisson-, Binomial oder der Familie der Tweedieverteilungen.

Diese wichtige Information wird von diesen Modellen verwendet und daher haben diese Methoden gegenüber nichtparametrischen Verfahren wesentliche Vorteile.

Kaplan-Meier Methoden oder Cox-Regressionsmodelle werden von Reviewer oftmals – zu Recht – kritisiert. Es stehen daher so genannte

5. "Markov chains und homogeneous sowie inhomogeneous Markov processes with discrete state space and continuous time" Modelle

zur Verfügung.

Diese stellen eine sehr schöne Verallgemeinerung der ebenfalls alt und ehrwürdigen Kaplan-Meier Methoden dar. Dazu zählen insbesondere "illness-death models" und "competing risk models".

Medizinische Anwendungsbeispiele dazu finden Sie im pubmed, etwa Fortschreiten von Nierenkrebs, Brustkrebs oder Augenerkrankungen.

Hier ein Beispiel eines sog. "Dynamic treatment regimes" bei HIV:

6. Software in Verwendung:

Die komplette Auswertung Ihrer Daten wird mittels moderner statistischer Methoden und Software durchgeführt:

  • STATISTICA 13. Hill, T. & Lewicki, P. (2017). STATISTICS: Methods and Applications. StatSoft, Tulsa, OK. www.statsoft.com
  • MATHEMATICA 11: Wolfram Research, Inc., Mathematica, Version 7.0, Champaign, IL (2017). www.mathematica.com
  • StatXact 10 (Cytel Software. For Windows User Manual, Cambridge MA, USA). www.cytel.com
  • PASS 13 Hintze, J. (2017). NCSS 8. NCSS, LLC. Kaysville, Utah, USA. www.ncss.com
  • NASS 10: Hintze, J. (2017). NCSS 8. NCSS, LLC. Kaysville, Utah, USA. www.ncss.com
  • STATISTICA Neural networks, Hill, T. & Lewicki, P. (2011). STATISTICS: Methods and Applications. StatSoft, Tulsa, OK. www.statsoft.com
  • SPSS 23. IBM Corp. Released 2011. IBM SPSS Statistics for Windows, Version 23.0. Armonk, NY: IBM Corp.

7. Nützliche Checklisten, Flowcharts u. interessante Links:


8. Standard Operating Procedure

Die "SOP für die Zusammenarbeit im Rahmen medizinischer Studien" regelt die Zusammenarbeit zwischen dem Biostatistik-Service des Forschungsbüros der Paracelsus Universität und der/dem Anfragenden. Ziel ist die Standardisierung der Vorgangsweise sowie die Festlegung eines Qualitätsstandards für die Zusammenarbeit. 

9. Die Ergebnisse der Auswertung werden Ihnen schriftlich per E-Mail als Bericht übermittelt.

 Ziel ist die Publikation Ihrer Studie in internationalen high impact Journalen.

Bisherige Publikationen mit Kooperationspartner sehen Sie hier: Publikationsliste