Eines der Hauptziele der Forschung und klinischer Studien besteht darin, herauszufinden, welche Assoziationen oder Ergebnisse nicht lediglich durch den Zufall zustande kommen. Je nach Design der Studie und den von ihr gelieferten Daten kann eine Hypothese angenommen oder verworfen werden, was wiederum eine Aussage zur Korrelation von Merkmalen zulässt. In der Forschung werden statistische Tests durchgeführt, um Informationen und Bedeutungen aus variablen Datensätzen abzuleiten. Es gibt verschiedene Arten von Tests, z. B. den Chi-Quadrat-Test oder den Exakten Test nach Fisher. Sie werden je nach Fragestellung der Studie und den Charakteristika der zu analysierenden Variablen bzw. Merkmale ausgewählt. Studienergebnisse können auf der Grundlage von berechneten p-Werten und vorgegebenen Signifikanzniveaus (α) als statistisch signifikant interpretiert werden. Konfidenzintervalle sind eine Möglichkeit, die Signifikanz eines statistischen Ergebnisses ohne Berechnung eines p-Werts auszudrücken. Unter Nutzung verschiedener Arten von Diagrammen können Daten visualisiert und veranschaulicht werden.
Kostenloser
Download
Lernleitfaden
Medizin ➜
Ein Hypothesentest bzw. eine Hypothesenprüfung dient dazu, die Plausibilität einer Fragestellung durch die Analyse von Studiendaten zu bewerten.
Beispiel: Ein Unternehmen entwickelt ein neues Medikament X, welches zur Behandlung der arteriellen Hypertonie Hypertonie Arterielle Hypertonie eingesetzt werden soll. Das Unternehmen möchte wissen, ob das Medikament X tatsächlich den Blutdruck senkt, und muss daher eine Hypothesenprüfung durchführen.
Schritte zur Prüfung einer Hypothese:
Eine Hypothese ist eine vorläufige Antwort auf eine Forschungsfrage (d. h. eine “Vermutung” darüber, wie die Ergebnisse aussehen werden). Es gibt zwei Arten von Hypothesen: die Nullhypothese und die Alternativhypothese.
Beispiel 1: Ablehnung der Nullhypothese
Wenn im obigen Beispiel die Ergebnisse der Studie zeigen, dass das Medikament X den Blutdruck tatsächlich signifikant senkt, wird die Nullhypothese (die besagt, dass es keinen Unterschied zwischen den Gruppen gibt) verworfen. Beachten Sie, dass diese Ergebnisse die Alternativhypothese nicht bestätigen (s. o.), sondern lediglich die Nullhypothese widerlegen.
Beispiel 2: Die Nullhypothese wird nicht verworfen
Wenn im obigen Beispiel die Ergebnisse der Studie zeigen, dass das Medikament X den Blutdruck nicht signifikant senkt, dann kann die Nullhypothese durch diese Studie nicht verworfen werden. Auch hier ist zu beachten, dass die Ergebnisse die Nullhypothese nicht (endgültig) bestätigen.
Statistische Signifikanz bedeutet, dass es sehr unwahrscheinlich ist, dass alle Testergebnisse rein zufällig zustande kommen. Um die statistische Signifikanz zu bestimmen, müssen Sie einen α-Wert festlegen und einen p-Wert berechnen.
Es kann ein Diagramm (s. u.) erstellt werden, in dem die möglichen Studienergebnisse auf der x-Achse und die Wahrscheinlichkeit des Auftretens jedes Ergebnisses auf der y-Achse aufgetragen werden. Die Fläche unter der Kurve stellt den p-Wert dar.
Eselsbrücke:
“Ist p klein, darf die Nullhypothese nicht sein”.
Die Wahl des Tests hängt von folgenden Aspekten ab:
Die Vernünftigkeit des Modells sollte immer infrage gestellt werden. Wenn das Modell falsch ist, ist auch alles andere falsch.
Seien Sie vorsichtig mit Merkmalen, die nicht wirklich unabhängig sind.
Statistische Tests bzw. Analysen können drei Hauptkategorien zugeordnet werden:
Name des Tests | Was der Test prüft | Art der Variablen bzw. Merkmale | Beispiel |
---|---|---|---|
Regressionsanalysen | |||
Einfache lineare Regression | Wie sich eine Veränderung der unabhängigen Variable (= Eingangsvariable bzw. Prädiktor) auf die abhängige Variable (= Reaktionsvariable) auswirkt |
|
Wie beeinflusst das Gewicht (unabhängige Variable) die Lebenserwartung (abhängige Variable)? |
Multiple lineare Regression | Wie sich Veränderungen in den Kombinationen von ≥ 2 unabhängigen Variablen auf die abhängige Variable auswirken |
|
Wie wirken sich Gewicht und sozioökonomischer Status (unabhängige Variablen) auf die Lebenserwartung (abhängige Variable) aus? |
Logistische Regression | Wie ≥ 1 unabhängige Variablen ein binäres Ergebnis beeinflussen können |
|
Welchen Einfluss hat das Gewicht (unabhängige Variable) auf das Überleben (binäre abhängige Variable: tot oder lebendig)? |
Vergleichsanalysen | |||
Zweistichproben-t-Test für abhängige Stichproben | Vergleicht die Mittelwerte von 2 Gruppen aus derselben Grundgesamtheit |
|
Vergleichen Sie die Gewichte der Säuglinge (abhängige Variable) vor und nach der Fütterung (unabhängige Variable). |
Zweistichproben-t-Test für unabhängige Stichproben | Vergleicht die Mittelwerte von 2 Gruppen aus verschiedenen Grundgesamtheiten |
|
Wie groß ist der Unterschied in der Durchschnittskörpergröße (abhängige Variable) zwischen 2 verschiedenen Basketballmannschaften (unabhängige Variable)? |
Varianzanalyse (analysis of variance, ANOVA) | Vergleicht die Mittelwerte von > 2 Gruppen |
|
Wie groß ist der Unterschied im Blutzuckerspiegel (abhängige Variable) 1, 2 und 3 Stunden nach einer Mahlzeit (unabhängige Variablen)? |
Korrelationsanalysen | |||
Chi-Quadrat-Test | Testet die Stärke des Zusammenhangs zwischen 2 qualitativen Variablen in einer größeren Stichprobe |
|
Vergleichen Sie, ob die Aufnahme in ein Medizinstudium (Variable 1) wahrscheinlicher ist, wenn der Bewerber in Deutschland geboren wurde (Variable 2). |
Exakter Test nach Fisher | Testet die Stärke des Zusammenhangs zwischen 2 qualitativen Variablen in einer kleineren Stichprobe |
|
Wie Chi-Quadrat, aber mit kleinerem Stichprobenumfang |
Korrelationskoeffizient nach Pearson/Bravais | Testet die Stärke eines linearen Zusammenhangs zwischen 2 stetigen Variablen |
|
Vergleichen Sie, wie der HbA1c-Plasmaspiegel bei Diabetikern (Variable 1) mit dem Triglyceridspiegel im Plasma Plasma Transfusionsprodukte zusammenhängt (Variable 2). |
Chi-Quadrat-Tests werden häufig verwendet, um zwei qualitative Merkmale zu analysieren und festzustellen, ob sie miteinander in Beziehung stehen.
Für die Durchführung eines Chi-Quadrat-Tests werden zwei Informationen benötigt: Die Freiheitsgrade (Anzahl der Kategorien minus 1) und das Signifikanzniveau α (das vom Forscher gewählt und in der Regel auf 0,05 festgelegt wird). Darüber hinaus sollten die Daten in einer Tabelle organisiert werden.
Beispiel: Wenn man herausfinden wollte, ob Jongleure eher in einer bestimmten Jahreszeit geboren werden, könnte man die Daten in die folgende Tabelle eintragen:
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren |
---|---|
Frühling | 66 |
Sommer | 82 |
Herbst | 74 |
Winter | 78 |
Zunächst müssen die erwarteten Häufigkeiten für jede Zelle in der obigen Tabelle anhand folgender Gleichung bestimmt werden:
$$ Erwartete\ Häufigkeit = np_{0i} $$wobei n der Stichprobenumfang und p0i der hypothetische Anteil in jeder Kategorie i ist.
Im obigen Beispiel ist n = 300 und p0i = ¼, also ist die erwartete Zellenhäufigkeit 300 x 0,25 = 75 in jeder Zelle.
Die Teststatistik wird dann nach der Standard-Chi-Quadrat-Formel berechnet:
$$ \chi ^{2} = \sum _{all\ cells} \frac{(beobachtete\ Häufigkeit-erwartete\ Häufigkeit)^{2}}{erwartete\ Häufigkeit} $$wobei 𝝌2 die zu berechnende Teststatistik ist. Für jede “Zelle” oder Kategorie wird die erwartete Häufigkeit von der beobachteten Häufigkeit abgezogen; dieser Wert wird quadriert und dann durch die erwartete Häufigkeit geteilt. Nachdem diese Zahl für jede Kategorie berechnet wurde, werden die Zahlen addiert.
Beispiel einer 𝝌2-Berechnung: Im obigen Beispiel ist die erwartete Häufigkeit in jeder Zelle 75, sodass die 𝝌2 Teststatistik wie folgt berechnet werden kann:
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren | (Beobachtet – erwartet)2 / erwartet |
---|---|---|
Frühling | 66 | (66 ‒ 75)2 / 75 = 1,080 |
Sommer | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Herbst | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Winter | 78 | (78 ‒ 75)2 / 75 = 0,120 |
𝝌2= 1,080 + 0,653 + 0,013 + 0,102 = 1,866
Feststellung, ob die Teststatistik statistisch signifikant ist oder nicht:
Um festzustellen, ob diese Teststatistik statistisch signifikant ist, wird die Chi-Quadrat-Tabelle verwendet, um den kritischen Chi-Quadrat-Wert zu erhalten.
Beispiel 𝝌2-Test: Ist es wahrscheinlicher, dass Jongleure in einer bestimmten Jahreszeit geboren werden (bei einem Signifikanzniveau von 0,05)?
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren | (Beobachtet – erwartet)2 / erwartet |
---|---|---|
Frühling | 66 | (66 ‒ 75)2 / 75 = 1,080 |
Sommer | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Herbst | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Winter | 78 | (78 ‒ 75)2 / 75 = 0,120 |
𝝌2 = 1,080 + 0,653 + 0,013 + 0,120 = 1.866
Da 1,866 < 7,81 (unser kritischer Wert) ist, lehnen wir die Nullhypothese nicht ab und kommen zu dem Schluss, dass die Geburtsjahreszeit nicht mit dem Jonglieren zusammenhängt.
Häufige Fallstricke:
Ähnlich wie der 𝝌2-Test ist der Exakte Test nach Fisher ein statistischer Test, der verwendet wird, um festzustellen, ob es nicht-zufällige Zusammenhänge zwischen zwei qualitativen Variablen gibt.
Eine 2×2-Kontingenztafel wird wie folgt aufgebaut:
Y | Z | Zeile gesamt | |
---|---|---|---|
W | a | b | a + b |
X | c | d | c + d |
Summe der Spalten | a + c | b + d | a + b + c + d (= n) |
Die Teststatistik p wird anhand dieser Tabelle nach folgender Formel berechnet:
$$ p = \frac{(\frac{a+b}{a})(\frac{c+d}{c})}{(\frac{n}{a+c})} = \frac{(\frac{a+b}{b})(\frac{c+d}{d})}{(\frac{n}{b+d})} = \frac{(a+b) (c+d) (a+c) (b+d)}{a\ b\ c\ d\ n} $$wobei p = p-Wert; a, b, c und d sind Zahlen aus den Zellen einer einfachen 2×2-Kontingenztafel und n = a + b + c + d.
Bevor Berechnungen durchgeführt werden, sollten die Daten in einem einfachen grafischen Format dargestellt werden (z. B. Balkendiagramm, Streudiagramm, Histogramm).
Kontingenztafeln:
Streudiagramme bzw. Scatterplots:
Box-Plots:
Kaplan-Meier-Schätzer
Tabellen (z. B. Häufigkeitstabellen):
Histogramme:
Häufigkeitspolygon:
Häufigkeitstabellen, Balkendiagramme/Histogramme und Kreisdiagramme sind drei der gängigsten Methoden zur Darstellung qualitativer Merkmale.
Häufigkeitstabellen:
Farbe des Ampelsignals | Häufigkeit |
---|---|
Rot | 65 |
Gelb | 5 |
Grün | 30 |
Balkendiagramm:
Kreisdiagramme: