Eines der Hauptziele der Forschung und klinischer Studien besteht darin, herauszufinden, welche Assoziationen oder Ergebnisse nicht lediglich durch den Zufall zustande kommen. Je nach Design der Studie und den von ihr gelieferten Daten kann eine Hypothese angenommen oder verworfen werden, was wiederum eine Aussage zur Korrelation von Merkmalen zulässt. In der Forschung werden statistische Tests durchgeführt, um Informationen und Bedeutungen aus variablen Datensätzen abzuleiten. Es gibt verschiedene Arten von Tests, z. B. den Chi-Quadrat-Test oder den Exakten Test nach Fisher. Sie werden je nach Fragestellung der Studie und den Charakteristika der zu analysierenden Variablen bzw. Merkmale ausgewählt. Studienergebnisse können auf der Grundlage von berechneten p-Werten und vorgegebenen Signifikanzniveaus (α) als statistisch signifikant interpretiert werden. Konfidenzintervalle sind eine Möglichkeit, die Signifikanz eines statistischen Ergebnisses ohne Berechnung eines p-Werts auszudrücken. Unter Nutzung verschiedener Arten von Diagrammen können Daten visualisiert und veranschaulicht werden.
Kostenloser
Download
Lernleitfaden
Medizin ➜
Ein Hypothesentest bzw. eine Hypothesenprüfung dient dazu, die Plausibilität einer Fragestellung durch die Analyse von Studiendaten zu bewerten.
Beispiel: Ein Unternehmen entwickelt ein neues Medikament X, welches zur Behandlung der arteriellen Hypertonie Hypertonie Arterielle Hypertonie eingesetzt werden soll. Das Unternehmen möchte wissen, ob das Medikament X tatsächlich den Blutdruck senkt, und muss daher eine Hypothesenprüfung durchführen.
Schritte zur Prüfung einer Hypothese:
Eine Hypothese ist eine vorläufige Antwort auf eine Forschungsfrage (d. h. eine “Vermutung” darüber, wie die Ergebnisse aussehen werden). Es gibt zwei Arten von Hypothesen: die Nullhypothese und die Alternativhypothese.
Beispiel 1: Ablehnung der Nullhypothese
Wenn im obigen Beispiel die Ergebnisse der Studie zeigen, dass das Medikament X den Blutdruck tatsächlich signifikant senkt, wird die Nullhypothese (die besagt, dass es keinen Unterschied zwischen den Gruppen gibt) verworfen. Beachten Sie, dass diese Ergebnisse die Alternativhypothese nicht bestätigen (s. o.), sondern lediglich die Nullhypothese widerlegen.
Beispiel 2: Die Nullhypothese wird nicht verworfen
Wenn im obigen Beispiel die Ergebnisse der Studie zeigen, dass das Medikament X den Blutdruck nicht signifikant senkt, dann kann die Nullhypothese durch diese Studie nicht verworfen werden. Auch hier ist zu beachten, dass die Ergebnisse die Nullhypothese nicht (endgültig) bestätigen.
Fehlentscheidungen
Bild von Lecturio. Lizenz: CC BY-NC-SA 4.0Statistische Signifikanz bedeutet, dass es sehr unwahrscheinlich ist, dass alle Testergebnisse rein zufällig zustande kommen. Um die statistische Signifikanz zu bestimmen, müssen Sie einen α-Wert festlegen und einen p-Wert berechnen.
Es kann ein Diagramm (s. u.) erstellt werden, in dem die möglichen Studienergebnisse auf der x-Achse und die Wahrscheinlichkeit des Auftretens jedes Ergebnisses auf der y-Achse aufgetragen werden. Die Fläche unter der Kurve stellt den p-Wert dar.
Eselsbrücke:
“Ist p klein, darf die Nullhypothese nicht sein”.
Grafische Darstellung des p-Wertes und der α-Werte:
Beachten Sie in diesem Beispiel, dass der beobachtete p-Wert unter dem vorgegebenen statistischen Signifikanzniveau liegt (in diesem Fall 95 %). Dies bedeutet, dass die Nullhypothese verworfen werden sollte; denn das beobachtete Ergebnis wäre sehr unwahrscheinlich, wenn die Nullhypothese (d. h. zwischen den Variablen besteht keine Beziehung) wahr wäre.
Darstellung des Konfidenzintervalls mit einem Konfidenzniveau von 90 % bei einer Kurve mit Normalverteilung
Bild von LecturioDie Wahl des Tests hängt von folgenden Aspekten ab:
Die Vernünftigkeit des Modells sollte immer infrage gestellt werden. Wenn das Modell falsch ist, ist auch alles andere falsch.
Seien Sie vorsichtig mit Merkmalen, die nicht wirklich unabhängig sind.
Darstellungen von quantitativen und qualitativen Merkmalen
Bild von Lecturio. Lizenz: CC BY-NC-SA 4.0
Statistische Tests bzw. Analysen können drei Hauptkategorien zugeordnet werden:
Name des Tests | Was der Test prüft | Art der Variablen bzw. Merkmale | Beispiel |
---|---|---|---|
Regressionsanalysen | |||
Einfache lineare Regression | Wie sich eine Veränderung der unabhängigen Variable (= Eingangsvariable bzw. Prädiktor) auf die abhängige Variable (= Reaktionsvariable) auswirkt |
|
Wie beeinflusst das Gewicht (unabhängige Variable) die Lebenserwartung (abhängige Variable)? |
Multiple lineare Regression | Wie sich Veränderungen in den Kombinationen von ≥ 2 unabhängigen Variablen auf die abhängige Variable auswirken |
|
Wie wirken sich Gewicht und sozioökonomischer Status (unabhängige Variablen) auf die Lebenserwartung (abhängige Variable) aus? |
Logistische Regression | Wie ≥ 1 unabhängige Variablen ein binäres Ergebnis beeinflussen können |
|
Welchen Einfluss hat das Gewicht (unabhängige Variable) auf das Überleben (binäre abhängige Variable: tot oder lebendig)? |
Vergleichsanalysen | |||
Zweistichproben-t-Test für abhängige Stichproben | Vergleicht die Mittelwerte von 2 Gruppen aus derselben Grundgesamtheit |
|
Vergleichen Sie die Gewichte der Säuglinge (abhängige Variable) vor und nach der Fütterung (unabhängige Variable). |
Zweistichproben-t-Test für unabhängige Stichproben | Vergleicht die Mittelwerte von 2 Gruppen aus verschiedenen Grundgesamtheiten |
|
Wie groß ist der Unterschied in der Durchschnittskörpergröße (abhängige Variable) zwischen 2 verschiedenen Basketballmannschaften (unabhängige Variable)? |
Varianzanalyse (analysis of variance, ANOVA) | Vergleicht die Mittelwerte von > 2 Gruppen |
|
Wie groß ist der Unterschied im Blutzuckerspiegel (abhängige Variable) 1, 2 und 3 Stunden nach einer Mahlzeit (unabhängige Variablen)? |
Korrelationsanalysen | |||
Chi-Quadrat-Test | Testet die Stärke des Zusammenhangs zwischen 2 qualitativen Variablen in einer größeren Stichprobe |
|
Vergleichen Sie, ob die Aufnahme in ein Medizinstudium (Variable 1) wahrscheinlicher ist, wenn der Bewerber in Deutschland geboren wurde (Variable 2). |
Exakter Test nach Fisher | Testet die Stärke des Zusammenhangs zwischen 2 qualitativen Variablen in einer kleineren Stichprobe |
|
Wie Chi-Quadrat, aber mit kleinerem Stichprobenumfang |
Korrelationskoeffizient nach Pearson/Bravais | Testet die Stärke eines linearen Zusammenhangs zwischen 2 stetigen Variablen |
|
Vergleichen Sie, wie der HbA1c-Plasmaspiegel bei Diabetikern (Variable 1) mit dem Triglyceridspiegel im Plasma Plasma Transfusionsprodukte zusammenhängt (Variable 2). |
Chi-Quadrat-Tests werden häufig verwendet, um zwei qualitative Merkmale zu analysieren und festzustellen, ob sie miteinander in Beziehung stehen.
Für die Durchführung eines Chi-Quadrat-Tests werden zwei Informationen benötigt: Die Freiheitsgrade (Anzahl der Kategorien minus 1) und das Signifikanzniveau α (das vom Forscher gewählt und in der Regel auf 0,05 festgelegt wird). Darüber hinaus sollten die Daten in einer Tabelle organisiert werden.
Beispiel: Wenn man herausfinden wollte, ob Jongleure eher in einer bestimmten Jahreszeit geboren werden, könnte man die Daten in die folgende Tabelle eintragen:
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren |
---|---|
Frühling | 66 |
Sommer | 82 |
Herbst | 74 |
Winter | 78 |
Zunächst müssen die erwarteten Häufigkeiten für jede Zelle in der obigen Tabelle anhand folgender Gleichung bestimmt werden:
$$ Erwartete\ Häufigkeit = np_{0i} $$wobei n der Stichprobenumfang und p0i der hypothetische Anteil in jeder Kategorie i ist.
Im obigen Beispiel ist n = 300 und p0i = ¼, also ist die erwartete Zellenhäufigkeit 300 x 0,25 = 75 in jeder Zelle.
Die Teststatistik wird dann nach der Standard-Chi-Quadrat-Formel berechnet:
$$ \chi ^{2} = \sum _{all\ cells} \frac{(beobachtete\ Häufigkeit-erwartete\ Häufigkeit)^{2}}{erwartete\ Häufigkeit} $$wobei 𝝌2 die zu berechnende Teststatistik ist. Für jede “Zelle” oder Kategorie wird die erwartete Häufigkeit von der beobachteten Häufigkeit abgezogen; dieser Wert wird quadriert und dann durch die erwartete Häufigkeit geteilt. Nachdem diese Zahl für jede Kategorie berechnet wurde, werden die Zahlen addiert.
Beispiel einer 𝝌2-Berechnung: Im obigen Beispiel ist die erwartete Häufigkeit in jeder Zelle 75, sodass die 𝝌2 Teststatistik wie folgt berechnet werden kann:
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren | (Beobachtet – erwartet)2 / erwartet |
---|---|---|
Frühling | 66 | (66 ‒ 75)2 / 75 = 1,080 |
Sommer | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Herbst | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Winter | 78 | (78 ‒ 75)2 / 75 = 0,120 |
𝝌2= 1,080 + 0,653 + 0,013 + 0,102 = 1,866
Feststellung, ob die Teststatistik statistisch signifikant ist oder nicht:
Um festzustellen, ob diese Teststatistik statistisch signifikant ist, wird die Chi-Quadrat-Tabelle verwendet, um den kritischen Chi-Quadrat-Wert zu erhalten.
Beispiel für die Tabelle der kritischen Werte für den 𝝌2-Test:
Auf der y-Achse stellt v die Freiheitsgrade dar (d. h. die Anzahl der untersuchten Kategorien minus 1); die Signifikanzniveaus (α) sind auf der x-Achse angegeben. Die entsprechenden kritischen Werte sind in der Tabelle zu finden und werden dann mit der berechneten Teststatistik verglichen.
Beispiel 𝝌2-Test: Ist es wahrscheinlicher, dass Jongleure in einer bestimmten Jahreszeit geboren werden (bei einem Signifikanzniveau von 0,05)?
Kategorie (i): Jahreszeit der Geburt | Beobachtete Häufigkeit von Jongleuren | (Beobachtet – erwartet)2 / erwartet |
---|---|---|
Frühling | 66 | (66 ‒ 75)2 / 75 = 1,080 |
Sommer | 82 | (82 ‒ 75)2 / 75 = 0,653 |
Herbst | 74 | (74 ‒ 75)2 / 75 = 0,013 |
Winter | 78 | (78 ‒ 75)2 / 75 = 0,120 |
𝝌2 = 1,080 + 0,653 + 0,013 + 0,120 = 1.866
Da 1,866 < 7,81 (unser kritischer Wert) ist, lehnen wir die Nullhypothese nicht ab und kommen zu dem Schluss, dass die Geburtsjahreszeit nicht mit dem Jonglieren zusammenhängt.
Häufige Fallstricke:
Ähnlich wie der 𝝌2-Test ist der Exakte Test nach Fisher ein statistischer Test, der verwendet wird, um festzustellen, ob es nicht-zufällige Zusammenhänge zwischen zwei qualitativen Variablen gibt.
Eine 2×2-Kontingenztafel wird wie folgt aufgebaut:
Y | Z | Zeile gesamt | |
---|---|---|---|
W | a | b | a + b |
X | c | d | c + d |
Summe der Spalten | a + c | b + d | a + b + c + d (= n) |
Die Teststatistik p wird anhand dieser Tabelle nach folgender Formel berechnet:
$$ p = \frac{(\frac{a+b}{a})(\frac{c+d}{c})}{(\frac{n}{a+c})} = \frac{(\frac{a+b}{b})(\frac{c+d}{d})}{(\frac{n}{b+d})} = \frac{(a+b) (c+d) (a+c) (b+d)}{a\ b\ c\ d\ n} $$wobei p = p-Wert; a, b, c und d sind Zahlen aus den Zellen einer einfachen 2×2-Kontingenztafel und n = a + b + c + d.
Bevor Berechnungen durchgeführt werden, sollten die Daten in einem einfachen grafischen Format dargestellt werden (z. B. Balkendiagramm, Streudiagramm, Histogramm).
Kontingenztafeln:
Kontingenztafel zur Identifizierung falsch-positiver (b) und falsch-negativer (c) Ergebnisse
Bild von Lecturio. Lizenz: CC BY-NC-SA 4.0Streudiagramme bzw. Scatterplots:
Box-Plots:
Beispiel für einen Box-Plot
Bild: “Box-and-Whisker-Plots” von Jantien A. Backer, Don Klinkenberg, Jacco Wallinga. Lizenz: CC BY 4.0Kaplan-Meier-Schätzer
Beispiel eines Kaplan-Meier-Diagramms
Bild: “Ein Beispiel für ein Kaplan-Meier-Diagramm” von Rw251. Lizenz: CC0 1.0Tabellen (z. B. Häufigkeitstabellen):
Histogramme:
Beispiel für ein Histogramm. Auf der x-Achse ist die Veränderung des Körpergewichts in kg und auf der y-Achse die absolute Häufigkeit der Personen mit der jeweiligen Körpergewichtsänderung aufgetragen.
Bild: “Example of a histogram” von Jkv. Lizenz: Public DomainHäufigkeitspolygon:
Häufigkeitspolygon für die Gehälter von 31 Teams der National Football League (NFL)
Bild: “Example of a frequency polygon chart” von JLW87. Lizenz: Public DomainHäufigkeitstabellen, Balkendiagramme/Histogramme und Kreisdiagramme sind drei der gängigsten Methoden zur Darstellung qualitativer Merkmale.
Häufigkeitstabellen:
Farbe des Ampelsignals | Häufigkeit |
---|---|
Rot | 65 |
Gelb | 5 |
Grün | 30 |
Balkendiagramm:
Beispiel für ein Balkendiagramm
Bild: “Balkendiagramm zu Rasse und ethnischer Zugehörigkeit in Texas” von Datawheel. Lizenz: CC0 1.0Kreisdiagramme:
Beispiel eines Kreisdiagramms
Bild: “A pie chart for the example data” von Liftarn. Lizenz: Public Domain