Lagemaße sind Werte in einer Stichprobe, die die verschiedenen zentralen Tendenzen innerhalb eines Datensatzes charakterisieren und umgangssprachlich oft als "Durchschnittswerte" bezeichnet werden. Die gebräuchlichsten Lagemaße sind der Mittelwert, der Median und der Modalwert. Die Ermittlung eines zentralen Wertes ermöglicht einen Vergleich mit anderen Werten und zeigt eine Streuung oder Verteilung innerhalb einer Stichprobe. Streuungsmaße werden in zwei Gruppen eingeteilt: Streuungsmaße auf der Grundlage von Perzentilen und Streuungsmaße auf der Grundlage des Mittelwerts (allgemein bekannt als Standardabweichungen). Bei der Analyse der Verteilung von Daten wird anhand der Streuung festgestellt, ob die Werte eine starke oder schwache zentrale Tendenz aufweisen. Wenn die Datenverteilung symmetrisch ist und der Mittelwert = Median = Modalwert ist, spricht man von einer Normalverteilung. Es sind auch andere Arten von Verteilungen möglich, die als nicht-normale Verteilungen bezeichnet werden.
Kostenloser
Download
Lernleitfaden
Medizin ➜
Lagemaße sind Einzelwerte, mit denen versucht wird, einen Datensatz zu beschreiben, indem der tendenzielle, zentrale oder “typische” Wert für diesen Datensatz ermittelt wird.
Definition:
Der Mittelwert (arithmetisches Mittel, engl. “mean”) ist die Summe aller Messungen in einem Datensatz geteilt durch die Anzahl der Messungen in diesem Datensatz.
Gleichung:
$$ Mean = \frac{Sum\ of\ all\ values\ in\ the\ data\ set}{Total\ number\ of\ values\ in\ data\ set} $$ $$ Mean = \frac{x_{1}+x_{2}+x_{3}+…+x_{n}}{n} $$Beispiel:
Ermitteln Sie den Mittelwert des folgenden Datensatzes: 1, 1, 1, 3, 5, 5, 7, 19.
Antwort: Es gibt acht Werte in diesem Datensatz. Um den Mittelwert zu berechnen, werden alle Zahlen addiert und durch 8 geteilt:
$$ Mean = \frac{1+1+1+3+5+5+7+19}{8}=\frac{42}{8}=5.25 $$Definition:
Wenn die Daten vom niedrigsten zum höchsten Wert geordnet werden, ist der Median der mittlere Wert, der die untere Hälfte von der oberen Hälfte des Datensatzes trennt.
Gleichung:
Um den Median zu ermitteln, ordnen Sie die Werte vom niedrigsten zum höchsten Wert an und verwenden dann die folgende Gleichung, um zu bestimmen, welche “Position” in der Reihenfolge den Median darstellt:
$$ Median = \left \{ \frac{(n+1)}{2} \right \} $$wobei n = die Anzahl der Werte im Datensatz ist.
Beispiel:
Ermitteln Sie den Median des folgenden Datensatzes: 1, 5, 1, 19, 3, 1, 7, 5.
Antwort: Es gibt acht Zahlen in diesem Datensatz. Um den Median zu ermitteln, ordnen Sie zunächst die Zahlen in der Reihenfolge an: 1, 1, 1, 3, 5, 5, 7, 19. Bestimmen Sie anschließend, welche “Position” den Median darstellt. Verwenden Sie dazu die Formel (n + 1) / 2. Es gibt acht Zahlen in diesem Datensatz, also n = 8. Der Median ist somit: (8 + 1) / 2 = 4,5. Der Median liegt zwischen der 4. und der 5. Zahl, also zwischen 3 und 5 (visuell: 1, 1, 1, 3, 5, 5, 7, 19). Der Median in diesem Datensatz beträgt also 4.
Definition:
Der Modalwert (Modus, engl. “mode”) ist der Wert, der in dem Datensatz am häufigsten vorkommt.
Beispiel:
Ermitteln Sie den Modus des folgenden Datensatzes: 1, 5, 1, 19, 3, 1, 7, 5.
Antwort: Nennen Sie die Zahl, die am häufigsten vorkommt. Dies kann durch die Erstellung einer Häufigkeitstabelle erreicht werden:
Datenpunkt | Häufigkeit (wie oft der Datenpunkt in der Stichprobe vorkommt) |
---|---|
1 | 3 |
3 | 1 |
5 | 2 |
7 | 1 |
19 | 1 |
Eselsbrücke:
Der Modalwert ist der Wert, der am öftesten in der Menge vorkommt.
Lagemaß | Beschreibung | Beispiel | Ergebnis |
---|---|---|---|
Mittelwert | Summe der Werte geteilt durch die Anzahl der Werte | (8 + 4 + 10 + 4 + 4 + 5 + 4 + 5 + 6) / 9 | 5,5 |
Median | Mittlerer Wert, der die obere Hälfte von der unteren Hälfte trennt | 4, 4, 4, 4, 5, 5, 6, 8, 10 | 5 |
Modalwert | Häufigster Wert | 4, 4, 4, 4, 5, 5, 6, 8, 10 | 4 |
Das Ausmaß der Verteilung der Werte innerhalb eines Datensatzes heißt Streuung. Streuungsmaße sind z. B. Spannweite, Quantil (z. B. Quartil oder Perzentil) oder Standardabweichung.
Definition: Die Standardabweichung (engl. “standard deviation”, SD) ist ein Maß dafür, wie weit jeder beobachtete Wert vom Mittelwert in einem Datensatz entfernt ist.
Gleichung:
Mathematisch lässt sich die SD mit der folgenden Gleichung berechnen:
$$ \sigma = \sqrt{\frac{\sum (\chi _{i}-\mu )^{2}}{N}} $$σ = Standardabweichung der Grundgesamtheit
Ν = Größe der Grundgesamtheit bzw. Anzahl der Werte im Datensatz
χᵢ = jeder Wert aus der Grundgesamtheit
μ = Mittelwert der Grundgesamtheit
Berechnung der Standardabweichung (unter Verwendung der Gleichung):
Eine Verteilung beschreibt, wie die Werte eines Datensatzes geclustert sind bzw. sich “aneinanderdrängen”. Daten neigen dazu, sich in bestimmten Mustern zu gruppieren, die als Verteilungsformen bekannt sind. Es gibt eine “normale” Verteilungsform, und es gibt mehrere nicht-normale Formen. Für unterschiedliche Verteilungsformen werden unterschiedliche statistische Tests verwendet.
Normalverteilungen unterscheiden sich in ihren jeweiligen Mittelwerten und ihre Varianzen, weisen aber folgende Gemeinsamkeiten auf:
Viele Prozesse folgen nicht-normalen Verteilungen, was auf natürliche Prozesse/Schwankungen oder Fehler in den Daten zurückzuführen sein kann.
Häufige Verteilungen:
Gründe, warum Daten eine nicht-normale Verteilung haben können: