Die meisten medizinischen Erkenntnisse beruhen auf Forschung. Sie stellt eine wichtige Basis für fachlichen Entscheidungen des medizinischen Alltags dar. Am Anfang jedes Forschungsprojekts steht eine Hypothese. Anschließend muss überlegt werden, wie genau der Gegenstand der Hypothese messbar gemacht werden kann (Operationalisierung). Es schließen sich Planungen bezüglich der Untersuchungskriterien und der Durchführung an. Ein geeignetes Studiendesign muss gewählt werden und um die eine gewissen Qualität zu versichern, müssen Gütekriterien berücksichtigt werden. Anschließend erfolgt die konkrete Datenerhebung, für die abhängig von der Fragestellung unterschiedlich geeignete Methoden ausgewählt werden können. Nach Erhebung der Daten schließt sich ihre Auswertung an. Da in der medizinischen Forschung häufig mit Stichproben gearbeitet wird, wird versucht, final generalisierte Aussagen aus den Ergebnissen ableiten zu können.
Inhalt
Kostenloser
Download
Lernleitfaden
Medizin ➜
Der österreichische Philosoph Karl Popper (1902–1994) entwickelte die Wissenschaftstheorie des Kritischen Rationalismus. Seine Antwort auf die Frage nach den Grenzen der empirischen Forschung heißt Falsifikation. Falsifizierbarkeit soll empirische von nicht empirischen Aussagen abgrenzen.
Eine empirische Theorie muss demnach mindestens einen Beobachtungssatz enthalten, der logisch zu einem Widerspruch führen kann. (Eines der wichtigsten Merkmale einer wissenschaftlichen Hypothese ist die Falsifizierbarkeit).
Beispiel:
Wissenschaft beginnt nie mit Beobachtung (induktiv), sondern immer mit Vermutungen (deduktiv).
Popper: Beobachtungen können zwar nie die Wahrheit wissenschaftlicher Hypothesen begründen (Verifikation), wohl aber ihre Falschheit (Falsifikation).
Beispiel: Die Beobachtung eines schwarzen Schwans falsifiziert die Hypothese ein für alle Mal, dass alle Schwäne weiß sind.
Werden im Alltag die Begriffe Hypothese und Theorie oft synonym gebraucht, macht die Wissenschaft signifikante Unterschiede.
Hypothesen sind vorläufige Antworten auf Forschungsfragen, also wissenschaftliche Annahmen über den Zusammenhang von Variablen, die empirisch geprüft werden können. Beim induktiven Vorgehen werden aus einzelnen Beobachtungen allgemeine Aussagen abgeleitet. Werden Hypothesen hinreichend gesichert und bilden ein System, ist dies eine Theorie.
Eine Theorie gründet sich auf Hypothesen (induktives Vorgehen) und ist Grundlage für die Ableitung von Hypothesen (deduktives Vorgehen).
Klinik-Ausflug: Ärzt*innen stellen in der praktischen Arbeit jeden Tag Hypothesen (Verdachtsdiagnosen) auf. Sie versuchen mittels diagnostischer Methoden und/oder Beobachtung der Wirkung von Therapien diese Hypothese zu sichern oder durch neue Informationen neue Hypothesen aufzustellen oder zu modifizieren.
Diese zwei Arten von Fehlern gibt es:
Die Herzfrequenz Herzfrequenz Herzphysiologie zu messen ist sehr viel einfacher als das Denken oder unsere Gefühle zu ermitteln. Durch eine Operationalisierung sollen nicht direkt beobachtbare Phänomene für die Messung zugänglich gemacht werden. Um Konstrukte zu untersuchen, braucht man Variablen.
Variablen sind Eigenschaftsbenennungen der zu untersuchenden Merkmale (z. B.: männlich-weiblich). Das Gegenteil der Variable ist die Konstante.
Skalen sind Bezugssysteme für die Messung der Ausprägung von Merkmalen (qualitativ „entweder- oder“ oder quantitativ „Abstufungen“).
Begriff | Beschreibung | Beispiel |
---|---|---|
Rangordnung | Personen werden in Bezug auf das Merkmal in eine hierarchische Reihenfolge gebracht. | Rangfolge bei einem Wettkampf |
Paarvergleich | Eine Aufforderung, Paarkombinationen zu vergleichen | Brillengläservergleich |
Rating-Skala | Abstufung zwischen den Extrempolen | Zufriedenheitsskala (sehr zufrieden bis total unzufrieden mit) |
Likert-Skala | Ratingskala mit meist 5 Stufen, der Gesmattestwert wird am Schluss addiert. | Angstskalen |
Polaritätsprofil | Messung der Assoziationen von Gegenstandspaaren | Erfassung von Stereotypen und Einstellungen (z. B. zu Homosexualität Homosexualität Sexualphysiologie) |
Visuelle Analogskalen | Liker-Skalen mit einem Kontinuum statt Polen und Abstufungen dazwischen | Schmerzskalen |
Guttman-Skala | Aussagen sind in einer bestimmten Reihenfolge angeordnet (von „normal“ zu „extrem“). Wird eine Aussage bejaht, werden normalerweise alle vorher stehenden Aussagen auch bejaht. Trifft dies ein, ist die Guttman-Skala „perfekt“. | Angaben des Gewichts: > 60 kg, > 70 kg, > 80 kg usw. |
In der Psychologie werden vier verschiedene Skalenniveaus unterschieden. Die Skalen sind ineinander überführbar, jedoch nur von oben nach unten. So abstrakt das alles am Anfang klingen mag, begegnen die verschiedenen Skalen oft im medizinischen Alltag.
Krank (positiv) | Gesund (negativ) | Statistiche Maße | |
---|---|---|---|
Positives Testergebnis | Ergebnis richtig positiv (A) | Ergebnis falsch positiv (B) | Positiv prädiktiver Wert = A/(A+B) |
Negatives Testergebnis | Ergebnis falsch negativ (C) | Ergebnis richtig negativ (D) | Negativ prädiktiver Wert = D/(C+D) |
Statistische Maße | Sensitivität = A/(A+C) | Spezifität = D/(B+D) |
Für die Beurteilung, ob ein Test über-, unter- oder durchschnittlich ausgefallen ist, benötigt man den Mittelwert und die Standardabweichung einer Vergleichspopulation (Normstichprobe). Diese Eichung sollte an einer möglichst großen Stichprobe unter standardisierten Bedingungen durchgeführt werden.
Die mittlere Testleistung der Referenzgruppe ergibt die Norm. Der durchschnittlich erzielte Wert ist der Mittelwert. Das Maß für die Streuung der Testwerte die Standardabweichung.
Die drei wichtigsten Testgütekriterien Objektivität, Reliabilität und Validität bauen aufeinander auf, das heißt, ohne Objektivität gibt es keine Reliabilität und ohne Reliabilität keine Validität.
Die subjektiven Einflüsse durch den Testleiter sollen durch eine Standardisierung und geringen Spielraum bei der Auswertung minimiert werden. Der Korrelationskoeffizient gibt an, wie abhängig das Versuchsergebnis vom Versuchsleiter ist.
Beispiel: Bei schriftlichen Fragen und Computer-Auswertung wie im schriftlichen Physikum haben die Testleiter*innen keinen Einfluss auf das Testergebnis. Bedeutend subjektiver ist dagegen die mündliche Prüfung.
Ein Test ist dann als präzise einzustufen, wenn unter denselben Bedingungen bei derselben Person das identische oder sehr ähnliche Ergebnis herauskommt. Folgende Möglichkeiten gibt es, um die Reliabilität eines Tests zu prüfen:
Eine absolute Messgenauigkeit bei psychologischen Tests ist nicht zu erreichen (Standardmessfehler durch die mangelnde Reliabilität). Es werden zwei Größen berücksichtigt.
Konfidenzintervall: Testwert von Proband*in +/- Standardmessfehler = wahrer Wert Proband*in (meist 95 %)
Merke: Die Reliabilität eines Tests ist umso besser, je geringer der Standardmessfehler und je enger das Konfidenzintervall ist.
Merke: Die gängigste Form der externen Validierung ist die Korrelation mit anderen Tests. Die Ergebnisse eines neuen Tests werden mit denen eines etablierten Tests (gleiches zu messendes Merkmal) in derselben Personengruppe verglichen.
Mithilfe eines psychologischen Tests könenn Individeen einer Merkmalsklasse zugeordnen werden (z. B. Patient*innen mit Depression, ADHS ADHS Aufmerksamkeitsdefizit-Hyperaktivitätssyndrom (ADHS) o. ä.). Um eine medizinische Diagnose zu stellen, werden bestimmte Tests gemacht und anhand der Ergebnisse und dem eigenen Expert*innenurteil eine diagnostische Entscheidung gestellt.
Das Fehler-Risiko einer solchen Entscheidung ist hoch. Um eine solche Entscheidungstheorie zu beurteilen, kommen die Sensitivität, Spezifität und Prädiktionswert in Spiel. So werden diagnostische Vorgehensweisen hinsichtlich ihres Nutzens beurteilt.
Die Güte und der Nutzen eines Tests werden folgendermaßen geprüft: Eine große Stichprobe mit einer positiven und einer negativen Klasse wird einem Nachweisverfahren unterzogen und damit die Richtigkeit der Klassifikation überprüft, z. B. wird der Anti-Körper-HIV-Test mittels des aufwendigeren teureren Western-Blots überprüft.
Achtung: Eine negative Diagnose bezeichnet meist einen gesunden Zustand, eine positive Diagnose das Vorhandensein eines kritischen Merkmals, also einen Krankheitszustand.
Mit dem Vier-Felder-Schema der Entscheidungsmöglichkeiten lassen sich die Kennwerte leicht berechnen:
Tatsächlicher Zustand | |||
---|---|---|---|
Diagnose | Positiv (krank) | Negativ (gesund) | insgesamt |
Positiv (krank) | Entscheidung richtig positiv A | Entscheidung falsch positiv B | Positiver Prädikationswert A/(A+B) |
Negativ (gesund) | Entscheidung falsch negativ C | Entscheidung richtig negativ D | Negativer Prädikationswert D/(C+D) |
insgesamt | Sensitivität A/(A+C) | Spezifität D/(B+D) |
Um eine wissenschaftliche Untersuchung durchführen zu können, wird ein Studiendesign erstellt oder gefolgt, welches alle Angaben zur Forschungsplanung enthält.
In einem Experiment wird erfasst, wie sich eine Situation aufgrund von geplanter Beeinflussung verändert. Die Ursache-Wirkungs-Beziehungen werden aufgedeckt. Meist werden Variablen verwendet. Es werden unabhängige und abhängige Variablen unterschieden:
Unter Stichprobe wird eine ausgewählte Teilmenge einer Grundgesamtheit, die nach bestimmten Kriterien stattfindet, verstanden.
Der Stichprobenfehler bezeichnet die Abweichung des gezeigten Werts einer Stichprobe von der Grundgesamtheit, da eine Stichprobe fast nie exakt die Population repräsentiert, aus der sie stammt. Möglichst minimiert werden kann der Stichprobenfehler durch eine möglichst große Stichprobe und geringe Varianz der Verteilung.
Unterarten von Stichproben:
Vier verschiedene Arten, um Daten zu gewinnen:
Datenarten
Die systematische Beobachtung hat den großen Vorteil, dass die Beobachtung weitestgehend frei von Beobachter*inen und deren Interpretation ist. Die Systematisierung wird durch genau festgelegte Kriterien (Ort, Zeit, Protokollbogen, etc.) erstellt.
Bei der teilnehmenden Beobachtung werden Beobachter*innen in das zu beobachtende Geschehen integriert. Ein häufiges Problem hierbei ist das zeitgleiche Teilnehmen und Protokollieren. Die nicht teilnehmende Beobachtung erfordert „nur“ Beobachten und Protokollieren, was auch durch entsprechende Medien erfasst werden kann (z. B. Videokamera).
Verschiedene Formen der Verhaltensbeobachtung:
Das Interview soll v. a. zielgerichtet Informationen zu z. B. Symptomen eines Krankheitsbildes erfragen. Die Befragung erfolgt persönlich, schriftlich oder telefonisch.
Quantitative Interviews sind sehr stark standardisiert. Sie sind in verschiedene Standardisierungsgrade unterteilt.
Qualitative Interviews gehören den hermeneutischen Verfahren an. Die individuelle Sichtweise der Befragten steht hierbei im Vordergrund.
Fragearten
Leistungstests
Leistungstests werden in Speedtests (gleichbleibende Aufgabenschwierigkeit bei begrenzter Zeit) und Powertests (sich steigernde Aufgabenschwierigkeit bei gleichbleibender Bearbeitungszeit) unterteilt. Beispiele:
Objektive Persönlichkeitstests
Hier wird psychoanalytisch der Abwehrmechanismus Projektion genutzt. Projektive Tests messen nicht anhand der Aussage von Proband*innen, sondern die „wahren“, wahrscheinlich verdeckten Wünsche werden in das Testmaterial hineininterpretiert. Der Kritikpunkt bei dieser Art von Test ist die fehlende Auswertungsobjektivität.
Bei qualitativen Daten handelt es sich um nicht numerische Daten, z. B. aus Interviews. Quantitative Daten werden aus Skalen oder Kategoriesystemen übernommen.
Qualitative Auswertungsverfahren sind wenig generalisierbar. Die Analyseformen konzentrieren sich auf die inhaltliche Erfassung von individuellen Fragestellungen.
Die Einteilung quantitativer Auswertungsverfahren erfolgt in univariate, bivariate und multivariate Analysen.
Die Univariate Analyse (Analyse eines Merkmals)
Die Bivariaten Analysen (Analyse von zwei korrelierten Merkmalen)
Die Multivariaten Analysen (Analyse von mehreren korrelierten Merkmalen)
Replizierbarkeit und Generalisierbarkeit sind die Kriterien, die erfüllt sein müssen. Als replizierbar gelten Ergebnisse dann, wenn wiederholt die gleichen Effekte nachgewiesen werden und daraus Gesetzmäßigkeiten abgeleitet werden können.
Wenn diese Gesetzmäßigkeiten auftreten und nicht nur mehr auf bestimmte Proband*innengruppen in spezifischen Situationen zutreffen, dann tritt auch eine Generalisierbarkeit ein. Ob Forschungsvorhaben überhaupt ethisch unbedenklich sind, wird vorab von Ethikkommissionen geprüft.
Die Kreuzvalidierung ist ein statistisches Verfahren, dass die Gültigkeit von Studienergebnissen überprüft. Hierzu wird das Verfahren an einer zweiten Stichprobe angewendet.
EBM hat zum Ziel, die praktische Erfahrung der Kliniker*innen um die klinisch relevante Forschung zu ergänzen. Die medizinische Versorgung soll dadurch immer weiter optimiert und nur tatsächlich effiziente Maßnahmen und Therapien erkannt und eingesetzt oder abgesetzt werden. Vor allem Leitlinien sollten EBM-basiert erstellt sein.