Statistik

Fehler erster und zweiter Art in der Statistik (einfach erklärt)

Du hast stundenlang quantitativen Daten analysiert und sämtliche statistische Tests durchgeführt!

Jetzt hast du doch auf jeden Fall endlich ein eindeutig richtiges Ergebnis, oder?

Naja, nicht ganz… immerhin befinden wir uns immer noch in der Welt der Wahrscheinlichkeiten, und nur weil die Statistik eine Hypothese unterstützt, heißt das nicht, dass sie wahr sein muss.

In der Statistik spricht man in diesem Zusammenhang von Fehlern erster und zweiter Art.

In diesem Artikel erkläre ich dir, was das bedeutet, wie du diese Fehler erkennst und was sie für die Interpretation deiner quantitativen Datenanalyse bedeuten.

https://youtu.be/1noB1wS8Z68

#1 Grundlagen der Hypothesentests

Hypothesentests sind ein zentrales Werkzeug in der Statistik. Sie helfen dir dabei, Annahmen über Datensätze zu überprüfen.

In der Theorie brauchst du für einen Hypothesentest die Nullhypothese (H0) und die Alternativhypothese (H1). In wissenschaftlichen Arbeiten sind meist nur noch die Alternativhypothesen „sichtbar“, weil diese das ausdrücken, welchen Zusammenhang man in den Daten vermutet.

Um die mathematischen Grundlagen beim Testen von Hypothese zu verstehen, musst du aber wissen, dass es zu jeder Alternativhypothese einen Gegenspieler gibt, der das Gegenteil behauptet. Das ist die Nullhypothese.

Lass uns das an einem Beispiel verdeutlichen. Stelle dir ein Gerichtsverfahren vor, bei dem jemand des Diebstahls beschuldigt wird. In diesem Fall lautet die Alternativhypothese, dass die Person schuldig ist (H1: „Die Person ist schuldig“). Die Nullhypothese hingegen wäre die gegenteilige Annahme, also dass die Person unschuldig ist (H0: „Die Person ist unschuldig“).

Bei Hypothesentests in der Statistik geht es immer darum, zu entscheiden, ob wir die Nullhypothese ablehnen oder akzeptieren. Das heißt also, selbst wenn wir eigentlich an der Alternativhypothese interessiert sind, überprüfen wir mathematisch die Nullhypothese.

Aber denk daran: Bei einem Hypothesentest gibt es nie eine 100%ige Gewissheit über die Richtigkeit der Nullhypothese.

Da Hypothesentests auf Wahrscheinlichkeiten basieren, können die Ergebnisse manchmal von der Realität abweichen.

Zum Beispiel könnten wir die Nullhypothese aufgrund statistischer Tests ablehnen, obwohl sie in Wahrheit zutrifft. Das führt uns zu den Fehlern erster und zweiter Art.

fehler erster und zweiter art

#2 Fehler erster Art (Alpha-Fehler)

Ein Alpha-Fehler, auch bekannt als Fehler erster Art, entsteht, wenn du die Nullhypothese irrtümlich ablehnst, obwohl sie eigentlich wahr ist. Stell dir vor, in einem Gerichtsverfahren wird eine unschuldige Person fälschlicherweise für schuldig erklärt. Genau das ist ein Alpha-Fehler.

In der Praxis kann das zum Beispiel auch bedeuten, dass ein medizinischer Test irrtümlich eine Krankheit bei einem gesunden Patienten diagnostiziert. Das kennst du vielleicht noch von den Corona-Tests, die manchmal „positiv“ ausgefallen sind, obwohl man gar nicht krank war.

Solch ein Fehler kann ernsthafte Folgen haben. Er kann von unnötigen medizinischen Eingriffen bis hin zu falschen Forschungsergebnissen reichen, wenn du fälschlicherweise die Nullhypothese ablehnst.

Das Signifikanzniveau, das du für deinen Hypothesentest wählst, bestimmt das Risiko eines Alpha-Fehlers. Das Signifikanzniveau gibt an, wie wahrscheinlich es ist, die Nullhypothese fälschlicherweise abzulehnen, obwohl sie in Wahrheit zutrifft.

Beispiel

Angenommen, du führst einen Hypothesentest durch, um zu überprüfen, ob ein neues Medikament wirksam ist. Deine Nullhypothese (H0) könnte lauten: „Das Medikament hat keinen Effekt.“ Deine Alternativhypothese (H1) wäre: „Das Medikament hat einen Effekt.“

Du entscheidest dich, ein Signifikanzniveau von 5% (α = 0.05) anzulegen. Das bedeutet, dass du eine 5%ige Wahrscheinlichkeit akzeptierst, einen Fehler 1. Art zu machen – also die Nullhypothese fälschlicherweise abzulehnen.

Nach Durchführung deines Tests erhältst du einen p-Wert. Ein kleiner p-Wert bedeutet, dass unsere Ergebnisse weniger wahrscheinlich zufällig sind und auf einen echten Effekt hinweisen könnten, wenn unsere Nullhypothese wahr ist. Ein großer p-Wert deutet darauf hin, dass unsere Ergebnisse wahrscheinlich zufällig sind und keinen echten Effekt anzeigen. Angenommen, der p-Wert ist 0.03.

Da der p-Wert (0.03) kleiner ist als dein Signifikanzniveau (0.05), lehnst du die Nullhypothese ab. Das bedeutet, dass du davon ausgehst, dass das Medikament einen Effekt hat, weil die Daten darauf hindeuten, dass die Wahrscheinlichkeit, den beobachteten Effekt zufällig zu erhalten, sehr niedrig ist.

Allerdings besteht immer noch die Möglichkeit, dass du einen Alpha-Fehler gemacht hast, also die Nullhypothese fälschlicherweise abgelehnt hast, wenn sie tatsächlich wahr ist. Dieses Risiko liegt bei 5%, da du ein Signifikanzniveau von 5% gewählt hast. Aber aufgrund des niedrigen p-Wertes und des Signifikanzniveaus glaubst du, dass es wahrscheinlicher ist, dass das Medikament tatsächlich einen Effekt hat.

fehler erster und zweiter Art 2

#3 Fehler zweiter Art (Beta-Fehler)

Der Fehler zweiter Art ist auch als Beta-Fehler bekannt. Dieser Fehler passiert, wenn du die Nullhypothese fälschlicherweise beibehältst, obwohl in Wirklichkeit die Alternativhypothese wahr ist. Stell dir vor, im Gerichtsbeispiel wird eine tatsächlich schuldige Person irrtümlich für unschuldig erklärt.

In der medizinischen Welt entspricht ein Beta-Fehler einem „falsch negativen“ Ergebnis, bei dem eine tatsächlich kranke Person fälschlicherweise als gesund eingestuft wird. Die Auswirkungen eines solchen Fehlers können gravierend sein, da beispielsweise eine notwendige Behandlung nicht eingeleitet wird.

Die Wahrscheinlichkeit eines Beta-Fehlers hängt von mehreren Faktoren ab, darunter die Teststärke (Power), die Effektgröße und die Stichprobengröße.

  • Teststärke (Power): Die Power eines Tests ist die Wahrscheinlichkeit, die Nullhypothese korrekt abzulehnen, wenn die Alternativhypothese wahr ist. Sie wird berechnet als 1 – β, wobei β der Beta-Fehler ist.
  • Effektgröße: Dies ist ein Maß dafür, wie groß der Unterschied oder Effekt ist, den du in deiner Studie zu entdecken versuchst. Größere Effekte sind leichter zu entdecken.
  • Stichprobengröße: Größere Stichproben bieten in der Regel mehr Genauigkeit und verringern den Beta-Fehler.

Die Berechnung des Beta-Fehlers erfordert oft komplexe statistische Software, da sie die Erstellung einer Power-Analyse umfasst. Dies beinhaltet die Schätzung der Wahrscheinlichkeit, mit der dein Test einen tatsächlichen Effekt erkennt, basierend auf der Effektgröße, der Stichprobengröße und dem Signifikanzniveau.

#4 Gleichgewicht zwischen Fehlern erster und zweiter Art

Es ist wichtig zu verstehen, dass je nach Anwendungsfall, die richtige Balance zwischen Alpha- und Beta-Fehler Risiko entscheidend ist. Ein niedriges Signifikanzniveau verringert das Risiko eines Alpha-Fehlers, kann aber die Wahrscheinlichkeit eines Beta-Fehlers erhöhen. Umgekehrt kann eine Erhöhung der Teststärke das Risiko eines Beta-Fehlers verringern, erhöht aber möglicherweise das Risiko eines Alpha-Fehlers.

Eine wichtige Überlegung hierbei ist die Stichprobengröße. Eine größere Stichprobe kann sowohl die Teststärke erhöhen als auch das Risiko beider Fehlerarten reduzieren. In der Praxis ist es oft eine Herausforderung, das richtige Gleichgewicht zu Zwischen Praktikabilität, Kosten, und Fehlerrisiken zu finden, besonders wenn Ressourcen begrenzt sind.

Du möchtest professionelles Training für deine Abschlussarbeit?

Dann nimm jetzt Teil an meinem neuen online CRASH-KURS! (100% kostenlos)

(und erfahre die 8 Geheimnisse einer 1,0 Abschlussarbeit)

Hier mehr erfahren!

#5 Teste dein Verständnis

Ich stelle dir nun eine Reihe an Fragen. So kannst du überprüfen, ob du das Thema wirklich verstanden hast. Wenn du möchtest, kannst du das Video pausieren und deine Antwort kurz aufschreiben.

Frage: Ein neues Medikament wird getestet, um zu sehen, ob es effektiver als ein Placebo ist. Der p-Wert des Tests ist 0,04. Die Forscher haben ein Signifikanzniveau von 5% (p = 0,05) festgelegt. Sie schließen daraus, dass das Medikament wirksam ist. Später stellt sich jedoch heraus, dass das Medikament keinen echten Effekt hat. Welcher Fehler liegt vor und warum?

Antwort: Fehler 1. Art

Begründung: Da der p-Wert (0,04) kleiner als das festgelegte Signifikanzniveau (0,05) ist, lehnen die Forscher die Nullhypothese ab. Sie machen einen Fehler 1. Art, da sie fälschlicherweise annehmen, das Medikament sei wirksam, obwohl es in Wirklichkeit keinen Effekt hat.

Frage: Bei einer Qualitätskontrolle wird ein fehlerhaftes Produkt geprüft. Der Test hat eine Wahrscheinlichkeit von 10% (p = 0,10), einen Fehler zu übersehen, wenn er tatsächlich vorhanden ist. Das Produkt wird als fehlerfrei eingestuft, obwohl es tatsächlich fehlerhaft ist. Welcher Fehler wurde begangen?

Antwort: Fehler 2. Art

Begründung: Der Fehler 2. Art tritt auf, wenn die Nullhypothese fälschlicherweise beibehalten wird. Hier wurde die Nullhypothese („Das Produkt ist fehlerfrei“) beibehalten, obwohl das Produkt tatsächlich fehlerhaft war. Die Wahrscheinlichkeit von 10%, einen solchen Fehler zu übersehen, deutet auf den Beta-Fehler (Fehler 2. Art) hin.

Frage: In einer klinischen Studie wird ein neues Krebsmedikament getestet. Der Test ergibt keinen signifikanten Unterschied zum Standardmedikament (p = 0,07) bei einem Signifikanzniveau von 5%. Später wird jedoch entdeckt, dass das neue Medikament tatsächlich effektiver ist. Welcher Fehler liegt vor?

Antwort: Fehler 2. Art.

Begründung: Da der p-Wert (0,07) höher als das Signifikanzniveau (0,05) ist, behalten die Forscher die Nullhypothese bei. Sie machen einen Fehler zweiter Art, da sie fälschlicherweise annehmen, das neue Medikament sei nicht effektiver, obwohl es tatsächlich besser wirkt.

#6 Fazit – Fehler erster und zweiter Art

Die Fehler 1. und 2. Art sind zentrale Aspekte in der Statistik und unerlässlich für das Verständnis von Hypothesentests.

Sie erinnern uns daran, dass statistische Ergebnisse nie ganz ohne ein kleines Fragezeichen auskommen. Es geht nicht nur um Zahlen und Daten, sondern auch darum, wie du sie interpretierst.

Wenn du einmal verstanden hast, wie diese Fehler funktionieren und worauf du achten musst, kannst du statistische Daten und Ergebnisse viel besser einordnen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert