Kann mir jmd helfen die Aufgabe in Mathe zu lösen mit 2 Rechenwege?
Ein Sportmediziner behauptet: „Maximal 10% der Fussballspieler über 30 Jahre haben
Knieschäden.“ Es sollen nun 100 Fussballspieler über 30 Jahre zufällig ausgewählt werden. Entwickle einen Test der Hypothese auf einem Signifikanzniveau von 5%
2. Gib mindestens zwei unterschiedliche Lösungswege an.
2 Antworten
Hallo,
Du kannst es über die kumulierte Binomialverteilung oder über die kumulierte Normalverteilung berechnen (bei letzterer den Stetigkeitsausgleich nicht vergessen).
Du akzeptierst eine gewisse Anzahl von Knieverletzungen, die über die behaupteten höchstens 10 hinausgehen, weil es ja immer mal statistische Ausreißer geben kann und Du bei den 100 Befragten zufällig auf eine Gruppe gestoßen bist, bei der viele Knieverletzte waren - denn so sauber durchgemischt kann keine Stichprobe sein, daß sie exakt die Verhältnisse der Gesamtheit widerspiegelt.
Bei der Binomialverteilung ist das recht einfach. Du nimmst n=100, p=0,1, rufst die kumulierte Binomialverteilung auf und probierst Werte über 10 für k aus, die Du steigerst, bis das Ergebnis bei über 0,95 liegt. In diesem Fall warst Du zu tolerant für ein 5 %-Niveau und fährst wieder zurück.
Hier läge der Wert übrigens bei 14. Findest Du nicht mehr als 14 Knieverletzungen unter der Stichprobe, kann man die Behauptung als wahr durchgehen lassen.
Sind es mehr als 14, wäre es schon ein ziemlicher Zufall, daß ausgerechnet in dieser Stichprobe so viele Verletzungen sind (kann natürlich trotzdem sein) und man lehnt die Hypothese ab. Der Anteil der Knieverletzungen scheint dann zu 95 % Wahrscheinlichkeit doch über 10 % zu liegen.
Bei der Normalverteilung läuft das ähnlich ab.
Hier mußt Du allerdings noch sigma, die Standardabweichung berechnen.
Die ist die Wurzel aus dem Produkt von Erwartungswert und Gegenwahrscheinlichkeit.
Erwartungswert bei 100 Personen und 10 % Verletzungen sind 10 verletzte Personen. Gegenwahrscheinlichkeit ist 100 % minus 10 %=90 %, also 0,9.
Wurzel (10*0,9)=Wurzel (9)=3.
sigma ist also 3, p ist wieder 0,1, n ist 100 und mit k wird wieder herumgespielt.
Bei der kumulierten Normalverteilung mußt Du auch noch Ober- und Untergrenzen eingeben. Hier gibst Du als Untergrenze aber nicht 0 ein, sondern -0,5, und also Obergrenze nicht den Wert, den Du für k probieren willst, sondern k+0,5.
Probierst Du k=14, gibst Du nicht 14, sondern 14,5 ein.
Du erweiterst die Grenzen also um 0,5 nach außen.
Das tust Du deswegen, weil die Normalverteilung anders als die Binomialverteilung keine diskrete, sondern eine stetige Verteilung ist, die auch die Werte zwischen den natürlichen Zahlen berechnet. Patienten aber treten in der Regel ganzzahlig auf.
Deswegen machst Du hier diesen Stetigkeitsausgleich.
Bei beiden Methoden kommst Du auf 14 Verletzte, die noch akzeptiert werden, ab 15 ist dann Schluß mit lustig. Die Hypothese macht den Abgang.
Herzliche Grüße,
Willy
jetzt habe ich es, bei mir kommt 0,933 aufgerundet raus. Vielen Dank für deine Hilfe. Eine Frage hätte ich noch. Welche Fehler Art ist das und warum? Tut mir leid für die später Störung.
Ein Fehler erster Art wäre es, wenn Du mehr als 14 Verletzte in der Stichprobe hättest und deswegen die Behauptung, es gäbe höchstens 10 % Verletzungen, ablehnen würdest.
Das wäre dann das Restrisiko, daß diese Stichprobe zu den 5 % gehört, bei denen aus Zufall mehr als 14 Verletzte auftauchen. Fehler 1. Art nennt man auch Produzentenrisiko, weil eine Behauptung als falsch dargestellt wird, obwohl sie war ist. Ein Fehler zweiter Art wäre es, wenn Du weniger als 15 Verletzte findest und die Hypothese annimmst; in Wirklichkeit aber mehr als 10 % Verletzte in der Gesamtheit vorhanden sind und Du nur zufällig eine Stichprobe mit besonders wenigen Verletzungen erwischt hast. Das nennt man das Konsumentenrisiko: Eine Behauptung ist eigentlich falsch, wird aber aufgrund der Stichprobe als wahr angenommen.
Willst Du einen Fehler erster Art minimieren, mußt Du den Toleranzbereich ausweiten, etwa von 95 % auf 99 %. Damit würde aber das Risiko für einen Fehler zweiter Art steigen. Fährst Du dagegen den Toleranzbereich herunter, vielleicht auf 75 %, wird die Wahrscheinlichkeit, einen Fehler zweiter Art zu begehen, sehr niedrig. In diesem Fall kann aber leicht ein Fehler erster Art begangen werden.
H0: 10% der Fussballspieler haben Knieschäden p = 0.1
H1: p < 0.1
H0 wird abgelehnt, wenn zu wenige Knieschäden auftreten -> linksseitiger Test
Ansatz: p(X <= k ) = α
Binomialverteilung mit p = 0.1, n = 100
p(X <= 5) ~ 0.058
p(X <= 4) ~ 0.024
Fü k = 4 liegt p(X <= k ) erstmals unter 0.05.
Bei {0,1,2,3,4} Knieschäden wird H0 abgelehnt, d.h. man geht von weniger als 10% Knieschäden aus.
Was mit zweitem Lösungsweg gemeint ist, ist unklar. Entweder
p( X > k ) = 1 - α
oder es soll die Normalverteilung anstatt der Binomialverteilung benutzt werden.
µ = n*p = 100*0.1 = 10
σ = sqrt(n*p*(1-p)) = 3
Gesucht ist ein k mit
p(Z <= k) = phi( (k-µ)/σ ) = 0.05
Wegen phi( -1.64485362695147 ) = 0.05
muss gelten:
(k-µ)/σ = -1.6448536269514
daraus folgt k ~ 5.06
Mit der Normalverteilung führt auch das Stichprobenergebnis 5 zur Ablehnung von H0.
Maximal 10 %. Die Hypothese muß also abgelehnt werden, wenn bei 5 % Irrtumswahrscheinlichkeit die Rate bei über 10 % liegt.
Moin, erstmal danke für deine gute und lehrreiche Antwort.
ich habe bei der kumulierten binominalverteilung auch 14 raus = 0.9274 bei 15 wäre es = 0.9601.
wie gebe ich es bei der kumulierten notmalverteilung im Taschenrechner ein? Bei mir kommt wenn ich als untere -0.5 obere 14.5 und Sigma 3 eingebe 0.56 raus ?