Woher Weiß ich ob eine Stichprobe groß genug ist, wie kann ich die Frage einfach beantworten?
Hallo. Zum Beispiel eine Umfrage wo Leute in einem Land auf einer Skala 1,…,10 antworten wie glücklich sie sind. Anschließend wird der Durchschnitt berechnet. Woher weiß ich nun ob die Stichprobe groß genug ist für den Durchschnitt? Also ist eine Stichprobe von 3000 groß genug?
5 Antworten
Bei dem genannten Beispiel sind 3000 zufällig ausgewählte Personen sicher ausreichend. Allerdings handelt es sich bei dem Beispiel um einen klassischen Fall, bei dem eine Durchschnittsberechnung nicht wirklich sinnvoll ist. Ein aussagekräftigerer Wert wäre hier der Median, vor allem, wenn die Skala etwas feiner unterteilt ist.
Median und Mittelwert sind beide sehr sinnvoll, sie sagen nur etwas Verschiedenes aus. Der Median teilt die Stichprobe in 2 gleichgroße Hälften, der Mittelwert, wenn er davon abweicht, z.B. nach oben, zeigt dann, dass die Ergebnisse in der oberen Hälfte mehr zum oberen Ende tendieren als die in der unteren Hälfte zum unteren Ende.
Und wenn Du ihn deswegen weniger sinnvoll findest, weil er z.B. nicht direkt auf eine Skalenzahl trifft, dann wird er im Ggs. zu Deiner Aussage umso sinnvoller, je feiner die Skala ist
Weil die Skala nicht intervallskaliert ist. Jede Testperson hat ihre eigene, subjektive Wahrnehmung, was unter einem bestimmten Skalenwert zu verstehen ist. Es gibt beispielsweise keine sinnvolle Interpretation, nach der der Abstand zwischen 2 und 3 exakt genau so groß ist wie zwischen 9 und 10.
Aber das dient doch zum vergleichen (hier jetzt verschiedene Länder). Angenommen Land A hat 5 Bewertungen: 10, 10,8, 8, 8
und Land B: 8,8,8,1,1.
Dann wäre ja beiden der Median 8, jedoch der Schnitt bei A: 8,8 und bei B: 5,2. Anhand der Daten kann man schon sehen das A “besser” abschneidet. Also warum ist den hier genau der Schnitt nicht gut?
Die Frage ist, ob man in diesem Fall einer sehr beschränkten Stichprobe nicht zuviel in den errechneten Mittelwert hineininterpretiert, der eine Exaktheit vorgaukelt, die in den erhobenen Daten nicht vorliegt. Man kann auch argumentieren, daß in Land B 60% der Befragten, also die Mehrheit, sich für den höheren Wert entschieden haben, in Land A dagegen nur 40%.
So einfach zu beantworten ist die Frage nicht. Du brauchst eine Hypothese für die Grundgesamtheit, z.B. dass jeder Skalenwert gleich oft vorkommt (Xi=10% für alle i=1,...,10) oder andere Xi. Dann musst Du festlegen, welche Abweichung von Deiner Hypothese Du noch zulässt (Xi +/- yi) um diese Hypothese nicht abzulehnen (Du wirst in keiner Stichprobe Deine exakte Hypothese erreichen). Je kleiner Du nun die yi wählst, desto größer muss die Stichprobe sein. Also nicht einfach!
Eine einfachere Hypothese wäre tatsächlich, einfach nur den Mittelwert oder auch den Median zu schätzen, aber auch dann brauchst Du eine Verteilungsannahme (z.B. Normalverteilung, die man hier oft nimmt obwohl eigentlich nicht geeignet) und die "Abweichungstoleranz" von Deinem vermuteten Mittelwert oder Median, um eine nötige Stichprobengröße zu ermitteln. Ich glaube aber für diesen Fall, wenn Du diese "Abweichungstoleranz" nicht mikroskopisch klein machst, dass 3000 auf jeden Fall ausreicht. Auch nicht so ganz einfach!
Nach dem empirischen Gesetz der großen Zahlen sollte 3000 ausreichend sein. Bei üblichen Umfragen - wie z. B. der Sonntagsfrage - werden etwa 1024 zufällig ausgewählte Personen befragt und die Genauigkeit der Umfrage liegt bei +- 3 %.
entscheidend ist , welche Fehlertoleranz gewünscht wird . Je kleiner , desto größer n .
siehe hier auf dieser netten Seite
sobald das Intervall sicherer werden soll , steigt z und n wird größer
soll das Intervall kleiner werden , wird aus der 0.05 im Nenner eine kleinere Zahl , n steigt.
Dass hier die 5% und die 95% 100% ergeben ist Zufall ( didaktisch nicht gut gewählt ) 95% und etwas anderes als 5% Breite wäre besser gewesen.
und
https://www.surveymonkey.de/mp/repraesentative-stichprobe-berechnen-formeln-beispiele-und-tipps/
Warum macht hier der Durchschnitt keinen Sinn?