Ist die Standardabweichung NUR bei normalverteilten Daten anzuwenden?
Hallo liebe Leute,
falls ich den entsprechenden Eintrag hier übersehen habe, entschuldige ich mich dafür, die Frage erneut zu stellen, jedoch bin ich gerade ein bisschen ratlos.
Ich brüte gerade über einem Datenblatt und habe meine (intervallskalierten) Variablen via SPSS auf eine Normalverteilung hin geprüft. Laut dem K-S-Test sind meine Daten nicht normalverteilt?! Es handelt sich hierbei um eine Abfrage von Präferenzhaltungen. Vorabfrage: Ist das normal oder eher ungewöhnlich?
Nutze ich jetzt trotzdem die Standardabweichung oder ist diese hier völlig fehl am Platz? Über eine nette Antwort würde ich mich sehr freuen.
Gruß
Timson
1 Antwort
Wofür möchtest Du denn die Standardabweichung benutzen? Irgendwelche Tests, die auf der Normalverteilungsannahme beruhen, kannst Du nicht durchführen. Wenn Du aber wissen willst, wieviel die einzelnen Werte im Mittel von dem Gesamtmittel abweichen, dann ist die Standardabweichung genau richtig dafür, egal welche Verteilung da zugrunde liegt. Allerdings ist die Frage, ob in diesem Fall - ich nehme an, Du hast eine rechts- oder linksschiefe, also nicht-symmetrische Verteilung - der Mittelwert der geeignete Wert ist, um die "Mitte" der Verteilung zu charakterisieren. Vielleicht wäre hier der Median angebrachter, und als Streuungsmaß der Interquartilbereich, also die Zahlen, unter denen 50% (Median), 25% (1. Quartil) und 75% (3.Quartil) liegen, also die Stichprobe in 4 gleich große Teile einteilen.
Ich habe eine recht große Stichprobengröße und jetzt festgestellt, dass der K-S-Test auf Normalverteilung eher für kleinere geeignet ist. Nun habe ich einen Chi-Quadrattest durchgeführt, der gibt mir eine asym. Signifikanz von ,000 aus. Dies bedeuetet ja nun, dass meine Variablen hoch signifikant von einer Normalverteilung abweichen, richtig?
Wie groß ist denn die Stichprobe? Bei einer sehr großen Stichprobe wird ja alles signifikant, selbst wenn die Abweichungen kaum ersichtlich sind. Ich würde mal einen Normalverteilungsplot o.ä. machen, um zu sehen, wo wirklich sichtbare Abweichungen sein könnten, für SAS siehe z.B. http://support.sas.com/documentation/cdl/en/procstat/63963/HTML/default/viewer.htm#procstat_univariate_sect090.htm; SPSS dürfte ähnliches bieten.
Du könntest auch an eine logarithmische Transformation denken, wenn Du linksschiefe Daten hast, also gehäuft kleine Werte und mehr und mehr ausgedünnt hohe Werte, wie z.B. bei Einkommensverteilungen. Sollten die Logarithmen halbwegs normalverteilt sein, kannst Du irgendwelche Analysen mit denen machen und entsprechende Ergebnisse dann wieder rücktransformieren.
250 Teilnehmer, somit gehe ich davon aus, dass die Signifikanzniveaus noch aussagekräftig sind. Vielen dank für Hilfe!
Das hilft mir schonmal weiter! Vielen Dank!