Boxplots?

Ich habe eine Frage über den Boxplots. Und zwar sagt man ja, dass der Boxpott aus vier Abschnitte besteht, die jeweils 25% der Daten ausmachen. So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben. Aber wenn ich 25% ausrechne von den insgesamt 20 Schülern dann stimmt das nicht so ganz mit den Daten, die der Boxplot darstellt überein. Woran liegt das?

Bild zum Beitrag

Wechselfreund

18.05.2023, 17:51

So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben.

Wie kommst du darauf?

Matheeee01379

Beitragsersteller

18.05.2023, 20:47

Weil die Datenmenge vom linken whisker bis zum Quartil jeweiks 25% der Datenmenge ausmachen. Ein Boxplot besteht aus jeweils 4 Teilen, wobei jeder einzelne 25% entspricht!

1 Antwort

Vom Beitragsersteller als hilfreich ausgezeichnet

Halbrecht

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Statistik, Wahrscheinlichkeit, Mathematik

18.05.2023, 16:00

Antwort ist recht einfach : je weniger Daten da sind ( je kleiner das n ) , desto ungenauer sind die Quartile .

Man kann eben nicht erwarten, dass die Grenzen von 25 , 50 , 75 genau eingehalten werden.

Das ist aber normal

Matheeee01379

Beitragsersteller

18.05.2023, 16:03

Also würde die Darstellung als Boxplot nur wirklich Sinn ergeben, wenn viele Daten gegeben wären. Und um so mehr Daten, desto genauer die statistischen Kennzahlen?

Halbrecht

18.05.2023, 17:43

@Matheeee01379

Ja klar . Sinn ergibt das auch so , wenn man zum Beispiel mehrere SchulKlassen mit Boxplots vergleicht

Wenn man es genauer haben will , dann liest man eben die Verteilung .

Hier liegt mit n = 20 schon ein durch 4 teilbares n vor . Eigentlich Ideal .

Aber es gibt eben nach 5 Daten keinen Sprung von 1 auf 2

Halbrecht

18.05.2023, 17:49

@Matheeee01379

Vielleicht noch mal die Definition von Quartilen beachten : Es heißt nicht das unter Q1 GENAU die ersten 25% liegen . Sondern es liegen 25% der Daten darunter .