Boxplots?
Ich habe eine Frage über den Boxplots. Und zwar sagt man ja, dass der Boxpott aus vier Abschnitte besteht, die jeweils 25% der Daten ausmachen. So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben. Aber wenn ich 25% ausrechne von den insgesamt 20 Schülern dann stimmt das nicht so ganz mit den Daten, die der Boxplot darstellt überein. Woran liegt das?
![](https://images.gutefrage.net/media/default/user/8_nmmslarge.png?v=1551279448000)
So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben.
Wie kommst du darauf?
![](https://images.gutefrage.net/media/default/user/15_nmmslarge.png?v=1551279448000)
Weil die Datenmenge vom linken whisker bis zum Quartil jeweiks 25% der Datenmenge ausmachen. Ein Boxplot besteht aus jeweils 4 Teilen, wobei jeder einzelne 25% entspricht!
1 Antwort
![](https://images.gutefrage.net/media/user/Halbrecht/1525443667546_nmmslarge__243_35_423_423_0f63963408c8ccb1dad80c34585c3099.jpg?v=1525443670000)
Antwort ist recht einfach : je weniger Daten da sind ( je kleiner das n ) , desto ungenauer sind die Quartile .
Man kann eben nicht erwarten, dass die Grenzen von 25 , 50 , 75 genau eingehalten werden.
Das ist aber normal
![](https://images.gutefrage.net/media/user/Halbrecht/1525443667546_nmmslarge__243_35_423_423_0f63963408c8ccb1dad80c34585c3099.jpg?v=1525443670000)
Ja klar . Sinn ergibt das auch so , wenn man zum Beispiel mehrere SchulKlassen mit Boxplots vergleicht
Wenn man es genauer haben will , dann liest man eben die Verteilung .
Hier liegt mit n = 20 schon ein durch 4 teilbares n vor . Eigentlich Ideal .
Aber es gibt eben nach 5 Daten keinen Sprung von 1 auf 2
![](https://images.gutefrage.net/media/user/Halbrecht/1525443667546_nmmslarge__243_35_423_423_0f63963408c8ccb1dad80c34585c3099.jpg?v=1525443670000)
Vielleicht noch mal die Definition von Quartilen beachten : Es heißt nicht das unter Q1 GENAU die ersten 25% liegen . Sondern es liegen 25% der Daten darunter .
Also würde die Darstellung als Boxplot nur wirklich Sinn ergeben, wenn viele Daten gegeben wären. Und um so mehr Daten, desto genauer die statistischen Kennzahlen?