Berechnung von Quartilen?
Liebe GuteFrage-Community,
Wie berechnet man bei einer geraden und ungeraden Anzahl von Rangplätzen das unterste und oberste Quartil?
Bin mir bei ungeraden Zahlen ja unsicher.
Muss ich dann für das untere Quartil einfach z.B. 15 durch 4 und für das obere Quartil 15 mal 0,75 bzw 3/4?
Habe gesehen, dass man bei ungeraden Zahlen einfach plus 1 rechnen soll und dann die einfach die Chose mit durch 4 und mal 0,75 bzw 3/4.
Und bei geraden Zahlen, wie sieht es da aus? Würde gerne die Unterschiede bei der Quartilberechnung zwischen geraden und ungeraden Zahlen sehen.
Wäre nett, wenn mir jemand bei der Beantwortung dieser Frage helfen würde.
LG
1 Antwort
Wikipedia sagt, man nimmt immer den kleineren der Werte ( https://de.wikipedia.org/wiki/Empirisches_Quantil#Definition ). Etliche Autoren halten das aber nicht für angemessen, da man bei z. B. -X statt X als Variable dann überraschenderweise im allgemeinen andere Werte als die negativen für die (1-a)-Quantile erhält (z. B. beim Vertauschen von oberem und unterem Quartil bzw. für den Median).
Z. B. würde man nach dieser Definition bei
{1, 2, 4, 8}
als Median den Wert 2 erhalten, bei
{-1, -2, -4, -8}
aber den Wert -4 als Median erhalten statt -2.
-----
Die allgemeinste Definition sagt, dass jeder Wert zwischen X(Floor((n-1) * p)) und X(Ceiling((n-1) * p)) ein p-Quantil ist.
Ich verwende hier wie in manchen Programmiersprachen üblich "Floor" ("Fußboden") für die Gaußklammer, die jeder reellen Zahl die größte ganze Zahl zuordnet, die kleiner oder gleich dieser Zahl ist, also 3,0 --> 3; 3,1 --> 3; 3,5 --> 3; 3,9 --> 3; 4,0 --> 4) und "Ceiling" ("Decke") für die Funktion, die die kleinste ganze Zahl zuordnet, die größer oder gleich der gegebenen Zahl ist, also 3,0 --> 3; 3,1 --> 4; 3,5 --> 4; 3,9 --> 4; 4,0 --> 4.
Außerdem beginne ich mit den Indizes -- wieder wie in der Programmierung üblich -- mit 0.
-----
Andere Definitionen interpolieren, insbesondere linear.
-----
Am besten bringe ich mal ein paar Beispiele.
Ich verwende hier Zweierpotenzen als Werte, damit man deutlicher sieht, wie interpoliert wird als bei linear ansteigenden Werten.
1.: {1, 2, 4, 8, 16}
Hier sind die Quartile eindeutig -- es sind 5 Werte und damit 4 Schritte dazwischen. Ein Quartil entspricht also genau einer Schrittweite von (5-1)/4 = 1 (Indexdifferenz).
1 2 4 8 16 (Werte)
^ ^ ^ ^ ^
0 1 2 3 4 (Indizes = Quartilsschritte)
Hier ist 2 das untere Quartil, 4 der Median und 8 das obere Quartil.
2.: {1, 2, 4, 8, 16, 32}
1 2 4 8 16 32 (Werte)
^ ^ ^ ^ ^ ^
0 1 2 3 4 5 (Indizes)
^ ^ ^ ^ ^
0 1,25 2,5 3,75 5 (Quartilsschritte)
Hier sind unteres Quartil, Median und oberes Quartil
nach der ersten Definition 2, 4 bzw. 8
nach der zweiten Definition
- jeder Wert zwischen 2 und 4
- jeder Wert zwischen 4 und 8
- jeder Wert zwischen 8 und 16
bei linearer Interpolation
- (1-0,25) * 2 + 0,25 * 4 = 2,5
- (1-0,5) * 4 + 0,5 * 8 = 6
- (1-0,75) * 8 + 0,75 * 16 = 14
3.: {1, 2, 4, 8, 16, 32, 64}
1 2 4 8 16 32 64 (Werte)
^ ^ ^ ^ ^ ^ ^
0 1 2 3 4 5 6 (Indizes)
^ ^ ^ ^ ^
0 1,5 3 4,5 6 (Quartilsschritte)
die Quartilswerte sind
erste Def.:
- 2
- 8
- 16
zweite Def.:
- jeder Wert zwischen 2 und 4
- 8 (wieder eindeutig)
- jeder Wert zwischen 16 und 32
linear interpoliert:
- (1-0,5) * 2 + 0,5 * 4 = 3
- 8
- (1-0,5) * 16 + 0,5 * 32 = 24
4.: {1, 2, 4, 8, 16, 32, 64, 128}
1 2 4 8 16 32 64 128 (Werte)
^ ^ ^ ^ ^ ^ ^ ^
0 1 2 3 4 5 6 7 (Indizes)
^ ^ ^ ^ ^
0 1,75 3,5 5,25 7 (Quartilsschritte)
erste Def.:
- 2
- 8
- 32
zweite Def.:
- jeder Wert zwischen 2 und 4
- jeder Wert zwischen 8 und 16
- jeder Wert zwischen 32 und 64
linear interpoliert:
- (1-0,75) * 2 + 0,75 * 4 = 3,5
- (1-0,5) * 8 + 0,5 * 16 = 12
- (1-0,25) * 32 + 0,25 * 64 = 40
5.: {1, 2, 4, 8, 16, 32, 64, 128, 256}
1 2 4 8 16 32 64 128 256 (Werte)
^ ^ ^ ^ ^ ^ ^ ^ ^
0 1 2 3 4 5 6 7 8 (Indizes)
^ ^ ^ ^ ^
0 2 4 6 8 (Quartilsschritte)
Hier sind die Quartilswerte wieder eindeutig:
4, 16, 64
Dieses Schema wiederholt sich nach dem 4er-Rest der Anzahl der Werte.