Berechnung von Quartilen?

1 Antwort

Wikipedia sagt, man nimmt immer den kleineren der Werte ( https://de.wikipedia.org/wiki/Empirisches_Quantil#Definition ). Etliche Autoren halten das aber nicht für angemessen, da man bei z. B. -X statt X als Variable dann überraschenderweise im allgemeinen andere Werte als die negativen für die (1-a)-Quantile erhält (z. B. beim Vertauschen von oberem und unterem Quartil bzw. für den Median).

Z. B. würde man nach dieser Definition bei

{1, 2, 4, 8}

als Median den Wert 2 erhalten, bei

{-1, -2, -4, -8}

aber den Wert -4 als Median erhalten statt -2.

-----

Die allgemeinste Definition sagt, dass jeder Wert zwischen X(Floor((n-1) * p)) und X(Ceiling((n-1) * p)) ein p-Quantil ist.

Ich verwende hier wie in manchen Programmiersprachen üblich "Floor" ("Fußboden") für die Gaußklammer, die jeder reellen Zahl die größte ganze Zahl zuordnet, die kleiner oder gleich dieser Zahl ist, also 3,0 --> 3; 3,1 --> 3; 3,5 --> 3; 3,9 --> 3; 4,0 --> 4) und "Ceiling" ("Decke") für die Funktion, die die kleinste ganze Zahl zuordnet, die größer oder gleich der gegebenen Zahl ist, also 3,0 --> 3; 3,1 --> 4; 3,5 --> 4; 3,9 --> 4; 4,0 --> 4.

Außerdem beginne ich mit den Indizes -- wieder wie in der Programmierung üblich -- mit 0.

-----

Andere Definitionen interpolieren, insbesondere linear.

-----

Am besten bringe ich mal ein paar Beispiele.

Ich verwende hier Zweierpotenzen als Werte, damit man deutlicher sieht, wie interpoliert wird als bei linear ansteigenden Werten.

1.: {1, 2, 4, 8, 16}

Hier sind die Quartile eindeutig -- es sind 5 Werte und damit 4 Schritte dazwischen. Ein Quartil entspricht also genau einer Schrittweite von (5-1)/4 = 1 (Indexdifferenz).

  1   2   4   8  16   (Werte)
  ^   ^   ^   ^   ^
  0   1   2   3   4   (Indizes = Quartilsschritte)

Hier ist 2 das untere Quartil, 4 der Median und 8 das obere Quartil.

2.: {1, 2, 4, 8, 16, 32}

  1   2   4   8  16  32   (Werte)
  ^   ^   ^   ^   ^   ^
  0   1   2   3   4   5   (Indizes)
  ^    ^    ^    ^    ^
  0   1,25 2,5  3,75  5   (Quartilsschritte)

Hier sind unteres Quartil, Median und oberes Quartil

nach der ersten Definition 2, 4 bzw. 8

nach der zweiten Definition

  • jeder Wert zwischen 2 und 4
  • jeder Wert zwischen 4 und 8
  • jeder Wert zwischen 8 und 16

bei linearer Interpolation

  • (1-0,25) * 2 + 0,25 * 4 = 2,5
  • (1-0,5) * 4 + 0,5 * 8 = 6
  • (1-0,75) * 8 + 0,75 * 16 = 14

3.: {1, 2, 4, 8, 16, 32, 64}

  1   2   4   8  16  32  64   (Werte)
  ^   ^   ^   ^   ^   ^   ^
  0   1   2   3   4   5   6   (Indizes)
  ^     ^     ^     ^     ^
  0   1,5     3    4,5    6   (Quartilsschritte)

die Quartilswerte sind

erste Def.:

  • 2
  • 8
  • 16

zweite Def.:

  • jeder Wert zwischen 2 und 4
  • 8 (wieder eindeutig)
  • jeder Wert zwischen 16 und 32

linear interpoliert:

  • (1-0,5) * 2 + 0,5 * 4 = 3
  • 8
  • (1-0,5) * 16 + 0,5 * 32 = 24

4.: {1, 2, 4, 8, 16, 32, 64, 128}

  1   2   4   8  16  32  64  128   (Werte)
  ^   ^   ^   ^   ^   ^   ^   ^
  0   1   2   3   4   5   6   7    (Indizes)
  ^      ^      ^      ^      ^
  0     1,75   3,5    5,25    7    (Quartilsschritte)

erste Def.:

  • 2
  • 8
  • 32

zweite Def.:

  • jeder Wert zwischen 2 und 4
  • jeder Wert zwischen 8 und 16
  • jeder Wert zwischen 32 und 64

linear interpoliert:

  • (1-0,75) * 2 + 0,75 * 4 = 3,5
  • (1-0,5) * 8 + 0,5 * 16 = 12
  • (1-0,25) * 32 + 0,25 * 64 = 40

5.: {1, 2, 4, 8, 16, 32, 64, 128, 256}

  1   2   4   8  16  32  64  128 256   (Werte)
  ^   ^   ^   ^   ^   ^   ^   ^   ^
  0   1   2   3   4   5   6   7   8    (Indizes)
  ^       ^       ^       ^       ^
  0       2       4       6       8    (Quartilsschritte)

Hier sind die Quartilswerte wieder eindeutig:

4, 16, 64

Dieses Schema wiederholt sich nach dem 4er-Rest der Anzahl der Werte.

Woher ich das weiß:Hobby – Hobby, Studium, gebe Nachhilfe