Interquartilsabstand: Interpretation mit doppelten Werten im Datensatz?

1 Antwort

Also ich bezeichne mal X als die Zufallsvariable, dessen Verteilung durch die empirische Verteilungsfunktion der Stichprobe gegeben ist.

Dann gilt für das erste Quartil q1:

P(X<= q1) >= 0.25

P(X>=q1) >= 0.75

Und für das dritte Quartil q3:

P(X <= q3) >= 0.75

P(X >= q3) >= 0.25

Daraus folgt:

P( q1 <= X <= q3) = P(X <= q3) - P(X < q1)

= P(X <= q3) - (1-P(X >= q1))

= P(X <= q3) + P(X >= q1) -1

>= 0.75 + 0.75 - 1 = 0.5

Ebenso gilt:

P( X <= q1 oder q3 <= X)

= P( X <= q1) + P(q3 <= X)

>= 0.25 + 0.25 = 0.5

Man sieht also, dass mindestens 50% der Daten zwischen q1 und q3 (inklusive der Grenzen) liegen, und dass mindestens 50% der Daten kleiner gleich q1 oder größer gleich q3 sind.

Im allgemeinen müssen es also nicht Exakt 50% sein, was der Fall ist, wenn es Daten gibt, die gleich q1 oder q3 sind.

Woher ich das weiß:Studium / Ausbildung – Mache derzeit meinen Mathematik Master

mchammmmmmmmeer 
Beitragsersteller
 09.08.2024, 15:06

Danke, das bestätigt meine Annahme