Statistik Rundungsproblem bei Schnittmengen. Wie mache ich eine realistische Schätzung?
Wir haben 1000 Kinder mit verschiedenfarbiger Kleidung (Hemd, Hose, Hut).
Wir haben diese nun durchgezählt und für jedes Kleidungsstück einzeln erfasst, wie viele Kinder dieses Kleidungsstück in einer bestimmten Farbe haben. (siehe links)
Nun müssen wir die beste Annahme darüber treffen, welche Kleidungskombinationen getragen werden. Dabei gehen wir davon aus, dass die Farben der Kleidungsstücke statistisch völlig unabhängig voneinander sind.
Es gibt jedoch zwei Anforderungen:
- Die Gesamtzahl der Kinder in unserer Schätzung muss genau 1000 betragen.
- Für jede Kleidungsart muss die Gesamtzahl ebenfalls stimmen. (Zum Beispiel: Da wir wissen, dass es 50 Kinder mit gelben Hosen gibt, dürfen wir nicht 53 schätzen).
Normales Runden funktioniert nicht. Im Screenshot sieht man, dass wir damit beides falsch schätzen würden (am Beispiel gelbe Hosen)
Welcher Algorithmus ist hier der richtige?
Wie bekomme ich eine Schätzung, bei der die Chance ist, exakt richtig zu liegen, mehr als 0% ist?
