Wie generiert man Zufallswerte aus einem Mittelwert?
Hallo zusammen,
Mein Anliegen ist wie folgt: ich möchte alte Datensätze vervollständigen habe jedoch nur noch die Mittelwerte, die damals aus vier einzelnen Werten errechnet wurden sind. Beispiel der Mittelwert 11.5 und ich suche ein Programm, Formel oder ähnliches der mir vier Zufallszahlen generiert die zusammen den Mittelwert ergeben. Die zahlen sollen aber unterschiedlich sein also nicht einfach 11.5/4 rechnen.
Kennt jemand eine Formel oder Angehensweise um dieses Problem zu lösen?
Vielen Dank!
4 Antworten
Bei 11,5/4 würden die Zahlen auch keine geeigneten Werte für den Mittelwert abgeben, sondern Summanden (nur, damit hier keine Missverständnisse entstehen).
Gibt es irgendwelche Beschränkungen bezgl. der Werte? Dürfen sie den Mittelwert z.B. nur um max. soundsoviel % unter- oder überschreiten? Kommen auch negative Zahlen in Frage? Wie genau sollen die Zahlen sein (Nachkommastellen)? Darf es einzelne Ausreißer geben?
Angenommen, der geforderte Mittelwert (11,5) steht in A1. Die 4 Einzelwerte sollen in A2:A5.
Dann lautet mein Formelvorschlag für A2:A4:
=A$1-A$1/4+ZUFALLSZAHL()*A$1/4*2
Das gibt 3 zufällige Werte in einem Bereich von ± 1/4 des Mittelwerts. Den letzten Wert in A5 erhälst du dann mit:
=A$1*4-SUMME(A2:A4)
Geeignete Verteilung auswählen, am allgemeinsten brauchbar eine Normalverteilung.
Gleichverteilte Zufallszahlen aus [0,1), darauf die Umkehrung der Verteilungsfunktion (also die Quantilsfunktion) anwenden
Entweder verschieben oder letzten Wert so berechnen, dass der Mittelwert stimmt
eine Zeile R code:
> rnorm(4, mean = 11.5)
[1] 10.58098 11.76957 11.61008 10.60039
Diese 4 Werte ergeben allerdings nur einen Mittelwert von 11,140255
Der Ansatz ist dennoch gut. So könnte man auf diese Weise n-1 Werte erzeugen, vllt mit einer etwas größeren Bandbreite, und den n-ten Wert so auffüllen, dass sie zusammen den gewünschten Mittelwert ergeben.
Ich halte das nicht für ein ehrenhaftes Ziel. Wozu soĺl das gut sein?
Ehrenhaft? Das ist weder für Studium, Schule oder dergleichen. Damit bin ich durch. Ich habe eine alte Studie von mir, die sich gerne ein paar Leute ausleihen möchten weil es thematisch passt. Aber ich möchte vollständige Werte haben da mir aus ca. 60 Datensätze genau 2 fehlen aus denen die Ursprungswerte hinausgehen. Wenn da was fehlt können sie die Daten nicht nachvollziehen bzw. wissen nicht wo sie herkommen. Es ist halt eher auch ne Art kosmetische Ergänzung damit es komplett ist. An der Aussage ändert sich nichts da die Mittelwerr korrekt berechnet worden sind.
Maximal 2 Nachkommastellen, nur positive Werte, ansonsten Ausreißer erlaubt und keine Max/Min Werte da es um die Blickdauer in Sekunden gilt.