Exponentialfunktion modellieren über mehrere Punkte?
Moin,
anlässlich der momentanen Pandemie wollte ich gerne eine e-Funktion modellieren. Mit 2 Punkten ist diese ja einfach definierbar und alle verwendeten Datensätze (ein Datensatz: day x und number of cases on day x) liegen auf der Funktion. Um eine Funktion variabel für andere Orte/Länder zu modellieren, habe ich eine Exceltabelle angelegt, ein Bild für Deutschlands Zahlen liegt bei.
Nun habe ich folgendes Problem: Die verwendeten Datensätze benutze ich um für jeden Datensatz eine variable k zu berechnen (in der Tabelle jeweils k1, k2, k3, k4). Benutze ich zum modellieren nur zwei Datensätze, dann bekomme ich nur ein k. Zwangsläufig liegen beide Datensätze dann auf der Funktion.
Um die Funktion genauer zu machen, wollte ich mehr als zwei Datensätze benutzen. So habe ich statt 2 Datensätzen fünf genommen. Aber dadurch wird halt keiner der echten Datensätze in der Funktion sein, heißt konkret im Beispiel (siehe Anhang):
- data set 5: Tag 7 mit 16k Fällen (echte Fälle)
- f(x=7) = 21k Fälle (Tag 7, berechnet)
Gleiches gilt für den Einsatz der anderen in den data sets verwendeten Tagen.
Jetzt meine Frage: Wie kann man k1, k2, k3, k4 gewichten, um ein möglichst akkurates k zu bekommen?
Denn wenn man einfach den Mittelwert bildet, kommt das k raus, was auch im Anhang für die Berechnung verwendet wird. Ich habe jetzt einfach ins Blaue mal so gewichtet: k_alternativ = (k1+ 1,02k2 +1,04k3 +1,06k4). Aber das ist sehr zufällig gewählt und damit ist k_alt sogar noch höher als k und die berechneten Fälle für Tag 7 wären noch höher.
Hat jemand einen Tipp, wie man es gewichten könnte? Ich würde logischerweise die letzteren k's mehr gewichten als die früheren, was meint ihr? Oder ist das ganze Vorhaben gar nicht umsetzbar?
Danke für die Zeit, Ideen und Antworten!
Bleibt gesund und zuhause, damit meine e-Funktion nicht der Zukunft entsprechen wird :D
3 Antworten
hmm, warum benutzt Du nicht die Trendlinienfunktion?
Der Fachbegriff ist eine Regressionsanalyse, die die Fehlerquadrate minimiert. Die Funktionen dazu sind aber recht kompliziert, weshalb man sich nur einmal damit beschäftigt und dann die AutoFunktion verwendet.
Ich hab mir sowas auch gebastelt. Aber nur am Tablet, wo die Funktionen eingeschränkt sind.
Man könnte einen Schritt weiter gehen und das tägliche Wachstum berechnen und darstellen lassen. Für eine Extrapolation könnte man zB einen Mittelwert der letzten 3 Tag, oder der letzten Woche verwenden (das mache ich zB).
mach doch das mit Excel,, dort kannst du mit Bezügen arbeiten!! ist das was ?
gruss
Ist Excel und ist mit Bezügen. Beantwortet die Frage nach der Gewichtung leider nicht :)
Man kann nicht alle Punkte auf einer Linie bringen , das wäre großer Zufall.
Alles hängt von deinem Modell für die Daten ab.
und e^x ist schon ein Modell.............
Mit der sogenannten Regressionsanalyse findet man ( bei gegebenen Modell ) die beste Fkt. Aber es kann sein, dass ein anderes Modell ( z.b ein Lineares oder ein logistisches ua. ) noch eine bessere Anpassung bringt.
Dafür gibt es einen Rechner im Netz. Den habe ich gebookmarked aber meine Bookmarks sind so viele und so durcheinander : Schade !
Probier mal das mit deinen Daten
https://www.wolframalpha.com/input/?i=exponential+fit+0.783%2C0.552%2C0.383%2C0.245%2C0.165%2C0.097
und hier
https://www.wolframalpha.com/input/?i=regression%20analysis
siehst du ein paar Alternativen..............
...............
du musst auch bedenken, dass man pro Land gute Anpassungen erzielen kann , aber mit mehreren aggregierten Ländern schlechte.
Außerdem muss dein Modell eine Ende haben , weil die Anzahl der Infizierten ja nicht über 7 Mrd steigen kann ! .)) Daher wird ein logistisches Modell eher passen
https://www.ecosia.org/images?q=Logistische+Regression
residuen sind die abstände zwischen Datum und dem Punkt auf der Funktion .
Das problem ist halt, dass die Wachstumsrate nicht konstant ist und der Verlauf nicht mal einer idealen Sättigungskurve folgt. Man kann mMn letztlich immer nur an den aktuellen Wert anpassen und zB wie sich die Wachstumsrate ändert.
Hi, danke für die Antwort. Die Option habe ich auch schon probiert, mit Excels Trendlinienfunktion gibt es f(x)= 2099*e^(0,3916*x) raus. Für Tag 7 weicht der Wert dann noch weiter ab:
Echt: 16k Fälle
k1-4: 21k Fälle
Trend (excel): 32k Fälle