Warum ist in der Statistik besser, wenn man eine niedrige Anzahl von Variablen (zu schätzende Parameter) hat im Verhältnis zu den Daten?

3 Antworten

Weil sonst die Gefahr zu hoch ist, dass es zum Overfitting kommt. Das bedeutet, dass die Variablen zwar sehr gut zum Datensatz passt, jedoch kann es dann passieren, dass wenn neue Daten generiert werden, dass dann die Variablen überhaupt nicht passen.

Außerdem ist der Rechenaufwand mit weniger Variablen geringer.

Woher ich das weiß:Studium / Ausbildung – Mache derzeit meinen Mathematik Master

Weil mehr Unbekannte sich gegenseitig „auffaktorisieren“. Beispiel: Jeder Parameter hat eine Ungenauigkeit von 15% (weil geschätzt)

Bei einem Parameter ist dann dein Ergebnis ebenfalls 15% ungenau. Bei 3 Parametern erhöht sich diese Ungenauigkeit um 1,15 hoch 3, also 1,15*1,15*1,15= 1,52.

Hier hättest du also schon eine mögliche Abweichung von über 50%

Woher ich das weiß:Studium / Ausbildung – Maschinenbauingenieur

Warum ist es besser, wenn man weniger Dinge hat, die unbekannt sind?


BOARD653 
Beitragsersteller
 01.02.2023, 10:16

Weiß ich nicht, darum frage ich

0