Weiß jemand, wo der Unterschied zwischen Störgröße und Residuum bei der Regression ist?

2 Antworten

Störgrößen sind Faktoren, die deine Regressionsgleichung oder einzelne Variablen dieser ungewollt beeinflussen können. Diese sollten möglichst minimal gehalten bzw. am besten natürlich ausgeschlossen werden.

Residuen beschreiben den Anteil der Variabilität eines Modells. Hier etwas ausführlicher erklärt: http://www.statistics4u.info/fundstat_germ/cc_residuals.html


EmilKoch  05.06.2015, 15:20

Ich sehe gerade, dass ich die Frage damit nicht ganz eindeutig beantwortet habe... Die Störgröße ist die Differenz (Residuum) zwischen einer Regressionsgeraden und den Messwerten! Es sind in diesem Zusammenhang, in der Statistik, also quasi Synonyme.

1

Störgrößen sind, ich muss die Antwort von EmilKoch ein wenig abändern, eigentlich genau solche Größen wie die zu untersuchenden Einflussgrößen, nur dass sie nicht das Ziel der Untersuchung sind. Vielleicht ist ein Beispiel der Einfluss des IQ auf das Jahreseinkommen, da könnten Geschlecht oder Migrationshintergrund weitere, eher störende Einfussgrößen sein. Berücksichtigt man solche Faktoren nicht im Regressionsmodell, dann werden die Reste, die y-Abstände der einzelnen Datenpunkte von der Regressionsgeraden, zu groß. Diese Reste sind genau die Residuen. Je mehr wirksame Einflussgrößen in das Modell eingehen, desto kleiner werden die Residuen, desto größer ist der Anteil der Modell-Varianz an der Gesamtvarianz (oft mit R² bezeichnet), und entsprechend desto kleiner der Anteil der Residualvarianz (1-R²). Je näher R² an 1 herankommt, desto besser erklärt das Model mit den gewählten Einflussfaktoren die Daten.