Regressionsgerade, was ist da der Unterschied?

Oben und unten ist die Varianz 0, weshalb die Werte alle auf einer Geraden liegen. Wo ist dann der Unterschied. Wenn beide auf einer Geraden liegen, liegen sie nicht dann automatisch auch auf der Regressionsgeraden, weil die Regressionsgerade die näheste gerade zu den Messpunkten ist? Aber was ist dann der Unterschied zwischen oben und unten? Was bedeutet das, dass einmal m und b da sind, und einmal m0 und b0. m0 und b 0 ergeben die Regressionsgerade, oder? Was ergeben dann das normale m und b, also welche Gerade?

Oder hat das mit dem Korrelationskoeffizient zu tun? Anscheinend ist er nur im unteren Beispiel +-1, aber wenn die Werte oben auch auf einer Gerade liegen, ist das nicht dasselbe?

Bild zum Beitrag

25.11.2023, 15:20

...MOOMENT, habe ich was übersehen? Heißt das, beim oberen ist S^2 immer 0, und beim unteren ist nur die Minimalstelle davon 0? Aber Ist die Minimalstelle nicht der Mittelwert? Und was hat das damit zu tun, ob es linear ist?

25.11.2023, 15:35

Was weiß ich, ic versteh gar nichts mehr

1 Antwort

Slevi89

25.11.2023, 17:14

Ich glaube du bringst hier sehr viel durcheinander und solltest dir erstmal die Grundlagen dazu durchlesen.

Mit Varianz hat die Rechnung oben nichts zu tun.

Die Idee ist einer Regressionsgeraden ist, eine Gerade durch Messpunkte zu legen. Du approximierst also eine bekannte Funktion (Gerade) über die Messpunkte.

Eine Gerade ist definiert als

So eine gerade gilt es nun zu finden.

Die Messwerte werden aber in der Regel auch mit x und y angegeben,

Deshalb geben wir die gesuchte Gerade mal mit anderen Variablen an, z.B.

Für die Regressionsgerade sind die beiden Alphas so zu finden, dass der Abstand zwischen der Gerade und den tatsächlichen Messpunkten (y) minimal wird.

Der Abstand ist entsprechend definiert als Messung (y) - den Messwert der Geraden (f(x)) Der Abstand wird in der Regel mit r für Residuum bezeichnet. Natürlich geht es auch andersherum.

das ganze geht bis zur n-ten Messung.

Um diese Residuen zu minieren muss man 2 Dinge tun. Zum einen müssen wir die Residuen quadrieren, damit der Abstand (also das Residuum immer positiv bleibt. Denn je nachdem ob ein Messwert y über oder unter der Geraden ist, kann das r positiv oder negativ sein). Zum anderen suchen wir ein Minimum, daher bietet sich die Ableitung an.

Quadrieren liefert

Du musst einmal nach Alpha 1 und Alpha 0 ableiten um beide Parameter zu finden und nicht vergessen das das für alle Residuen gilt also bis das heißt die Summenformel wird auch vorkommen.

Wenn du das alles einmal durchrechnest, kommst du auf den Rest auf deinem Arbeitsblatt