Unterschied Suppression und Multikollinearität?

Question

Statistik: Suppression ist eine Form der Multikollinearit&auml;t.  Warum liest man oft, dass bei einer Multikollinearit&auml;t sich das Regressionsgewicht verringert, bei der Suppression jedoch erh&ouml;ht? Das klingt kontr&auml;r. 
W&auml;re es nicht besser zu sagen, dass sich das Regressionsgewicht bei Auftreten einer Multikollinearit&auml;t sich (nur) ver&auml;ndert (anstatt die Verringerung allein zu erw&auml;hnen)?

blechkuebel · Answer

Multikollinearit&auml;t = Pr&auml;diktoren korrelieren miteinander. Es gibt dann einen Varianzanteil in der abh&auml;ngigen Variable (= Kriterium), den im Prinzip MEHRERE Pr&auml;diktoren vorhersagen k&ouml;nnten. D.h. man kann diesen Varianzanteil nicht eindeutig einem Pr&auml;diktor zuordnen. 
Beispiel: Du willst die Punkte in irgendeinem Leistungstest vorhersagen durch den IQ und durch die Motivation. Jetzt stellen wir aus irgendeinem Grund fest, dass IQ und Motivation korreliert sind. Dann kann es sein, dass ein bestimmter Anteil der Unterschiede im Leistungstest sowohl durch die Motivation als auch den IQ erkl&auml;rt werden k&ouml;nnten, und du wei&szlig;t dann nicht, welcher Pr&auml;diktor von den beiden jetzt diesen Varianzanteil erkl&auml;rt. 
Die Regressionsgewichte haben mit dem Varianzanteil zu tun, der NUR durch diesen Pr&auml;diktor aufgekl&auml;rt werden kann. Das hei&szlig;t je h&ouml;her der Varianzanteil, der durch beide Pr&auml;diktoren erkl&auml;rt werden kann, umso kleiner ist der Varianzanteil, der nur durch Motivation oder nur durch den IQ erkl&auml;rt werden kann. Wenn diese eigenen Varianzanteile klein werden, sinkt das Regressionsgewicht. 
Suppression ist, wie du schon richtig sagst, ein Sonderfall der Multikollinearit&auml;t, aber die Situation ist halt ganz anders. Bei der Suppression ist die Suppressorvariable praktisch gar nicht mit der abh&auml;ngigen Variable korreliert. Es gibt also dieses Problem gar nicht, dass beide Pr&auml;diktoren denselben Varianzanteil in der abh&auml;ngigen Variable erkl&auml;ren k&ouml;nnen.Die Suppressorvariable korreliert aber mit dem anderen Pr&auml;diktor, und deswegen ist nat&uuml;rlich schon Multikollinearit&auml;t gegeben. Dadurch dass sie aber nur mit dem anderen Pr&auml;diktor, kann sie quasi Varianz in dem Pr&auml;diktor "unterdr&uuml;cken", die nichts mit dem Kriterium zu tun hat. Dadurch sieht es so aus, als w&uuml;rde der Anteil, den der andere Pr&auml;diktor mit Kriterium gemeinsam hat, gr&ouml;&szlig;er werden (relativ zu dem Varianzanteil der nicht mit dem Kriterium zusammenh&auml;ngt). Dadurch steigt das Regressionsgewicht. 
Stell Dir das so vor:Modell ohne Suppressionsvariable mit 1 Pr&auml;diktor: Pr&auml;diktor hat 30 % der Varianz mit dem Kriterium gemeinsam und 70 % Varianz f&uuml;r sich.Modell mit Suppressorvariable und dem Pr&auml;diktor (also quasi zwei Pr&auml;diktoren): Von den 100% Varianz des Pr&auml;diktors wird jetzt 20 % durch die Suppressorvariable unterdr&uuml;ckt. Dadurch verbleiben 80%. Was vorher 30 % sind, ist jetzt 30/80 = 37.5 % 
D.h. in dem neuen Modell hat der Pr&auml;diktor 37.5 % mit der abh&auml;ngigen Variable gemeinsam, und er hat 62.5% Varianz f&uuml;r sich alleine. D.h. es sieht so aus, als k&ouml;nnte der Pr&auml;diktor jetzt mehr erkl&auml;ren, und es steigt dadurch das Regressionsgewicht. 
Das kann man besser mit Kreisdiagrammen erkl&auml;ren (ich w&uuml;rde Dir empfehlen, die ein paar Videos zur Suppression auf YouTube anzuschauen). 
Varianzaufkl&auml;rung (erkl&auml;rte und nicht erkl&auml;rte Varianzanteile) ist ein wichtiges Konzept um das alles zu verstehen.

Machma2000 · Answer

Wo stammt denn die Aussage her, die stimmt doch gar nicht.

Unterschied Suppression und Multikollinearität?

2 Antworten

SPSS - Multiple Regression; Koeffizienten nicht signifikant?

Datenveränderung in Statistik, wie funktioniert das?

Kupfersalmler hat ein verändertes Maul?

Wie verändert sich Backzeit bei größerer Form?

Laptop wechselt Helligkeit bei hellen und dunklen Bildern?

Kann man folgende Gleichung zum zinseszins nach x umstellen?

Statistik Mittelwerte anders als p-Wert?

Werden meine Chancen auf ein Treffen heute durch Nachfragen erhöht oder verringert oder verändert das nichts?

Ist dieser gendergerechte Ausdruck grammatikalisch korrekt und sinnvoll: "die ertrunkenen Schwimmenden"?

Was bedeutet es hier wenn Median und arithmetisches Mittel nah beieinander liegen?

Warum "ihm" statt "ihn"?

Alpha-Korrektur bei ANOVA mit Bonferroni Post-hoc-Test?

SPSS Chi-Quadrat Verständnisfrage?

Statistik Regression SPSS?