Regression mit Interaktionsterm (SPSS)?
Hallo ihr lieben, ich hätte kurz eine Frage. Ich möchte gerne eine Regressionsanalyse mit Interaktionsterm durchführen. Dafür sind allerdings einige Voraussetzungen vorgegeben, die bei mir für ein wenig Verwirrung sorgen. Die beiden Voraussetzungen, dass die Variablen metrisch skaliert und normalverteilt sein müssen, lasse ich mal kurz vorweg (ist schon gegeben). Jetzt komme ich zu der Voraussetzung das eine lineare Beziehung zwischen den Variablen (keine Multikorrelarität) gegeben sein darf. Ich habe die unabhängige Variable (Belastung) und die abhängige Variable (Drogenkonsum) schon überprüft und es kam keine signifikante Korrelation raus. Im nächsten Schritt allerdings wollte ich herausfinden ob Impulsivität den Zusammenhang zwischen Belastung und Drogenkonsum moderiert. Hier kommen wir zu meiner Frage. Ergibt die Regressionsanalyse mit Interaktionsterm überhaupt noch Sinn wenn weder Belastung und Drogenkonsum miteinander korrelieren/einen linearen Zusammenhang haben noch Impulsivität mit Drogenkonsum? Wie gehe ich dann im nächsten Schritt vor? Sage ich, dass die Rechnung dadurch nicht durchgeführt werden kann und die Hypothese sich nicht bestätigt oder müssen andere Schritte eingeleitet werden?
Vielen Dank im Voraus :)
.
1 Antwort
Deine Stichprobe scheint ziemlich klein zu sein. In dem Fall wäre "nicht signifikant" nicht sonderlich informativ. Kann an viel zu geringer statistischer power liegen, die für falsch-negative Ergebnisse sorgt, oder daran, dass tatsächlich keine Zusammenhänge existieren. Man weiß es dann halt nicht.
Rechne doch einfach Deine geplante Moderationsanalyse und interpretiere die Koeffizienten. "signifikante" bivariate Korrelationen zwischen den Prädiktoren und der abhängigen Variable sind keine Voraussetzung. Der Moderator sollte am besten weder mit der anderen UV noch mi der AV korreliert sein, und der Effekt der eigentlich interessierenden Variable kann eben gerade durch einen nicht berücksichtigten Moderatoreffekt verschleiert sein, siehe vereinfachtes Beispiel hier: https://www.mdpi.com/sustainability/sustainability-10-04078/article_deploy/html/images/sustainability-10-04078-g004.png
(der Mittelwert der AV ist in der GESAMTEN Low TQM-Bedingung genauso hoch wie in der GESAMEN High TQM Bedingung, also scheinbar kein Effekt von TQM; erst durch die Hinzunahme von CP als Moderator sieht man, was eigentlich los ist).
Allerdings weiß ich nicht, was mit "nichtlinear" gemeint ist, ob einfach eine kleine Korrelation, oder tatsächlich eine U-förmige oder J-förmige oder sonstwie nicht-lineare Beziehung.
Also wenn ich mich nicht täusche prüft man doch bevor man mit der Moderatoranalyse beginnt, den linearen Zusammenhang zwischen der abhängigen, unabhängigen und Moderatorvariable. Also bei mir ist definitiv kein linearer Zusammenhang gegeben. Zwischen der unabhängigen Variable und der abhängigen besteht nichtmal eine Korrelation, also kein Zusammenhang. Heißt das jetzt ich sollte die Analyse am besten nicht durchführen, da die Ergebnisse sowieso "verzerrt" sein werden, da ja auch keine Normalverteilung und andere Voraussetzungen gegeben sind oder soll ich Maßnahmen dagegen ergreifen? Die einzige Voraussetzung die gegeben ist, ist das keine Multikorrelinearität zwischen der unabhängigen und der Moderatorvariable gegeben sind.
Es geht nicht so sehr um Verzerrung, sondern um korrekt geschätzte Standardfehler.
Normalverteilung der Variablen ist irrelevant. Allenfalls die Residuen des Regressionsmodells sollten aus einer normalverteilten Grundgesamtheit stammen, aber auch das ist ab ca. n > 30 egal.
"Linearer Zusammenhang" heißt, der Zusammenhang sollte linear sein, nicht nicht-linear (z.B. exponenziell, J-förmig, U-förmig).
Wichtig ist Homoskedaszität.
Dass eine bivariate Korrelationen zwischen der UV und der AV keine Voraussetzung ist, habe ich bereits geschildert und mit einem Beispiel illustriert.
Wenn Deine Fakultät oder Betreuer andere Vorgaben machen, dann sei es eben so. Ich kann Dir lediglich mitteilen, was eigentlich Sache ist.
Ich habe ein Bild hinzugefügt, dort sind die Variablen (Abhängige, unabhängige, Moderator) enthalten. Also ich habe die Loess Funktion zur Erstellung der Gerade benutzt, falls dies richtig war. Und das was man im Bild sieht kam dabei raus.
Ich muss gestehen, mir erschließen sich weder Sinn noch Zweck. Die gestellten Fragen habe ich nach bestem Wissen beantwortet, daher mach ich an dieser Stelle mal Schluss.
Also meine Stichprobe hat einen Umfang von 100 Leuten. Zwischen den Variablen ist aufjedenfall kein linearer Zusammenhang gegeben. Nichtmal korrelieren tun die unabhängigen mit der abhängigen variable.