Modelle mit kategoriellen Variablen

Sind die Dummy-Variablen angelegt, kann damit auch das Modell erstellt werden. Im nachfolgenden Beispiel wird die Variable change durch die Dummy-Kodierten Prädiktoren modelliert. Die erste Tabelle zeigt die durchschnittlichen change-Werte pro Musikzugehörigkeitsgruppe.

    pander(round(tapply(DF$change, DF$music, mean, na.rm = TRUE), 3))
Crusty Indie Kid Metaller No Musical Affiliation
-0.966 -0.964 -0.526 -0.554
    mod_dummy_1 <- lm(change ~ music, data = DF)
    AllRes      <- summary(mod_dummy_1)
    pander(anova(mod_dummy_1), digits = 3)
Analysis of Variance Table
  Df Sum Sq Mean Sq F value Pr(>F)
music 3 4.65 1.55 3.27 0.0237
Residuals 119 56.4 0.474 NA NA
    pander(summary.lm(mod_dummy_1), digits = 3)
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.554 0.0904 -6.13 1.15e-08
musiccrusty_v_NMA -0.412 0.167 -2.46 0.0152
musicindie_v_NMA -0.41 0.205 -2 0.0477
musicmetal_v_NMA 0.0284 0.16 0.177 0.86
Fitting linear model: change ~ music
Observations Residual Std. Error \(R^2\) Adjusted \(R^2\)
123 0.6882 0.07617 0.05288

Wesentliche Kennzahlen des Ergebnisses:

  • \(R^2 = 0.076\): d.h., dass \(7.6\%\) der Variabilität in der Änderung der Hygenewerte zwischen ersten und dritten Tag (change) durch die Zugehörigkeit zu einer Musikgruppe erklärt werden.
  • \(F(3, 119) = 3.27; p = .053\) gibt an, dass die \(7.6\%\) Varianzaufklärung statistisch signifikant ist. Das Modell ist also signifikant besser als kein Modell zu verwenden.
  • musiccrusty_vs_NMA: Differenz zwischen der NMA und crusty Gruppe. Betrachtet man die Differenz der Mittelwerte (siehe obige Tabelle) zwischen \(crusty - NMA = -.966 - (-0.554) = -0.412\), stellt man fest, dass diese Differenz dem Estimate, also dem \(b\)-Koeffizienten entspricht. Offenbar ist die Änderung der Hygienewerte bei crusty höher als bei der NMA \(\rightarrow\) crusties sind größere Schweindln wie die NMA Leute. Die \(b\)-Werte geben also die relative Änderung zur Baselinegruppe an!
  • \(t = -2.46, p = .015\): tested ob die Differenz signifikant unterschiedlich zu einer Null-Differenz (kein Unterschied) in den Hygienebedingungen ist. Im vorliegenden Fall handelt es sich um eine signifikante Abnahme der Hygienewerte, wenn man von NMA auf crusty wechselt.

Die restlichen Koeffizienten sind in gleicher Weise zu interpretieren.

rm(list = ls()) graphics.off() if (!require("pacman")) install.packages("pacman") pacman::p_load(pander, mediation, SciViews) # install.packages("sjPlot") # install.packages("yaml", dependencies = TRUE) # install.packages("sjPlot", dependencies = TRUE) # install.packages("sjmisc", dependencies = TRUE) # install.packages("stringi", dependencies = TRUE) # install.packages("httpuv", dependencies = TRUE) # require(yaml) # require(sjPlot) # require(sjmisc) # options(digits=3) # Verzeichnise InitialisierenCPS85