Modelle mit kategoriellen Variablen
Sind die Dummy-Variablen angelegt, kann damit auch das Modell erstellt werden. Im nachfolgenden Beispiel wird die Variable change durch die Dummy-Kodierten Prädiktoren modelliert. Die erste Tabelle zeigt die durchschnittlichen change-Werte pro Musikzugehörigkeitsgruppe.
pander(round(tapply(DF$change, DF$music, mean, na.rm = TRUE), 3))
-0.966 |
-0.964 |
-0.526 |
-0.554 |
mod_dummy_1 <- lm(change ~ music, data = DF)
AllRes <- summary(mod_dummy_1)
pander(anova(mod_dummy_1), digits = 3)
Analysis of Variance Table
music |
3 |
4.65 |
1.55 |
3.27 |
0.0237 |
Residuals |
119 |
56.4 |
0.474 |
NA |
NA |
pander(summary.lm(mod_dummy_1), digits = 3)
(Intercept) |
-0.554 |
0.0904 |
-6.13 |
1.15e-08 |
musiccrusty_v_NMA |
-0.412 |
0.167 |
-2.46 |
0.0152 |
musicindie_v_NMA |
-0.41 |
0.205 |
-2 |
0.0477 |
musicmetal_v_NMA |
0.0284 |
0.16 |
0.177 |
0.86 |
Fitting linear model: change ~ music
123 |
0.6882 |
0.07617 |
0.05288 |
Wesentliche Kennzahlen des Ergebnisses:
- \(R^2 = 0.076\): d.h., dass \(7.6\%\) der Variabilität in der Änderung der Hygenewerte zwischen ersten und dritten Tag (change) durch die Zugehörigkeit zu einer Musikgruppe erklärt werden.
- \(F(3, 119) = 3.27; p = .053\) gibt an, dass die \(7.6\%\) Varianzaufklärung statistisch signifikant ist. Das Modell ist also signifikant besser als kein Modell zu verwenden.
- musiccrusty_vs_NMA: Differenz zwischen der NMA und crusty Gruppe. Betrachtet man die Differenz der Mittelwerte (siehe obige Tabelle) zwischen \(crusty - NMA = -.966 - (-0.554) = -0.412\), stellt man fest, dass diese Differenz dem Estimate, also dem \(b\)-Koeffizienten entspricht. Offenbar ist die Änderung der Hygienewerte bei crusty höher als bei der NMA \(\rightarrow\) crusties sind größere Schweindln wie die NMA Leute. Die \(b\)-Werte geben also die relative Änderung zur Baselinegruppe an!
- \(t = -2.46, p = .015\): tested ob die Differenz signifikant unterschiedlich zu einer Null-Differenz (kein Unterschied) in den Hygienebedingungen ist. Im vorliegenden Fall handelt es sich um eine signifikante Abnahme der Hygienewerte, wenn man von NMA auf crusty wechselt.
Die restlichen Koeffizienten sind in gleicher Weise zu interpretieren.