Kategorielle Prädiktoren
Bei lineare Modellen ist häufig neben intervallskalierten Prädiktorvariablen auch die Verwendung von kategoriellen Variablen von Interesse. So lange der verwendete Prädiktor nur zwei Ausprägungen hat (z.B. männlich/weiblich, Ja/Nein, etc.), stellt dies auch kein Problem dar.
Mehrstufiger kategorieller Prädiktor
Während eines dreitägigen Musikfestivals wurde bei einer Anzahl freiwilliger TeilnehmerInnen der “Hygienezustand” gemessen (Variablen day1, day2, day3). Der Wertebereich der Messung liegt zwischen 0 und 4, mit 0 = smell like s..t, bis 4 = smell like freshly baked bread9. Darüber hinaus wurden die TeilnehmerInnen über ihre jeweilige Zuordnung zu eine bestimmten, persönlich bevorzugten Musikrichtung (music) befragt. Bei dem Fesitval gaben die TeilnehmerInnen insgesamt vier verschiedenen Musikrichtungen an: Metaller, Crusty, Indie, NMA (= No Music Affiliation). Nach Erfassung der Daten wurde die Differenz der Hygienewerte zwischen dem letzten und dem ersten Tag des Festivals berechnet und in der Variablen change gespeichert:
ticknumb | music | day1 | day2 | day3 | change | |
---|---|---|---|---|---|---|
1 | 2111 | Metaller | 2.65 | 1.35 | 1.61 | -1.04 |
2 | 2229 | Crusty | 0.97 | 1.41 | 0.29 | -0.68 |
10 | 2504 | No Musical Affiliation | 1.11 | 0.44 | 0.55 | -0.56 |
12 | 2510 | Crusty | 0.82 | 0.2 | 0.47 | -0.35 |
14 | 2515 | No Musical Affiliation | 1.76 | 1.64 | 1.58 | -0.18 |
21 | 2549 | Crusty | 2.17 | 0.7 | 0.76 | -1.41 |
Offenbar liegt bei der Variablen music ein Faktor mit mehr als 2 Stufen (es sind 4) vor. Da die Verwendung von katetoriellen Variablen in einem linearen Modell eine Stufenanzahl von 2 voraussetzt, kann durch geschicktes Kodieren der Variablen diese Voraussetzung auch für mehrstufige Variablen erreicht werden.