Kategorielle Prädiktoren

Bei lineare Modellen ist häufig neben intervallskalierten Prädiktorvariablen auch die Verwendung von kategoriellen Variablen von Interesse. So lange der verwendete Prädiktor nur zwei Ausprägungen hat (z.B. männlich/weiblich, Ja/Nein, etc.), stellt dies auch kein Problem dar.

Mehrstufiger kategorieller Prädiktor

Während eines dreitägigen Musikfestivals wurde bei einer Anzahl freiwilliger TeilnehmerInnen der “Hygienezustand” gemessen (Variablen day1, day2, day3). Der Wertebereich der Messung liegt zwischen 0 und 4, mit 0 = smell like s..t, bis 4 = smell like freshly baked bread9. Darüber hinaus wurden die TeilnehmerInnen über ihre jeweilige Zuordnung zu eine bestimmten, persönlich bevorzugten Musikrichtung (music) befragt. Bei dem Fesitval gaben die TeilnehmerInnen insgesamt vier verschiedenen Musikrichtungen an: Metaller, Crusty, Indie, NMA (= No Music Affiliation). Nach Erfassung der Daten wurde die Differenz der Hygienewerte zwischen dem letzten und dem ersten Tag des Festivals berechnet und in der Variablen change gespeichert:

  ticknumb music day1 day2 day3 change
1 2111 Metaller 2.65 1.35 1.61 -1.04
2 2229 Crusty 0.97 1.41 0.29 -0.68
10 2504 No Musical Affiliation 1.11 0.44 0.55 -0.56
12 2510 Crusty 0.82 0.2 0.47 -0.35
14 2515 No Musical Affiliation 1.76 1.64 1.58 -0.18
21 2549 Crusty 2.17 0.7 0.76 -1.41

Offenbar liegt bei der Variablen music ein Faktor mit mehr als 2 Stufen (es sind 4) vor. Da die Verwendung von katetoriellen Variablen in einem linearen Modell eine Stufenanzahl von 2 voraussetzt, kann durch geschicktes Kodieren der Variablen diese Voraussetzung auch für mehrstufige Variablen erreicht werden.


  1. Daten und Beispiel aus (Field 2017), Kapitel 7.12.1