Datensatz

Betrachten wir zunächst einen einfachen Datensatz aus dem Projekt MOSAIC Data Sets (Paket mosaicData, CPS85)2.

Diese Datei beinhaltet N = 534 Beobachtungen und k = 11 Variablen, deren Namen in folgender Tabelle nochmals separat angeführt sind:

LNr Variablenname
1 wage
2 educ
3 race
4 sex
5 hispanic
6 south
7 married
8 exper
9 union
10 age
11 sector

Angenommen Sie müssten auf Basis der vorliegenden Daten für eine Person das durchschnittliche Einkommen (wage) schätzen, ohne dabei andere Variablen zu berücksichtigen. Welchen Wert würden Sie wählen?


  1. Project MOSAIC, is a community of educators working to develop a new way to introduce mathematics, statistics, computation and modeling to students in colleges and universities.