Datensatz
Betrachten wir zunächst einen einfachen Datensatz aus dem Projekt MOSAIC Data Sets (Paket mosaicData, CPS85)2.
Diese Datei beinhaltet N = 534 Beobachtungen und k = 11 Variablen, deren Namen in folgender Tabelle nochmals separat angeführt sind:
| LNr | Variablenname | 
|---|---|
| 1 | wage | 
| 2 | educ | 
| 3 | race | 
| 4 | sex | 
| 5 | hispanic | 
| 6 | south | 
| 7 | married | 
| 8 | exper | 
| 9 | union | 
| 10 | age | 
| 11 | sector | 
Angenommen Sie müssten auf Basis der vorliegenden Daten für eine Person das durchschnittliche Einkommen (wage) schätzen, ohne dabei andere Variablen zu berücksichtigen. Welchen Wert würden Sie wählen?
- Project MOSAIC, is a community of educators working to develop a new way to introduce mathematics, statistics, computation and modeling to students in colleges and universities.↩