Datensatz
Betrachten wir zunächst einen einfachen Datensatz aus dem Projekt MOSAIC Data Sets (Paket mosaicData, CPS85)2.
Diese Datei beinhaltet N = 534 Beobachtungen und k = 11 Variablen, deren Namen in folgender Tabelle nochmals separat angeführt sind:
| LNr | Variablenname |
|---|---|
| 1 | wage |
| 2 | educ |
| 3 | race |
| 4 | sex |
| 5 | hispanic |
| 6 | south |
| 7 | married |
| 8 | exper |
| 9 | union |
| 10 | age |
| 11 | sector |
Angenommen Sie müssten auf Basis der vorliegenden Daten für eine Person das durchschnittliche Einkommen (wage) schätzen, ohne dabei andere Variablen zu berücksichtigen. Welchen Wert würden Sie wählen?
Project MOSAIC, is a community of educators working to develop a new way to introduce mathematics, statistics, computation and modeling to students in colleges and universities.↩