Datensatz
Betrachten wir zunächst einen einfachen Datensatz aus dem Projekt MOSAIC Data Sets (Paket mosaicData, CPS85)2.
Diese Datei beinhaltet N = 534
Beobachtungen und k = 11
Variablen, deren Namen in folgender Tabelle nochmals separat angeführt sind:
LNr | Variablenname |
---|---|
1 | wage |
2 | educ |
3 | race |
4 | sex |
5 | hispanic |
6 | south |
7 | married |
8 | exper |
9 | union |
10 | age |
11 | sector |
Angenommen Sie müssten auf Basis der vorliegenden Daten für eine Person das durchschnittliche Einkommen (wage) schätzen, ohne dabei andere Variablen zu berücksichtigen. Welchen Wert würden Sie wählen?
Project MOSAIC, is a community of educators working to develop a new way to introduce mathematics, statistics, computation and modeling to students in colleges and universities.↩