Einleitung

Donald Knuth, einer der Pioniere und bedeutensten Persönlichkeiten in der Entwicklung von Programmiersprachen, vertrat in seinem Buch Compter Programming as an art (Knuth 2008) die Auffassung, dass rein wissenschaftliches Arbeiten durch einen Computer erlernt werden kann (Science is knowledge which we understand so well that we can teach it to a computer). Alle andere Formen der Datenanalyse bezeichnete er als Kunst.

Neben statistischen Methoden, maschinellem Lernen, diversen Softwarepaketen und verschiedensten Werkzeugen stehen heutzutage auch entsprechend leistungsfähige Computer zur Verfügung, um Unmengen von Daten aufzuzeichnen und zu verarbeiten. Die Kunst, Wirklichkeit in bestmöglicher Form durch ein Modell abzubilden, besteht demnach darin, die:

  • richtigen Fragen zu stellen.
  • Daten zu sammeln, mit welchen diese Fragen beantwortet werden können.
  • entsprechenden Methoden und Werkzeuge anzuwenden.
  • Ergebnisse richtig zu interpretieren.
  • Ergebnisse zu vermitteln.

In den meisten Fällen ist es nicht möglich, die Wirklichkeit absolut getreu durch Daten abzubilden. Seit Urzeiten verwendet daher der Mensch Modelle, um zumindest mit einer Annäherung diese möglichst genau darzustellen und daraus Rückschlüsse für sonst nicht (oder nur schwer) zu erklärende Phänome zu ziehen. In einem Artilel beschreibt G. Box (Box 1979) sehr treffend die Eigenschaften von Modellen:

Now it would be very remarkable if any system existing in the real world could be exactly represented by any simple model. However, cunningly chosen parsimonious models often do provide remarkably useful approximations. For example, the law \(P \cdot V = R \cdot T\) relating pressure P, volume V and temperature T of an “ideal” gas via a constant R is not exactly true for any real gas, but it frequently provides a useful approximation and furthermore its structure is informative since it springs from a physical view of the behavior of gas molecules. For such a model there is no need to ask the question “Is the model true?”. If “truth” is to be the “whole truth” the answer must be “No”. The only question of interest is “Is the model illuminating and useful?”. — G. Box

References

Knuth, D. 2008. “Ein Modell Des Modellseins – Ein Beitrag Zur Aufklärung Des Modellbegriffs.” Peter Lang Verlag, 187–220.

Box, G.E.P. 1979. “Robustness in the Strategy of Scientific Model Building.” Academic Press.