Blog

Beispielregression: Zunge vs. Zahlen

Der Amerikaner Orley Ashenfelter ist Professor für Ökonomie an der Princeton University. Er liebt Zahlen, seine andere große Liebe ist der Wein (eine Frau hat er wohl auch). Die Qualität eines Weines wird normalerweise durch Weinkritiker und Experten bei einer Verkostung bewertet. Schnuppern, schlürfen, schmecken und dann wird der gute Tropfen wieder ausgespuckt. Ashenfelter ging ein klein wenig anders an die Sache heran. Zunächst war ihm bekannt, dass es sowohl gute als auch nicht so gute Weingüter gibt, deren Weine die entsprechenden Preise erzielen. Außerdem gewinnt ein Wein an Wert, umso älter er wird. Soweit ist alles klar. Aber was Orley Ashenfelter beschäftigte, war die Frage, warum auch bei den besten Winzern, die ihre Weine jedes Jahr auf die gleiche Art und Weise herstellen, die Preise von Jahr zu Jahr erheblichen Schwankungen ausgesetzt sind. Bei Weinauktionen ging der 1961er Bordeaux für sagenhafte 2000$ pro Flasche weg, wohingegen der 1963er nur mickrige 500$ die Flasche einbrachte. Wie kann das sein? Ashenfelter überlegte sich, dass es am Wetter liegen müsse. Denn die Weintrauben werden, so wie alle anderen landwirtschaftlichen Produkte, extrem vom Wetter beeinflusst und eine hohe Qualität der Trauben verspricht eine hohe Qualität des daraus gewonnenen Weines. Aber Ashenfelter wäre kein Wissenschaftler, wenn er sich mit dieser These zufrieden gegeben hätte. Also beschaffte er sich die historischen Wetterdaten von fast 30 Jahren des französischen Weinanbaugebietes Bordeaux und untersuchte den Zusammenhang mit der Qualität des Weines der entsprechenden Jahrgänge, um seine These mit Fakten zu untermauern. Und wissen wollte er es ganz genau, denn er untersuchte nicht nur, ob das Wetter für die Variation der Preise verantwortlich ist, sondern auch, welches Wetter herrschen muss, damit ein qualitativ hochwertiger bzw. minderwertiger Wein entsteht. Herausgekommen ist ein multiples lineares Regressionsmodell mit folgenden erklärenden Variablen:

Da die Qualität eines Weines sich in seinem Preis widerspiegelt, wählte Ashenfelter den logarithmierten Preis des Weines in $ als abhängige Variable . Durch die Transformation mit dem Logarithmus berücksichtigt Ashenfelter, dass sich im oberen Bereich eine relativ kleine Steigerung der Qualität überproportional im Preis niederschlägt. Die Transformation führt zu einer "Linearisierung" des Zusammenhangs. Als erklärende Variablen nahm er das Alter des Weines in Jahren (Alter), die durchschnittliche Temperatur während der Anbauzeit in °C (Temp), die Regenmenge im Herbst (HRegen) und die Regenmenge im Winter (WRegen) in cm in das Modell auf. So brach er alle herkömmlichen Traditionen der Weinbeurteilung und ersetzte sie mal eben durch ein Regressionsmodell. Seine Schätzung des Modells lieferte das folgende Ergebnis:

Das Modell hat ein Bestimmtheitsmaß von 0.828, d.h. es werden 82,8% der Variation der Weinpreise durch dieses Modell erklärt, was für ein sehr gutes Modell spricht. Welchen Einfluss hat das Wetter nach Ashenfelters Berechnungen nun aber genau auf die Qualität von Weinen? Anhand der geschätzten Koeffizienten des Modells ist festzustellen, ...

  • je höher die Temperatur im Sommer,
  • je trockener der Herbst
  • und je niederschlagsreicher der Winter

während bzw. vor der Reifezeit, desto höher der Preis - wobei die beiden größten Determinanten für die Qualität seitens des Wetters die Durchschnittstemperatur im Sommer und die Niederschlagsmenge im Herbst (im positiven und negativen Sinne) sind. Zu sehen ist auch, warum Wein sogar eine Investitionsmöglichkeit darstellt. Jedes Jahr, das der Wein zusätzlich in der Flasche reift, steigt der Preis um circa 2,4%. So eine Rendite zahlt heutzutage keine Bank mehr.

In dem folgenden Streudiagramm ist der Zusammenhang zwischen der Durchschnittstemperatur im Sommer und der Niederschlagsmenge im Herbst abgetragen. Zusätzlich kann man sehen, welche Weine später zu einem unterdurchschnittlichen und welche zu einem überdurchschnittlichen Preis verkauft wurden. Die gestrichelten Linien beziehen sich auf die durchschnittliche Temperatur bzw. Regenmenge. So lässt sich überprüfen, ob Ashenfelter richtig liegt. Die Zahlen rechts neben den Datenpunkten stehen dabei für das Jahr 19xx, in dem die Traubenlese stattfand. Tatsächlich sind im linken oberen Quadranten nur Weine mit minderer Qualität zu finden, deren Trauben niedrigen Temperaturen während der Anbauzeit und einem niederschlagsreichen Herbst ausgesetzt waren. Ein Blick auf das Regressionmodell zeigt, dass er genau das vorausgesagt hat. Auch mit den qualitativ hochwertigen Weinen verhält es sich, wie im Modell beschrieben. Um es kurz zu machen: Orley Ashenfelter hat den Nagel auf den Kopf getroffen.

Der 1961er Bordeaux im rechten unteren Quadranten gehört übrigens zu den besten Jahrgängen des 20. Jahrhunderts.

In Fachkreisen wurde Ashenfelter für dieses Modell ausgelacht, sogar beleidigt. Er wagte es, Robert M. Parker, einem auf Erden wandelnden Gott in Sachen Wein, zu widersprechen, als dieser den 1986er Bordeaux als ziemlich gut einstufte. 1986 war ein Jahr mit unterdurchschnittlichen Temperaturen während der Anbauzeit der Trauben, dazu kam ein niederschlagsreicher Herbst. Also ein Fall, der in den linken oberen Quadranten fällt, dementspechend war auch seine Qualität. Ashenfelter setzte noch einen drauf, als er die überragende Qualität der 1989er und 1990er Bordeaux Jahrgänge voraussagte, als diese noch unprobiert in Weinfässern lagerten. Doch allen Erwartungen und Behauptungen der Weinkenner zum Trotz, waren Ashenfelters Prognosen erneut vollkommen richtig und erstaunlich genau. Der 1986er Bordeaux war ein enttäuschender Jahrgang, die 1989er und 1990er Jahrgänge hingegen gehören - wie auch der 1961er - zu den besten des 20. Jahrhunderts.

- 2:0 für die Zahlen -

Weitere Teile der Artikelreihe:

by Sarah Wagner

Multiple lineare Regression

by Sarah Wagner

Einfache lineare Regression