Grüninger

View Original

Wie eine Bieridee die Statistik revolutionierte

Ein Edelstahltank der Guinness-Brauerei wird im Hafen von Glasgow verschifft. (Bild: Reg Speller / Hulton Archive / Getty Images)

Ein Beitrag aus der «NZZ am Sonntag» vom 16. Juni 2017. Den Original-Text gibt es hier zu lesen.

---

Bier ist beständig. Wo Weinkenner zwischen guten und schlechten Jahrgängen unterscheiden, verlangen Biertrinker, dass ihr Lieblingsgetränk über die Jahre hinweg immer gleich schmeckt. Doch wie lässt sich so eine Beständigkeit erreichen?

Die Guinness-Brauerei fand vor mehr als hundert Jahren als erste die Lösung dieses Problems. Der irische Konzern war damals die grösste Brauerei der Welt und verkaufte über 200 Millionen Liter Bier pro Jahr.

Doch die grossen Mengen machten es zunehmend schwierig, eine seriöse Produktionssicherung zu gewährleisten. Konnten die Brauer früher noch die Qualität jedes Fasses eigenhändig überprüfen, war das bei über 1,5 Millionen Fässern jährlich keine Option mehr. Guinness entschied sich deshalb, das Brauhandwerk zu einer Wissenschaft zu machen. Damit wurde der Konzern nicht nur zum Vorreiter der industriellen Qualitätskontrolle, sondern leistete auch einen grundlegenden Beitrag zur Statistik des 20. Jahrhunderts.

Wesentlichen Anteil an dieser Pionierleistung hatte William Sealy Gosset, ein gewitzter Chemiker aus Canterbury, der 1899 als Brauassistent zu Guinness stiess.

Dort herrschte Aufbruchsstimmung. Der Konzern hatte begonnen, brillante Köpfe aus Oxford, Cambridge und anderen Spitzenuniversitäten anzuwerben. Die jungen Forschenden sollten dem Unternehmen helfen, den Produktionsprozess günstiger, zuverlässiger und leichter überprüfbar zu machen.

Jeder Aspekt der Bierherstellung wurde jetzt vermessen: Wie viel Ertrag wirft eine bestimmte Gerstenart ab? Wie beeinflusst der Zuckergehalt im Malz die Haltbarkeit des Biers? Wie harzig muss der Hopfen sein? Die gesammelten Daten galt es auszuwerten. Und weil Gosset im Gegensatz zu vielen seiner Kollegen ein gewisses mathematisches Verständnis mitbrachte, wurde er rasch die Guinness-interne Anlaufstelle für quantitative Probleme aller Art.

Doch wenn die Brauer den Zuckeranteil im Malz oder den Harzgehalt des Hopfens wissen wollten, untersuchten sie nicht jedes Korn und jede Blüte, sondern wählten lediglich eine Stichprobe aus, um daraus den Durchschnitt zu berechnen. Dabei gilt: Je grösser eine Stichprobe ist, desto verlässlicher sind solche Berechnungen. Doch grosse Stichproben kosten Zeit und Geld. Gosset musste also herausfinden, wie er auch aus Stichproben mit nur drei oder vier Messungen verlässliche Informationen erhalten konnte.

Vater der modernen Statistik

Ein Forschungsaufenthalt in der Arbeitsgruppe von Karl Pearson in London sollte ihm dabei helfen. Pearson gilt heute als einer der Gründerväter der modernen Statistik.

Zu jener Zeit stammten die meisten statistischen Methoden aus Gebieten, wo die Forschenden auf Hunderte bis Tausende von Messungen zurückgreifen konnten. Sie mussten sich also wenige Gedanken darüber machen, ob ihre Berechnungsmethoden auch bei kleinen Stichproben funktionierten.

Pearson meinte dann auch neckisch, dass sich nur ein «ungezogener Brauer» wie Gosset mit so wenigen Messungen abgeben würde. Dennoch konnte er ihm eine Vielzahl statistischer Grundlagen vermitteln. Gosset gelang es damit, eine neue Wahrscheinlichkeitsverteilung zu erfinden.

Diese sogenannte t-Verteilung erlaubt es auch bei kleinen Stichproben, die Verlässlichkeit der daraus berechneten Durchschnittswerte einzuschätzen. Wenn beispielsweise die Durchschnittsgrösse aller Männer in der Schweiz bei 1,78 Meter liegt und man eine Stichprobe von zehn Personen auswählt, sagt uns die t-Verteilung, wie wahrscheinlich eine bestimmte Abweichung vom wahren Mittelwert ist.

Dank der t-Verteilung war Gosset fortan in der Lage, den Ertrag einer Gerstenart, den Harzanteil im Hopfen oder den Alkoholgehalt einer neuen Biersorte auch mit wenigen Stichproben verlässlich einzuschätzen.

1907 wurde Gosset aufgrund seiner herausragenden Arbeit zum Chef der experimentellen Brauabteilung befördert. Als er seine Forschungsergebnisse aber veröffentlichen wollte, stiess das bei seinen Chefs nicht auf Begeisterung. Sie hatten den Nutzen der Statistik erkannt und wollten diesen Wettbewerbsvorteil nicht verlieren.

Also beschlossen sie, dass Gosset seine Arbeit zwar publizieren dürfe, aber nicht mit Daten aus dem Brauereiwesen und nicht unter seinem richtigen Namen. 1908 veröffentlichte deshalb ein mysteriöser «Student» eine neue Methode zur Fehlerschätzung von Durchschnittswerten bei kleinen Stichproben.

Die Geheimhaltung funktionierte: Gossets Methoden wurden ausserhalb der Guinness-Brauerei weitgehend ignoriert. Aber nicht ganz. 1912 erhielt Gosset einen Brief von einem Mathematik-Studenten namens Ronald Aylmer Fisher, der ihm einen mathematischen Beweis für seine t-Verteilung lieferte – etwas, an dem Gosset bis dahin gescheitert war.

Die beiden Forscher sollten sich erst zehn Jahre später das erste Mal persönlich treffen, doch Fishers Brief war der Beginn einer regen wissenschaftlichen und privaten Korrespondenz. Wo Gosset die praktischen Anwendungsprobleme löste, lieferte Fisher die mathematischen Beweise.

Dennoch glaubte Gosset nicht, dass es ausserhalb der Guinness-Brauerei eine grosse Nachfrage nach seiner t-Verteilung gab. So schickte er Fisher 1922 eine Kopie seiner Wahrscheinlichkeits-Tabellen und versah sie mit der Anmerkung, dass Fisher «wohl der einzige Mensch sei, der sie jemals nutzen würde».

Schielen auf Signifikanz

Fisher sollte ihn eines Besseren belehren. 1925 veröffentlichte er sein Buch «Statistische Methoden für Forscher», das zu einem der einflussreichsten statistischen Lehrbücher aller Zeiten wurde. Darin beschrieb er auch einen Test basierend auf der t-Verteilung und taufte ihn zu Ehren Gossets alias «Student» den «Student-t-Test».

Statistische Tests werden verwendet, um «signifikante» von «nicht signifikanten» Ergebnissen zu trennen. Sie geben jedoch noch keine Auskunft darüber, ob ein Ergebnis auch relevant ist. Ein Medikament, das den Blutdruck um ein Prozent senkt, kann durchaus eine statistisch signifikante Wirkung haben. Aber der Effekt ist so klein, dass der klinische Nutzen gegen null geht.

Die einfache Anwendung von Tests wie dem Student-t-Test verleitet dennoch viele Forschende dazu, nur auf die statistische Signifikanz zu schielen. Gosset hätte ein solches Verhalten zweifellos kritisiert. «Wichtig ist es, den tatsächlichen Fehler zu minimieren, nicht ein ‹signifikantes› Resultat [. . .] zu erzielen. Letzteres scheint mir für sich genommen fast wertlos zu sein», schrieb er noch kurz vor seinem Tod 1937.

Für Gosset, den Chemiker und Bierbrauer, war Statistik immer eine Frage praktischer Notwendigkeit, nicht theoretischer Reinheit. Zu oft hatte er im Rahmen seiner Arbeit gesehen, dass statistisch signifikante Ergebnisse vollkommen wertlos für den Brauprozess waren. Er warnte deshalb bereits ganz am Anfang seiner Karriere vor einer unreflektierten Verwendung statistischer Methoden. Denn «je besser ein Instrument ist, desto grösser ist die Gefahr, es auf dumme Weise zu verwenden. [. . .] Keine statistische Methode sollte jemals das sorgfältige Nachdenken [über ein Problem] ersetzen.»

Gossets Gespür für die richtigen Fragen, seine Experimentierfreude und seine Praxisorientierung haben die moderne Statistik massgeblich geprägt und in vielerlei Hinsicht den Grundstein gelegt für die industrielle Qualitätssicherung. Deshalb wissen Biertrinker auch heute noch, was sie bei einem Glas ihres Lieblingsgetränks erwarten dürfen.