Die internationale und unabhängige Jury, die von der König-Baudouin-Stiftung ernannt wurde, hat die bahnbrechende Arbeit über die False Discovery Rate (FDR) als Empfänger des prestigeträchtigen zweijährlichen Rousseeuw-Preises für Statistik 2024 ausgewählt. Dieser Preis in Höhe von einer Million Dollar würdigt außergewöhnliche statistische Forschung, die einen tiefgreifenden Einfluss auf die Gesellschaft hat. Die erste Ausgabe im Jahr 2022 ehrte die Arbeit über kausale Inferenz (die Bestimmung von Ursache und Wirkung). Der diesjährige Preis konzentriert sich auf die False Discovery Rate (FDR) und die Methoden zu deren Kontrolle. Der Artikel von Benjamini und Hochberg aus dem Jahr 1995 führte die FDR ein und bot einen Rahmen für weitere Entwicklungen und Veröffentlichungen. Die Preisträger sind Yoav Benjamini, Daniel Yekutieli und Ruth Heller von der Universität Tel Aviv. Yosef Hochberg verdient ebenfalls viel Anerkennung, ist leider verstorben. Ihre Forschung hat zu einer Methode geführt, um die Anzahl der falschen Entdeckungen zu begrenzen, ohne das Potenzial für echte Entdeckungen zu beeinträchtigen.
Die preisgekrönte Arbeit ist eine Methode, die Wissenschaftlern hilft, echte Entdeckungen zu finden, während sie die Anzahl der falschen Entdeckungen (False Discoveries) niedrig hält. Wer hat nicht schon einmal einen Bericht über eine neue wissenschaftliche Entdeckung gelesen, um später nichts mehr darüber zu hören? Meistens liegt es daran, dass spätere Experimente den Effekt nicht reproduzieren konnten. Dies wird als Replikationskrise der Wissenschaft bezeichnet. Ein wichtiger Grund dafür ist, dass die ursprünglichen Forscher Entdeckungen auf der Grundlage der Betrachtung sehr vieler Ergebnisse beansprucht hatten. Wenn beispielsweise nach einem genetischen Marker gesucht wird, das heißt, einem Gen, das mit einer bestimmten Krankheit zusammenhängt, werden oft mehr als 20.000 Gene untersucht. Aber es kann geschehen, dass ein scheinbarer Zusammenhang nur zufällig ist. Es war also eine Methode erforderlich, um die Anzahl dieser falschen Entdeckungen zu begrenzen.
Wenn man viele potenzielle Ergebnisse betrachtet, ist die Chance grösser, auf falsche Entdeckungen zu treffen. Ein erster Ansatz bestand darin, strenger für jedes einzelne Gen zu sein, aber dann wurden nur sehr wenige Entdeckungen gemacht. Wissenschaftler standen oft vor zwei unangenehmen Entscheidungen: entweder von keiner Entdeckung zu berichten oder wissenschaftliche Behauptungen zu veröffentlichen, die auf wackeligen Beinen stehen.
Auf der Suche nach einer Lösung erkannten Benjamini und Hochberg, dass das Verhältnis zwischen der Anzahl der falschen Entdeckungen und der Gesamtzahl der Entdeckungen als Kriterium verwendet werden konnte. Wenn eine Studie 60 Ergebnisse findet und darunter 3 falsche Entdeckungen sind, ist das nicht so schlimm, denn das Verhältnis beträgt nur 5 %. Aber von 60 Ergebnisse zu berichten, von denen 40 falsch sind, ist nicht akzeptabel. Benjamini und Hochberg veröffentlichten 1995 eine mathematische Formulierung des False Discovery Rate (FDR)-Kriteriums als das erwartete Verhältnis zwischen der Anzahl der falschen Entdeckungen und der Gesamtzahl der Entdeckungen. Sie schlugen vor, die Anzahl der Entdeckungen zu maximieren, unter der Bedingung, dass die FDR unter einem bestimmten Schwellenwert bleibt. Auf den ersten Blick scheint das unmöglich, da wir im Voraus nicht wissen, wie viele falsche Entdeckungen es gibt, aber sie fanden dennoch einen Weg, dies zu tun. In der Benjamini-Hochberg (BH)-Prozedur passt sich die Schwelle für eine Entdeckung automatisch an die Informationen in den Daten an. Es hängt also von den Daten selbst ab, ob die endgültige Schwelle eher hoch oder niedrig ausfällt. Der Artikel von Benjamini und Hochberg stieß auf viel Widerstand, da er sich stark von früheren Methoden unterschied, was zu einer Verzögerung von fünf Jahren und Einreichungen bei drei Zeitschriften führte, bevor er schließlich 1995 veröffentlicht wurde. Der Artikel von Benjamini und Hochberg wurde bis heute mehr als 100.000 Mal zitiert, eine Rekordzahl.
Die Arbeit zur FDR wurde von Benjamini mit den beiden anderen Preisträgern, Yekutieli und Heller, fortgesetzt. Gemeinsam erzielten sie theoretische Ergebnisse über das Verhalten der BH-Prozedur, wandten das FDR-Kriterium auf neue Herausforderungen wie die Bildanalyse an und schlugen neue Techniken vor, um die Reproduzierbarkeit wissenschaftlicher Ergebnisse zu schätzen.
Zu Beginn des 21. Jahrhunderts erlebte die wissenschaftliche Forschung eine industrielle Revolution. Experimente in Genomik, Proteomik und Hirnforschung werden jetzt mit Maschinen durchgeführt, die viele Ergebnisse liefern. Diese Ergebnisse werden dann automatisch verarbeitet, was zu vielen potenziellen Entdeckungen führt. Jetzt, da leistungsstarke Computer und große Datenbanken verfügbar sind, wird die FDR auch zunehmend in anderen Wissenschaftsbereichen wie Landwirtschaft, Astronomie, Verhaltenswissenschaften oder Wirtschaft eingesetzt. Die FDR-Prozedur hat breite Anwendung gefunden und die Bedeutung der FDR-Forschung nimmt mit der Komplexität der gestellten wissenschaftlichen Fragen zu.
Die FDR-Prozedur ist in verschiedenen Zweigen der Statistik und anderen Wissenschaftsbereichen sehr relevant, und viele Statistiker weltweit forschen daran. Die drei Preisträger haben diese Arbeit fortgesetzt, sowohl gemeinsam, getrennt als auch mit anderen, um der wissenschaftlichen Gemeinschaft zu helfen, zuverlässige Informationen aus komplexen Daten zu gewinnen. Weitere Informationen zu diesem Preis sind auf der Website www.rousseeuwprize.org verfügbar.