Organisiere mit uns einen ReproHack!

Was ist ein ReproHack?

Ein ReproHack (kurz für Reproducible Hackathon) ist eine Workshop-Veranstaltung, welche meist einen Tag lang stattfindet und seit 2016 an verschiedenen Orten abgehalten wurde. Die Code-Basis für dieses Format kann auf GitHub gefunden werden, während die Community auf Twitter und Slack zu finden ist.

Während eines ReproHack versuchen die Teilnehmer*innen, veröffentlichte Forschungsergebnisse ihrer Wahl aus einer Liste vorgeschlagener Artikel mit öffentlich zugehörigem Code und Daten zu reproduzieren.

Die Teilnehmer*innen arbeiten alleine oder in Gruppen in ihrem eigenen Tempo und dokumentieren ihre Erfahrungen zu einer Reihe von Schlüsselaspekten, darunter Reproduzierbarkeit, Transparenz und Wiederverwendbarkeit der Materialien. Am Ende des Workshops werden die Erfahrungen miteinander geteilt und als Feedback an die Autor*innen zurückgegeben.

In der Wissenschaft besitzt die Reproduzierbarkeit oder auch Replizierbarkeit allgemein einen hohen Stellenwert. Sie bedeutet die Wiederholbarkeit von empirisch-wissenschaftlichen Forschungsergebnissen. Erst wenn ein Befund reproduzierbar ist und eine Replikationsstudie zu ähnlichen, wenn nicht gleichen Ergebnissen kommt, erlangt die Erst-Studie Glaubwürdigkeit. Autor*innen, die ein eigenes Papier zur Replikation zur Verfügung stellen, erhalten nützliches Feedback, während Teilnehmende generell hilfreiche Lernerfahrung für ihre eigene Forschungen und Veröffentlichungen erhalten.

Gemeinsam einen ReproHack organisieren

Leider plant sich ein ReproHack nicht von selbst, deshalb rufen wir Forschungseinrichtungen auf, ob diese mit unserem Netzwerk gerne einen ReproHack zusammen organisieren wollen. So entstand bereits im Mai 2021 ein ReproHack in Zusammenarbeit mit der Open Reproducible Data Science and Statistics Gruppe (ORDS) an der Universität Rostock. Nach folgenden Gesichtspunkten könnte ein ReproHack mit einer Forschungseinrichtung organisiert werden:

  • Es besteht ein allgemeines Interesse einen ReproHack zu organisieren. Eine Liste an bisher eingereichten Forschungsergebnissen mit zugrundliegenden Daten und Code kann hier eingesehen werden.

  • Für die Reproduzierbarkeit von Forschungsergebnissen aus Rohdaten werden gern Programmiersprachen wie R, Python oder Julia verwendet. Sowohl die Sprachen selber als auch ihre möglichen Arbeitsumgebungen sind dazu aber oft noch nicht gut an Forschungseinrichtungen etabliert. Ein ReproHack könnte aus einem kurzen Lehrgang dieser Sprachen mit gefolgten Einsatz bei der Reproduktion einer Forschungsarbeit organisiert werden.

  • Sind in einer Forschungseinrichtung bereits Kenntnisse zu diversen anwendbaren Sprachen vorhanden, so kann die Übertragbarkeit von Code auf andere Sprachen für die Reproduzierbarkeit getestet werden. So kann zum Beispiel ein gegebenes Skript in R auf Python übertragen werden, ob dort die gleichen Forschungsergebnisse erzielt werden können.

  • Eventuell gibt es in der Forschungseinrichtung bereits Fremddatensätze oder Forschungsergebnisse, die aus verschiedenen Gründen nicht nachgenutzt werden können. In dem Fall können wir mit den Autor*innen Kontakt aufnehmen und einen ReproHack zu diesen Materialien gestalten. Es ist ebenfalls möglich Publikationen, Code und Datensätze aus der Forschungseinrichtung selber zu evaluieren.

Sollte ein oder gar mehrere Punkte auf Ihre Forschungseinrichtung zutreffen, so können wir gerne einen ReproHack zusammen organisieren. Natürlich können Sie aber auch eigene Vorschläge einbringen. Bei Interesse melden Sie sich einfach bei uns per Email unter: info@forschungsdaten-thueringen.de (Stichwort: ReproHack)