Kapitel 2 R Markdown für reproduzierbare Forschung

  • Wichtigkeit der Reproduzierbarkeit erklären
  • Begriff literate programming definieren
  • Aufbau einer RMarkdown-Datei erklären
  • Einen einfachen ersten reproduzierbaren Bericht schreiben

2.1 Warum Reproduzierbarkeit in der Forschung wichtig ist

Als Motivation für dieses Thema empfehle ich das Video von Prof. Roger Peng der John Hopkins Bloogmerg School of Public Health.

2.2 Literate Programming Idee von Donald Knuth

Die Idee, dass man den Code und die dazugehörige Interpretation (Text, Bericht etc.) nicht voneinander trennen sollte, geht auf Knuth (1984) zurück. Mit Literate Programming meinte Knuth, dass Programme auch nichts anderes wie literarische Werke sind. Er setzte den Fokus darauf, mit Programmen menschlichen Benutzern zu erklären, was man den Computer machen lassen möchte. Also weg vom computer- hin zum mensch-zentrierten Zugang. So wird Programmieren und in unserem Fall die Datenanalyse verständlich und vor allem reproduzierbar.

Leider ist es in unserer modernen Forschungslandschaft immer noch nicht Standard. Das Trennen von Analyseergebnissen und Berichten (Forschungsartikeln) sorgt für viele (unentdeckte und unnötige) Fehler und Frust.

2.3 Reproduzierbare Berichte mit R Markdown

R hat sein eigenes System von reproduzierbaren Berichten, genannt R Markdown (Xie, Allaire, and Grolemund 2021). Es ist benutzerfreundlich und ermöglicht unterschiedliche Formate von Berichten, wie HTML-Dokumente, PDF-Dateien, Präsentationsfolien usw.

Es wird Sie vielleicht überraschen, aber das Skript, das Sie gerade lesen, ist nichts anderes als ein “literarisch” programmiertes Buch in R Bookdown (Xie, Allaire, and Grolemund 2021), einem R-Paket speziell für lange R Markdown-Dokumente.

Wir werden vor allem mit R Notebooks arbeiten, die eine gute Interaktion zwischen dem geschriebenen Text und dem R-Code ermöglichen. Das Notebook kann sowohl in ein HTML-Dokument als auch in PDF oder Word als endgültiges Dokument umgewandelt werden. Diesen Prozess nennt man knit.

2.4 Ein neues R Notebook erstellen

Um ein neues R Notebook zu erstellen, klicken Sie das kleine grüne Plus oben links und wählen Sie R Notebook aus. Sie können es erst einmal bei untitled belassen (Abbildung 2.1).

Neues R Notebook anlegen

Abbildung 2.1: Neues R Notebook anlegen

Wenn Sie ein neues Notebook erstellen, enthält das Template etwas Code. Lesen Sie sich das ruhig noch einmal durch, da es ein paar hilfreiche Tastenkürzel und Tipps. Danach können Sie den Text unterhalb des Headers löschen.

2.6 Wichtigste Regeln für Reproduzierbarkeit

Ein weiteres Video von Prof. Peng widmet sich den wichtigsten Regeln für Reproduzierbarkeit.

2.7 Lesestoff

Intro zu Kapitel 2 (Basics), Kapitel 3.2.1 und 3.2.2 in Xie, Allaire, and Grolemund (2021)

2.8 Weiterführende Literatur

r4ds, Kapitel 27 (Wickham and Grolemund 2021)

2.9 Aufgaben

2.9.1 Erstes Notebook

  • Erstellen Sie ein R Notebook.
  • Fügen Sie Layoutelemente hinzu:
    • Überschrift
    • Unterüberschrift
    • kursiver Text
    • ein Exponent: R2
    • ein Mathematikelement: \(x^2\)
    • eine Liste

Nutzen Sie die unter 2.5 verlinkte Liste der Layoutelemente.

2.9.2 Erste Schritte als Notebook

  • Wandeln Sie das R-Skript der ersten Session in ein R Notebooks um.
  • Fügen Sie mehr Erklärungstext zu den einzelnen Schritten hinzu.
  • Gliedern Sie Ihr Notebook mit passenden Layoutelementen.