A Datenquellen und Struktur des Abschlussberichts
- Verschiedene Datenquellen kennen
- Mögliche R-Pakete für direkten Datenbankzugang kennen
A.1 Datenquellen
In diesem Abschnitt beschreibe ich einige mögliche Datenquellen, die Sie für Ihre Abschlussberichte nutzen können. Technische Unterstützung kann ich nur beim Paket eurostat anbieten. Andere Pakete müssen Sie selbstständig entdecken (Challenge 😎).
A.1.1 Statistsiches Bundesamt
Das Statistische Bundesamt bietet Daten zu und über Deutschland. In deren Datenbank GENESIS. Es ist wichtig, dass Sie beim Herunterladen (Werteabruf) das Format flat wählen. Dann bekommen Sie einen tidy Datensatz.
A.1.2 eurostat
eurostat ist das statistische Amt der Europäischen Union. Auf ihrer Seite finden Sie viele Informationen und statistische Daten über und zu Europa.
Die Daten von eurostat können direkt mit dem Paket eurostat tidy heruntergeladen werden. Das Paket hat eine sehr gute Homepage und Tutorien Unter dem Reiter Articles finden Sie auch ein Tutorium, das die Darstellung der Daten als Karten (auch interaktiv) zeigt.
A.1.3 gapminder
Sie haben einen Auszug aus den Daten von gapminder bereits kennen gelernt. Es gibt aber noch viel mehr dort zu entdecken. Die Daten können Sie per Hand hier herunter laden. Besser ist jedoch, sich mit dem DDF Format (data description format) auseinander zu setzten. Dieses bietet tidy .csv-Dateien an. Der vollständige Datensatz von gapminder kann hier herunter geladen werden.
A.1.4 National Oceanic and Atmospheric Administration (NOAA)
NOAA bietet zahlreiche Datensätze zu Ozeanen, Wetter und Klima an. Sie können die Daten mit dem Paket rnoaa direkt herunterladen.
A.1.5 Weitere Datenquellen
- World Bank Open Data
- World Happiness Report
- Global Carbon Budget 2020
- Gehalte an organischem Kohlenstoff in Böden unter mehrjährigen Kulturen
- PANGAEA: eine der größten Datenbanken für Umweltdaten
- Überblick über open data und Pakete für direkten Download auf ROpenScie: Daten Pakete
A.2 Forschungsplan
Für Ihren Bericht erstellen Sie bitte einen Forschungsplan, den Sie in ILAS hochladen. Nutzen Sie für den Forschungsplan das zur Verfügung gestellte Template. Beachten Sie die Deadline in ILIAS. Sie bekommen Feedback zu diesem Forschungsplan, bevor Sie Ihren eigentlichen Bericht erarbeiten. Damit sollten Missverständnisse bezüglich Inhalt und Schwere der Aufgabe vermieden werden.
A.3 Struktur des Abschlussberichts
A.3.1 Struktur des Arbeitsverzeichnisses
Für Ihren Bericht, legen Sie bitte ein eigenes R-Projekt an. Eine ausführliche Anleitung finden sie hier. Ein Projekt hilft Ihnen, Ihre Arbeit gut zu organisieren und nicht den Überblick über verschiedene Dateien zu verlieren.
In Ihrem R-Projekt-Ordner legen Sie einen Ordner für Daten, gegebenenfalls einen für Hilfsskripte und gegebenenfalls einen für Abbildungen, die Sie zusätzlich im Bericht zeigen möchten. Ihr R-Notebook verbleibt im Wurzelverzeichnis des Projekts.
A.3.2 Daten herunterladen und speichern
Falls Sie Daten mit Hilfe eines R-Pakets herunterladen, dann legen Sie dafür ein gesondertes R-Notebook an und beschreiben Sie den Vorgang: Wann und woher wurde der Datensatz heruntergeladen. Speichern Sie den Datensatz im Ordner Daten. Analysieren Sie den gespeicherten Datensatz. So kann ich später beim Korrigieren auf denselben (abgespeicherten) Datensatz zugreifen wie Sie. Denn Datenbanken können zwischen Abgabe und Korrektur aktualisiert werden.
A.3.3 Struktur des Berichts
Strukturieren Sie Ihren Bericht wie folgt:
- Einführung (am Ende muss die Forschungsfrage stehen)
- Material und Methoden: Datenbeschreibung, Beschreibung der Methode mit Literaturangaben, gegebenenfalls Beschreibung des Untersuchungsgebiets
- Ergebnisse: Explorative Datenanalyse, weitere Analysen
- Diskussion mit Einbezug von weiterer Fachliteratur
- Schlussfolgerung
- Literatur
Sie können Ergebnisse und Diskussion zu einem Abschnitt vereinen.
Jeder Bericht muss eine Challenge beinhalten. Das kann z.B. das Vorbereiten (tidy and wrangle) eines besonders komplizierten Datensatzes sein. Oder die Einarbeitung in ein spannendes Paket (z.B. räumliche Darstellung in eurostat) etc.
Sie können den Bericht in Zweiergruppen anfertigen. Dazu rate ich sogar. In diesem Fall müssen Sie im Bericht Ihren eigenen Anteil klar mit Ihrem Namen ausweisen. Es müssen sowohl Text als auch Analyse (Code) von jedem Gruppenmitglied bearbeitet werden.
Es gibt keine Längenvorgabe für Ihren Bericht. Seien Sie concise: so viel wie nötig aber nicht mehr.
Am Ende kniten Sie den Bericht zu einem html-Dokument. Überlegen Sie, welche Code-Chunks im Bericht zu sehen sein müssen und vermeiden Sie Redundanz. Wichtig: das Notebook muss bei mir lauffähig sein, d.h. Sie müssen alle Zusatzskripte, Daten etc. mit richtigen relativen Pfaden im Projekt ansprechen.
Laden Sie den gesamten Projektordner als zip-Datei auf ILIAS hoch. Die Deadline steht auf ILIAS.