Materialien für den Workshop "Forschungsdaten selbst analysieren mit R" (GESIS DataDay 2019)
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
binder
.gitignore
README.md
allbus_evs_examples_dataday19.R
allbus_evs_examples_dataday19.ipynb

README.md

gesis_dataday_19

Materialien für den Workshop "Forschungsdaten selbst analysieren mit R", GESIS DataDay 2019

Um das Jupyter-Notebook für diesen Workshop zu starten, klicken Sie einfach auf den "Launch Binder"-Button. Auf der Seite, die sich dann nach kurzer Zeit öffnen sollte, klicken Sie dann die Datei allbus_evs_examples_dataday19.ipynb an.

Binder

Wenn Sie das vollständige Repository herunterladen und lokal speichern wollen, klicken Sie auf den grünen "Clone or download"-Button und wählen dann "Download ZIP" aus.


Voraussetzungen

Um das Notebook bzw. das Script verwenden zu können, benötigen Sie einen Account für den GESIS DBK.

Für R-Neulinge empfiehlt es sich, Grundkenntnisse im Umgang mit R und dem Tidyverse zu erwerben, um mit dem Script (weiter) zu arbeiten. Kurze, interaktive und kostenlose Einführungen in R bieten bspw. der swirl-Kurs R Programming oder der DataCamp-Kurs Introduction to R.

Einen ausführlicheren Überblick mit Fokus auf die Tidyverse-Packages liefert das Buch R for Data Science von Hadley Wickham und Garrett Grolemund. Das Buch ist online vollständig und kostenfrei verfügbar. Das gedruckte Buch ist mittlerweile auch in deutscher Übersetzung erschienen.

Als Einführung speziell auch für den Datenjournalismus ist vor Kurzem das Buch Practical R for Mass Communication and Journalism von Sharon Machlis erschienen. Die Autorin bietet in der Serie Do More with R zudem einige kostenlose kurze Video Tutorials zu verschiedenen Themen (u.a. auch zur Erstellung von Karten) an.

Für den Einstieg in R gibt es auch zahlreiche Präsenzkurse. Bei GESIS bietet Jan-Philipp Kolb am 13. & 14.05.2019 z.B. den Kurs Einführung die Datenanalyse mit R an und ich selbst werde, gemeinsam mit meinen Kollegen Thomas Ebel und Stefan Müller, am 15. & 16.05.2019 einen Workshop zu Data Wrangling & Exploration with the Tidyverse in R anbieten (beide Kurse finden in Mannheim statt).

Quellen

Für die Beispiele im Notebook/Script werden Daten aus der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften ALLBUS sowie der European Values Study EVS verwendet.

Vollständige Zitationen für die verwendeten Datensätze:

GESIS - Leibniz-Institut für Sozialwissenschaften (2018): Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUScompact - Kumulation 1980-2016. GESIS Datenarchiv, Köln. ZA4587 Datenfile Version 1.0.0, doi:10.4232/1.13048

GESIS - Leibniz-Institut für Sozialwissenschaften (2017): Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2016. GESIS Datenarchiv, Köln. ZA5250 Datenfile Version 2.1.0, doi:10.4232/1.12796

EVS (2018): European Values Study 2017: Integrated Dataset (EVS 2017). GESIS Datenarchiv, Köln. ZA7500 Datenfile Version 1.0.0, doi:10.4232/1.13090

EVS (2016): European Values Study 2008: Integrated Dataset (EVS 2008). GESIS Datenarchiv, Köln. ZA4800 Datenfile Version 4.0.0, doi:10.4232/1.12458

Die Erstellung der Karten für die EVS-Daten orientiert sich an einem Blog-Post von Alexandru Cernat.