Skip to content

Latest commit

 

History

History
26 lines (18 loc) · 1.55 KB

README.md

File metadata and controls

26 lines (18 loc) · 1.55 KB

DSCB230-TheGuardian

Github Repository zur Hausarbeit für DSCB230 Hochschule Karlsruhe bei Matthias Mruzek-Vering

Ziel der Hausarbeit ist eine Datenanalyse zu einem selbstgeähltem Businesscase

Der ausgewählte Buisnesscase ist eine Kategorienanalyse von der Zeitung TheGuardian. Hier wollen wir die Zeitschrift ein wenig durchleuchten mit Blick auf ihre generelle Veröffentlichungsgewöhnlichkeiten und wir wollen herausfinden ob wir die Kriterien für einen erfolgreichen TheGuradian.com Artikel aufdecken können. Zum Schluss möchten wir anhand von den entdeckten Kriterien einen Artikel schreiben lassen und mit ähnlichen Artikel abgleichen. Außerdem möchten wir die Autoren etwas kennenlernen und ihren Arbeitsalltag ermitteln. Bei vielen der Fragestellungen teilen wir das Ergebnis in 4 Darstellungen, einmal eine generelle Darstellung und je eine für die 3 Schreibstudios von Guardian(UK,US,AUS), damit werden die Diagramme etwas übersichtilicher und wir können regionspezifische Erkenntnisse aus den Daten ziehen.

Fragestellungen

Mit Rubriken sind in den Daten die Keyword tags gemeint

  • Wie viele Artikel pro Tag?
  • Welche Rubriken sind am meisten vertreten?
  • Werden an bestimmten Tagen oder Uhrzeiten Artikel für bestimmte Rubriken geschrieben?
  • Welche Rubriken treten oft zusammen auf?
  • Wie lang ist der durchschnittliche Artikel(nach Wörtern)
  • Wann am Tag wird für welche Rubrik veröffentlicht?
  • Wer sind die besten Autoren(nach Anzahl geschriebener Artikel)
  • Wie sieht der Arbeitsalltag der Mitarbeiter aus?
  • Wann veröffentlicht wer?