Seminar Datenjournalismus
Am 28.und 29. April habe ich am KfJ Salzburg einen Datenjournalismus-Kurs mit Marco Maas besucht. Obwohl ich mich schon recht gut auskenne, konnte ich einiges Mitnehmen.
Erst mal zum Referenten. Marco Maas ist der Gründer von Opendatacity.de, einer deutschen Datenjournalismus-Agentur – der einzigen, soweit ich weiß. Er hat einige Projekte gezeigt, wie den Verspätungsmonitor der Deutschen Bahn. Dazu musste ein kleines Programm geschrieben werden, dass ein halbes Jahr lang einfach die Daten bei der Fahrplanabfrage absammelte. Erst dann war eine Visualisierung möglich. Alleine das Beispiel zeigt, dass das Aufwendige am Datenjournalismus das Sammeln der Information ist.
Ein weiteres sehr spannendes Projekt ist der Immobilienmonitor Hamburg. So etwas will ich schon lange selber umsetzen.
Ebenfalls sehr lustig: Marco Maas hat seine komplette Wohnung mit Sensoren ausgestattet. Etwas spooky – aber wem’s gefällt…
Wir haben dann ein bisschen mit Google Fusion Tables gespielt. Alle sind immer sehr begeistert davon, ich persönlich finde, es gibt Besseres.
Deshalb habe ich mich nicht lange damit aufgehalten und gleich mit CartoDB gearbeitet. Nicht ausprobieren konnte ich Tableau – werd ich aber noch.
Sehr praktisch bei CartoDB. Das Tool kann Shape-Dateien verarbeiten. So ist es zum Beispiel möglich, alle Grazer Stadtbezirke gewissen Daten zuzuordnen und das dann schön zu visualisieren. Hier die Feuerwehreinsätze des Jahres 2011:
Am zweiten Tag haben wir begonnen, mit Pivot-Tabellen zu arbeiten. Auch wenn Maas die Funktion von OpenOffice kritisiert hat, konnte ich recht gut damit arbeiten. Was Office angeht, ist Maas ein Microsoft-Purist. Ein nützlicher Tipp: Wenn man die pivotierten Datensätze sortieren will, ist es nützlich, sie in en Tabellenbereich zu kopieren. So werden die Originaldaten nicht irrtümlich durcheinandergebracht.
Was ich nicht kannte, ist der =Sverweis(GleicherDatensatz, bereich, ImportSpalte) – etwas sehr Praktisches, da man Datensätze so sehr leicht zusammenführen kann. Sehr hilfreich: Datenbereiche kann man in einer Tabelle extra benamsen.
Wir haben dann noch einen kleinen Ausflug zu „regular expressions“ gemacht und Maas hat uns gezeigt, wie man so sehr schnelle Suchabfragen machen kann. Allerdings muss ich da noch mal genauer reinschauen. Bei Opendatacity gibt’s ein Tutorial.
Alle Links und Hinweise sind in einem Pad gesammelt: https://pad.opendatacity.de/p/2015-kfj
Das Seminar wurde von meinem Arbeitgeber, der Kleinen Zeitung, bezahlt. Daher steht dieser Beitrag ausdrücklich NICHT unter Creative Commons Lizenz. Es gilt österreichisches Urheberrecht.