#DDJ

Tipps, Tools und Links für Datenjournalisten

Daten...WTF?

Datenjournalismus = Journalismus. Mit Daten.

Was Datenjournalismus ist? Darüber haben sich schon einige Spezialisten die Köpfe eingeschlagen. Aber wie Pionier Adrian Holovaty bereits sagte: «Who cares? Sollen sich meine Konkurrenten doch noch lange darüber streiten und ihre Zeit verschwenden.»

An dieser Stelle reicht es, wenn ihr euch denkt: Journalismus bedeutet gemeinhin, den Fokus auf den einzelnen Menschen zu legen. Datenjournalismus hingegen versucht, mit Hilfe von technischen Mitteln, die Hubschrauber-Perspektive auf ein Thema zu kriegen - durch das Sammeln und Analysieren von Daten, und das Erzählen daraus gewonnenen journalistischen Erkenntnissen und Geschichten.

Wer trotzdem eine Einführung mag: dieses Video fasst den aktuellen Stand gut zusammen.

Tipps

Bulletproof your data

18 Schritte, um deine Daten zu verifizieren (Inspiriert von ProPublica)

1. Sei dir im Klaren darüber, woher die Daten kommen. Welches ist die Datenquelle?

2. Beschaffe dir ähnliche oder gleiche Daten aus anderen Quellen und vergleiche.

3. Besprich das Thema mit Experten, die unterschiedliche Standpunkte einnehmen.

4. Such ähnliche Beiträge und untersuche, was dort gemacht wurde.

5. Verlange die Fragebogen, mit denen die Daten erhoben wurden. Erkundige dich nach dem methodischen Vorgehen. Falls die Urheber diese Informationen verweigern, müssen bei dir die Warnlampen leuchten.

6. Hüte dich vor Daten, die mit unwissenschaftlichen Methoden erhoben wurden. Dazu gehören: Internet-Analysen, Strassenumfragen oder andere handgestrickte Datensammlungen.

7. Lies wissenschaftliche Berichte zum Thema.

8. Zeige wesentliche Ergebnisse mit Bezug zum Kern der Geschichte.

9. Bau ein konsistentes Archiv mit Daten und Anwendungsfällen auf. Falls das Archiv verändert wird, schreiben sie auf, falls einige Aufzeichnungen einbezogen oder weggelassen wurden.

10. Gib dir genug Zeit, die nötigen Daten zu sammeln, bevor du mit dem Schreiben der Geschichte beginnst.

11. Wenn du eine eigene Datenbank für ein Projekt aufgebaut hast, bei der Informationen später aktualisiert werden müssen oder sich ändern, dann setz ein Enddatum und nimm keine Änderungen mehr vor, außer es gibt inakkurate Daten oder neue Informationen, die die Aussage der Story ändern.

12. Formuliere eine alternative Abfrage, die eigentlich die gleichen Werte ergeben sollte – und schau ob das auch so ist.

13. Lass deine Resultate von einer fachkundigen Drittperson vor der Publikation überprüfen.

14. Gegebenenfalls auch von den Personen oder Organisationen, um die es in der Geschichte geht.

15. Überprüfe überraschende Resultate. Nicht selten entpuppen sie sich als Fehler – andernfalls stecken Geschichten dahinter).

16. Setze deine Daten in einen Gesamtzusammenhang.

17. Wenn es möglich ist, Daten real zu überprüfen, zum Beispiel in einem Archiv, dann tu das.

18. Vertraue deinem Bauchgefühl. Wenn etwas nicht richtig zu sein scheint, dann ist es wahrscheinlich auch nicht richtig.

Zusatz: Tool Dataproofer einsetzen.

Tools

Eigentlich gilt die Regel: Umso weniger Tools, desto besser. Von den hunderten, die es gibt, kann ich folgende empfehlen.

Charts: Datawrapper, Highcharts, Chartbuilder, RAW

Karten: Carto, Storymap, QGIS

Daten säubern: Open Refine, R-Studio, Comma-Chameleon, RegEx

Daten aus PDFs befreien: Tabula, Comet Docs, Abbyy Finereader

Daten analysieren: R-Studio, Exploratory, CSVkit, Agate

Besser Arbeiten mit Programmier-Tools: Github ist der Spielplatz vieler Nerds und Datenjournalisten. Unverzichtbar für Teamarbeit! Hier gibt es eine gute Schulung dazu. Sublime Text 2 ist ein beliebter Code-Editor. Und wer gleich mit Programmieren anfangen will: Timo Grossenbachers Sammlung .RDDJ bietet eine Übersicht in den Einstieg mit R; bei der Codeacademy kann man verspielte, praktische Lernkurse besuchen. Empfohlen für Journalisten: Python und Javascript.

Datenquellen

Neue und alte Recherchewerkzeuge

Weltweit öffnen sich immer mehr Datenarchive für die freie Nutzung. Die heutige Portale machen es deutlich leichter als früher, Daten zu finden. Allerdings sind alle Plattformen anders organisiert. Es braucht Beharrlichkeit und Erfahrung, um in der Fülle relevante Informationen zu finden.

Telefon

Um das keinesfalls zu vergessen: Oft besteht der schnellste und beste Weg die jeweilige Quelle einfach anzurufen und dort nach Daten, zusätzlichen Zeitreihen, anderen Erhebungen, etc. zu fragen. Auf diesem Weg findet man mitunter auch Informationen, die nicht im Web veröffentlicht wurden und wird von Profis unterstützt

A-Quellen

Zu den A-Quellen mit einer hohen Qualität und einem großen Angebot zählen weltweit tätige Organisationen und natürlich die nationalen Statistik-Ämter. Bitte nicht erwarten, dass wirklich jede Statistik selbst bei diesen Quellen absolut exakt ist. Das liegt oft daran, das z.B. für die Lebenserwartung aggregierte Daten aus aller Welt zusammen gezogen werden und sich dann doch Verzerrungen einschleichen können. Dennoch: Bessere und genauere Daten gibt es nicht, daher die Bezeichnung A-Quellen.

Hier, ohne Anspruch auf Vollständigkeit, eine kurze Auflistung besonders wichtiger Datenquellen:

OECD

Worldbank

IMF

UN

Google Public Data

Nation Master

Eurostat


Datenquellen Schweiz

Städte/Gemeinden: Grundsätzlich: Gemeindeschreiber oder (wenn vorhanden) Medienstellen anfragen. Städte wie z.B. Zürich haben eigene Datenportale.

Kantone: Liste aller kantonalen Statistik-Ämter.

Geographische Daten der Schweiz: Swisstopo. Ein immenser Fundus an geografischen Daten und zahlreichen Tools etwa zum Umrechnen von Koordinaten. Wer sich dort als Journalist meldet, bekommt gratis Zugang zum “Geodatenabo Pro”, mit hochauflösenden Karten und einer Reihe qualitativer Datensätze wie beispielsweise die Schweizerische Arealstatistik oder die aktuellen Landes-, Kantons-, Bezirks- und Gemeindegrenzen.

Über diese Seite

Diese Seite ist eine Kompilation an nützlichen Tipps, Tools und Links für Datenjournalisten. Sie wird von Julian Schmidli unterhalten und unter anderem für Schulungszwecke gebraucht.

Inspiration für diese Seite sind, neben bereits angegebenen Quellen:

ProPublicas Guide to Bulletproofing Data