Datensammler in Zeiten der Pandemie
Frühjahr 2020: Covid-19 verbreitet sich rasant. Selten war die Gesellschaft so stark angewiesen auf aussagekräftige Daten – und selten waren diese so rar. Mitten im Lockdown machten sich einige Datenbegeisterte auf, die relevanten Zahlen zu finden, und bauten für die Schweiz ein Covid-19-Monitoring auf, das aktuelle und umfassende Daten zur Pandemie liefert. Eine derartige Zusammenarbeit zwischen verschiedenen Ämtern und dateninteressierten Privatpersonen ist in der Schweiz eine absolute Neuheit. Die Daten werden von vielen Medien genutzt. Wir haben mit Simon Graf vom Statistischen Amt des Kantons Zürich und mit Stefan Oderbolz von Statistik Stadt Zürich über dieses aussergewöhnliche Projekt gesprochen, das zeigt, was mit offenen Verwaltungsdaten möglich ist.
Stefan und Simon, Ihr seid Teil einer Gruppe, die ein Covid-19-Monitoring aufgebaut hat. Wie kam es dazu, dass Ihr diese Daten sammelt?
Stefan Oderbolz: Am Anfang stand ein Online-Hackathon Mitte März, zu dem das Statistische Amt des Kantons aufgerufen hatte. Es ging ganz einfach darum: Jetzt gibt es diese Krise, was können wir tun? Schnell merkten wir, dass es keine zeitnahen, verlässlichen Zahlen zur Pandemie gab. So haben wir begonnen, uns dafür zu engagieren. Am Anfang passierte noch sehr vieles «händisch». Wir mussten wirklich auf den Webseiten der verschiedenen Kantone die Zahlen holen. Im Verlaufe der Zeit hat sich dies immer mehr automatisiert.
Simon, was ist Deine Aufgabe beim Covid-19-Monitoring?
Simon Graf: Ursprünglich betrachtete unser ad hoc gebildetes Projektteam dieses Engagement als etwas rein Kurzfristiges. Wir hatten die Hoffnung, dass die Daten, die wir von den Kantonen sammeln und zur Verfügung stellen, früher oder später so vom BAG zur Verfügung gestellt würden. Dies ist bis heute nicht ganz der Fall. Jedenfalls haben wir irgendwann gemerkt, dass wir auf die Kantone zugehen müssen, wenn wir das Monitoring mit vertretbarem Aufwand betreiben wollen. Wir haben mit ihnen besprochen, wie sie die Daten besser zur Verfügung stellen können. Wir bereiten die Daten so auf, dass sie sich auch tatsächlich nutzen lassen, zum Beispiel von Medienschaffenden, Entwicklern und Akteurinnen der öffentlichen Hand selbst. Die Kontakte zu den verschiedenen Gesundheitsdirektionen oder zu den Stellen, die die Daten publizieren, mussten wir erst einmal herstellen. Das ist meine Aufgabe: die Koordination mit den Kantonen. Ich unterhalte diese Kontakte und versuche gute Beziehungen zu pflegen.
Wie funktioniert dies? Bist Du mit Eurem Anliegen offene Türen eingerannt, oder war es nicht ganz so einfach?
Beide lachen
Simon Graf: Ich will niemanden beschuldigen. Aber es war sicher nicht immer ganz einfach. Es gibt Kantone, die einen gewissen Anti-Zürich-Reflex haben. Ich bin ja selber aus St. Gallen, ich weiss, wie das ist. (schmunzelt) Ein paar wenige meinten vielleicht am Anfang, der Kanton Zürich wolle ihnen etwas vorschreiben, was absolut nicht die Idee ist. Da war dann ein wenig Überzeugungsarbeit gefragt. Und mit vereinzelten Kantonen gibt es immer noch keine Kooperation, da müssen wir uns einfach laufend anpassen, was uns relativ viel Arbeit macht. Es gibt aber auch viele andere, bei denen die Zusammenarbeit gut funktioniert. Gerade auch kleinere Kantone sind teilweise froh, wenn wir ihnen Tipps geben, wie sie ihre Webseite benutzerfreundlicher gestalten können. Die meisten finden, dass wir ihnen einen guten Service bieten. Was wir uns wünschen, ist ja auch nicht wahnsinnig kompliziert. Für uns wäre es einfach schön, wenn Dinge wie das Format, in dem die Daten angeboten werden, nicht jeden Tag ändern. Sonst muss Stefan dauernd Sachen flicken. Das ist einfach nicht besonders effizient.
Stefan Oderbolz: Der grösste Change war eigentlich, als viele Kantone unseren Vorschlag umsetzten und anfingen, strukturierte Formate wie Excel oder CSV zu benutzen. Die meisten hatten die Daten zuerst nur direkt auf der Webseite veröffentlicht. Es gibt solche, die die Excel-Datei jeden Tag aktualisieren, während andere dies nur einmal pro Woche tun. So oder so macht es uns dies einigermassen einfach, die Daten automatisiert zu beschaffen.
Simon Graf: Das war sicher der grösste «Lupf», den wir gemacht haben. Sobald wir die Kontakte zu den Kantonen hergestellt hatten, war dies das Erste, was wir erreichen wollten: dass alle die Daten gleichartig publizieren, wenn möglich als Excel-Datei. Und mittlerweile ist dies zu 80 Prozent der Fall. Ein Grossteil liefert auch Zeitreihendaten. Das ist wirklich toll. Auch Korrekturen, die halt mal vorkommen können, sind dadurch für alle Beteiligten leichter zu handhaben.
Stefan, was ist Deine Aufgabe beim Covid-19-Monitoring?
Stefan Oderbolz: Ich habe mir auf die Fahne geschrieben, die ganze Datensammlung zu automatisieren. Anfangs machten wir dies von Hand. Jeder hatte bei sich Skripts laufen lassen. Irgendwann stellte sich heraus, dass wir dies über Github ganz wunderbar automatisieren können. Jetzt läuft alle zwanzig Minuten ein Scraper (siehe Infobox zuunterst) für jeden Kanton. Diese Scraper pflege ich. Ich passe sie nötigenfalls an, überwache sie und schaue, dass die Daten sauber durchfliessen.
Wie muss man sich die Pflege dieser Scraper denn vorstellen?
Stefan Oderbolz: Wenn Spalten umbenannt oder Dateien verschoben werden, muss ich dies anpassen, damit die richtigen Daten eingelesen werden. Oder wenn wir sehen, dass ein Kanton seit fünf Tagen nichts mehr aktualisiert hat, schaue ich, ob alles in Ordnung ist und der Kanton wirklich nur einmal pro Woche publiziert oder ob es tatsächlich ein Problem gibt.
Wie viele Leute sind insgesamt am Covid-19-Monitoring beteiligt? Und was sind das für Leute?
Stefan Oderbolz: Das sind ziemlich viele Leute. Grosso modo gibt es zwei oder drei Gruppen. Da wären die Dateninteressierten, die mitgeholfen haben, Daten zu finden oder Scrapers zu schreiben. Wenn etwas schiefläuft, haben dies regelmässig Leute aus der Community bereits festgestellt und mir einen Reparaturvorschlag gemacht. Das sind die technikaffinen Leute. Dann gibt es die Gruppe, die mehr an den Visualisierungen interessiert ist. Diese Leute haben – basierend auf den Daten – eigene Visualisierungen gemacht, die zum Teil recht weit verbreitet sind. Am Anfang standen wir auch in intensivem Kontakt mit Datenjournalisten, die uns Feedback gaben, wenn etwas nicht funktionierte, oder die uns auf weitere spannende Variablen hinwiesen. Im Moment sind wir wohl acht oder neun Personen, die aktiv etwas machen. Aber zu Beginn waren es deutlich mehr Leute.
Viele Medien haben irgendwann begonnen, Eure gesammelten Daten zu verwenden, unter anderem SRF und die Neue Zürcher Zeitung. Wie haben diese von Eurem Angebot erfahren?
Simon Graf: Wir vom Statistischen Amt pflegen den Austausch zur Community der Datenjournalistinnen und Datenjournalisten. Zudem informieren wir über unser Datenangebot auf vielen Kanälen. Über Twitter haben sich diese Informationen schnell verbreitet. Am Anfang waren einfach wir diejenigen, die die aktuellsten Daten hatten. Dies ist jetzt nicht mehr per se der Fall. Das BAG publiziert jetzt ebenfalls täglich. Unser Vorteil ist im Moment vielleicht noch, dass wir sehr transparent machen, wie die Daten zustande kommen. Wir liefern auch Metadaten mit und publizieren die Daten als kantonale Zeitreihen. Dies ist sicher ein Mehrwert.
Stefan Oderbolz: Ja, und wir liefern zusätzliche Variablen wie Anzahl Personen in Quarantäne, die es so beim BAG noch nicht gibt.
Eine solche Zusammenarbeit zwischen den verschiedenen Verwaltungsstellen und interessierten Privatpersonen: Ist das typisch oder eher aussergewöhnlich?
Simon Graf: Ich arbeite noch nicht so lange beim Statistischen Amt des Kantons. Ich denke schon, dass es der heutigen Zeit entspricht. So sollte es funktionieren im Jahr 2020. Ich glaube aber nicht, dass dies heute schon überall der Fall ist. Mich freut auch, welche Arbeit alle im Projekt geleistet haben. Es gibt so viele Freiwillige, die einfach einen Nutzen schaffen wollten. Dies finde ich bemerkenswert. Diesen Leuten gilt ein grosser Dank. Die Daten-Community ist grundsätzlich motiviert, mitzuarbeiten und ihren Input einzubringen. Man muss einfach die Ohren offenhalten gegenüber diesen Stimmen. Wenn man dies macht, findet man gute Lösungen.
Stefan Oderbolz: Ich habe eine Zusammenarbeit in dieser Form noch nie erlebt. Ein wichtiger Erfolgsfaktor ist sicher unser Slack-Kanal. Ohne diesen wäre die Kommunikation sicher viel langsamer gewesen oder hätte nicht stattgefunden. Das ist die Plattform, über die wir uns über alle Amtsgrenzen hinweg austauschen. Wenn man eine Frage hat, ist die Wahrscheinlichkeit recht hoch, dass sie jemand innert nützlicher Frist beantwortet. Als es anfangs darum ging, die Datenquellen zu erschliessen, war es auch sehr wichtig, dass Regierungsrätin Jacqueline Fehr (Anmerkung: Vorsteherin der Direktion der Justiz und des Innern des Kanton Zürichs, wozu auch das Statistische Amt gehört) das Vorhaben voll unterstützte. Sie verfasste einen Brief, in dem sie die Kantone um Mithilfe bat. Da hat man wirklich gemerkt, dass unsere Idee auf höchster Ebene mitgetragen wird. Das war ein wichtiger Faktor.
Gibt es sonst noch etwas, was Ihr sagen möchtet?
Simon Graf: Es gibt viele Kantone, die jetzt ziemliche Fortschritte gemacht haben, zu neuen Erkenntnissen gelangt sind und diese im Rahmen ihrer Möglichkeiten umsetzen. Auch wir haben enorm viel gelernt und versuchen, das wertvolle Feedback der Nutzenden laufend anzuwenden. Ich wünsche mir, dass man sich noch stärker bewusst wird, welche Bedeutung Daten haben. Die Pandemie hat dies so stark wie noch nie deutlich gemacht. Darum wünsche ich mir, dass nicht nur weiterhin an der Qualität dieser Daten gearbeitet wird, sondern das Bewusstsein dafür wächst, dass Daten grundsätzlich nicht etwas sind, was geheim sein sollte. Dass sie publiziert werden sollen, sofern sie nicht besonders schützenswert sind. Und dass sie auch so publiziert werden, dass man sie weiterverwenden kann. Hoffentlich setzt sich auch die Einsicht durch, dass man auf die Nutzenden hört, dass man ihr Feedback einholt. Als öffentliche Verwaltung sind wir Dienstleister der Gesellschaft. Also haben wir auch darauf zu hören, was für ein Dienst von uns erwartet wird. Und dann haben wir diesen Dienst innerhalb unseres gesetzlichen Auftrages bestmöglich zu erbringen. Ich hoffe, dass wir in Zukunft weiter an diesem Dienstleistungsgedanken arbeiten können. Und dass wir noch stärker auf die Bedürfnisse der Nutzenden eingehen.
Das ist doch ein schönes Schlusswort.
Stefan Oderbolz: Das finde ich auch!
Was ist Data Scraping?
Ein Data Scraper ist ein Computerprogramm, das bestimmte Webseiten nach Daten absucht. Ein Programm sucht also beispielsweise kantonale Webseiten nach Wörtern wie «Anzahl Infizierte» oder «Neuansteckungen» ab und speichert die dazugehörige Zahl. Die auf diese Weise gewonnenen Zahlen werden danach an einem zentralen Ort zusammengeführt und zur Verfügung gestellt. Wenn sich auf der Webseite etwas ändert, funktioniert das Programm nicht mehr und muss wieder angepasst werden.