Vom Kreisbüro zum Kreisdiagramm: Wie entsteht unsere Bevölkerungsstatistik?
Täglich werden dem Personenmeldeamt Hunderte von Ereignissen gemeldet. Deren weiterer Weg bis hin zu unserer Bevölkerungsstatistik ist kompliziert. Wir erklären ihn hier verständlich. (28.03.2019)
Woher weiss Statistik Stadt Zürich eigentlich, wie viele Personen in der Stadt wohnen? Wie viele geboren werden, wie viele sterben? Wer zuzieht und wer wegzieht? All diese Angaben melden Sie, die Stadtzürcherinnen und Stadtzürcher, Ihrem Kreisbüro – vor Ort oder auch online. Doch es ist ein langer Weg von Ihrer Umzugsmeldung zu unserer Umzugsstatistik.
Schritt 1: vom Kreisbüro zu Statistik Stadt Zürich
Im Kreisbüro vermerkt die Sachbearbeiterin veränderte Daten im System. Sei es eine neue Adresse, ein zusätzliches Kind oder ein neuer Nachname. Und dies nicht einmal, sondern Hunderte Male täglich!
Die mutierten Daten fliessen automatisch in eine grosse Datenbank, in der die gesamte städtische Bevölkerung mit zahlreichen Attributen vermerkt ist. Nennen wir dies die Quelldatenbank des Personenmeldeamts. Für jede Person sind somit die Nationalität, das Zuzugsdatum, das Geburtsdatum, die jetzige und vorherige Adresse inklusive amtlicher Wohnungsnummer, die Personenidentifikationsnummer, der Name und weitere Angaben enthalten. Diese Daten müssen auf die eine oder andere Art anonymisiert zu uns gelangen. Doch wie funktioniert das genau?
Jede Nacht läuft die Bevölkerungsstatistik-Applikation BVS6, welche neue Daten vom Personenmeldeamt holt, automatisch Personenbewegungen berechnet und die aufbereiteten Daten an das Data-Warehouse von Statistik Stadt Zürich liefert. Bewegungen werden berechnet? Ja, genau! Das Bevölkerungsamt liefert nämlich nicht fixfertige Daten nach diesem Muster ab: «Frau Meier ist von der Weststrasse 99 an die Europaallee 5 gezogen.» Vielmehr läuft Folgendes ab: Am Montag steht in der Datenbank noch «Frau Meier, Weststrasse 99», am Dienstag dann «Frau Meier, Europaallee 5». Die BVS6-Applikation vergleicht nun die beiden Einträge für Frau Meier und stellt fest, dass sie an gewissen Stellen nicht mehr übereinstimmen. Da sich in diesem Fall die Adresse geändert hat, erkennt das System, dass es sich um einen Umzug handelt. Das passiert natürlich auch bei anderen Bewegungen: Geburten, Todesfällen, eingetragenen und aufgelösten Partnerschaften, Eheschliessungen, Ehescheidungen, Zuzügen und Wegzügen.
Die Daten werden ausserdem in der BVS6 mit diversen externen Daten angereichert. Beispielsweise erhalten wir bei einem Todesfall die genaue Sterbeörtlichkeit oder auch Angaben über einen nicht in Zürich wohnhaften neuen Ehepartner. Diese Daten können von anderen städtischen Dienstabteilungen oder von Bundesämtern stammen.
Es ist wichtig, dass alle Daten konsistent und fehlerfrei erfasst werden. Für die Erfassung von Daten in der BVS6 gibt es daher ein Regelwerk, das 140 Seiten umfasst. Typische Fehler werden somit gleich zu Beginn abgefangen. Ein Beispiel: Frau Meier hat ein neues Hochzeitsdatum, doch ihr Zivilstand steht auf «geschieden». Oder: Frau Meier ist gemäss System über 110 Jahre alt. In solchen Fällen gibt es dann eine Fehlermeldung beziehungsweise Warnung, damit die Daten manuell geprüft und gegebenenfalls angepasst werden können.
Zusätzlich führt das Datenmanagement-Team täglich detaillierte Bilanztests durch. Hierfür wird der Jahresanfangsstand samt Bewegungen im laufenden Jahr mit dem heutigen Stand verglichen. Das bedeutet einfach gesagt:
Bestand Jahresanfang + Geburten – Sterbefälle + Zuzüge – Wegzüge = Endbestand.
Wenn hier eine Differenz auftaucht, heisst es: Fehler suchen und beheben.
Schritt 2: von Statistik Stadt Zürich an die Öffentlichkeit
Sie als Endnutzerinnen und -nutzer sehen nicht die einzelnen Einträge in der Datenbank, sondern aggregierte Statistiken. Viele Bevölkerungsstatistiken werden bei uns monatlich, andere jährlich aktualisiert.
Wir programmieren die Berechnung dieser Statistiken nicht jedes Mal neu. Das würde zum einen Ressourcen verschwenden und wäre zum anderen fehleranfällig. Stattdessen haben wir alle diese Standardauswertungen mit einem eigens entwickelten Framework so weit automatisiert, dass sie grösstenteils von selbst erstellt werden. Unser Tool produziert also vor jeder Aktualisierung automatisch die wichtigsten Bevölkerungszahlen. So haben wir mehr Kapazität, die Daten genau zu studieren und uns sinnvolle und verständliche Darstellungsarten zu überlegen, sodass die Daten für Sie intuitiv aufbereitet werden können.
Schritt 3: die Bevölkerungsstatistik als Einstieg in eine grosse Datenwelt
Das Analysieren der Bevölkerungsdaten allein ist schon spannend und komplex. Richtig interessant wird es aber, wenn wir die BVS6-Daten mit unseren anderen Datenquellen verknüpfen! In der Bevölkerungsstatistik erhält jede Person eine zufällige, anonymisierte ID. Diese und weitere Merkmale braucht es, um die Person mit anderen Datenquellen, zum Beispiel mit dem Gebäude- und Wohnungsregister, zu verknüpfen.
Heute publizieren wir den ersten Teil der detaillierten Bevölkerungsdaten 2018. Über vierzig Excel-Tabellen und fast dreissig Grafiken wurden neu erstellt, geprüft und auf unsere Webseite hochgeladen. Zusätzlich publizieren wir rund vierzig OGD-Datensätze. Schauen Sie bei unserem riesigen Datenschatz vorbei!