Linked Open Data (LOD) bezeichnet Daten mit einer offenen Lizenz, welche als Linked Data publiziert werden. Statistik Stadt Zürich stellt Daten als LOD zur Verfügung, was eine breitere Nutzung und Wiederverwendung der Daten ermöglicht.
Linked Data ist eine Methode, um Daten so aufzubereiten, dass sie sowohl für Menschen als auch für Maschinen verständlich und nutzbar sind. Ein Hindernis für Maschinen sind mehrdeutige Begriffe (so genannte Homonyme) wie «Bank» (die Sitzgelegenheit oder das Finanzinstitut?) oder «Zürich» (die Stadt oder der Kanton?). Durch die Anreicherung mit Kontext wird diese Unterscheidung für Maschinen erleichtert.
Dazu nutzt Linked Data die folgenden Kernelemente:
- Semantischer Information: Daten werden mit semantischer Information angereichert, um ihre Bedeutung explizit anzugeben. Damit werden mehrdeutige Begriffe für Maschinen (und Menschen) besser interpretierbar, was die Analyse und Interpretation der Daten erleichtert.
- Vokabulare und Ontologien: Die semantischen Informationen nutzen standardisierte Vokabulare und Ontologien, um die Verständlichkeit der Daten zu fördern.
- Graph-Datenbank statt tabellarischer Daten: Die Informationen werden in einem Netzwerkmodell gespeichert, statt in Zeilen und Spalten wie bei tabellarischen Daten. Jede Einheit in diesem Netzwerk wird durch eine eindeutige URI (einen Identifikator) repräsentiert.
- Datenformat: Die Daten werden im RDF-Format (Ressource Description Framework) abgelegt, einem offenen, nicht-proprietären Format, das für Maschinen leicht lesbar ist.
- Verknüpfung mit weiteren Datenbeständen: Ein zentrales Element von Linked Data ist die Verknüpfung mit weiteren Datenbeständen wie Wikidata. Die Verwendung von URIs fördert die Interoperabilität der Daten und bricht klassische Datensilos auf.
Aufgrund der guten Interoperabilität bilden Linked Data die Basis für verschiedene Datennutzungen. Zudem können sie mit der Abfragesprache SPARQL abgerufen und mit anderen Datenquellen verknüpft werden. Ein SPARQL-Editor steht hier zur Verfügung: https://ld.stadt-zuerich.ch/sparql/, der technische Endpunkt ist über https://ld.stadt-zuerich.ch/ erreichbar.
Wichtige technische Grundlagen für Linked Data sind eindeutige Identifikatoren (URIs), das Ressource Description Framework (RDF) sowie die Abfrage SPARQL. Entwicklungen bei RDF und SPARQL werden von einer Arbeitsgruppe des World Wide Web Consortium (W3C) koordiniert.