Ein zentraler Datenkatalog der Verwaltung - eine Utopie?

Ein zentraler Datenkatalog der Verwaltung - eine Utopie?

Seit Ende 2017 veröffentlicht die Landeshauptstadt Düsseldorf Open Data auf der Plattform opendata.duesseldorf.de. Wichtig war dabei von Beginn an, eine breite Spanne an Daten zu präsentieren, mit der auch dokumentiert werden sollte, welche unterschiedlichen Aufgaben eine Stadtverwaltung hat und welche unterschiedlichen Daten dabei anfallen. So kamen mittlerweile 211 Datensätze aus 19 Fachämtern zusammen und der Ausbau geht weiter.

Das OpenData-Team der Landeshauptstadt Düsseldorf hat im Rahmen einer Bachelorarbeit einen Interviewleitfaden entwickelt, der bei Erstgesprächen mit Fachämtern eingesetzt wird, um systematisch in den Fachbereichen nach Daten zu suchen, die sich zur Bereitstellung im Open-Data Portal eignen. Bereits bei der Entwicklung des Leitfadens  wurde diskutiert, inwieweit ein zentraler Katalog aller Daten der Stadtverwaltung die Akquise für Open Data erleichtern würde. Aber schon die  Anzahl der eingesetzten Fachverfahren und darüber hinaus die Anzahl individuell eingesetzter Lösungen, die auf Dateien aus einem Tabellenkalkulationsverfahren wie Excel basieren, ließ schnell erahnen, dass das kein leichtes Unterfangen ist.

Hinweis am Rande: Auch das Open-Data-Team Düsseldorf führt parallel zum Portal eine Tabelle, in der alle veröffentlichten Datensätze und Ressourcen dokumentiert und Aktualisierungsfristen nachgehalten werden, da das DKAN-Portal bislang keine automatisierten Auswertemöglichkeiten bietet.

Ist es überhaupt möglich und sinnvoll, an einer zentralen Stelle systematisch alle Daten zu beschreiben, die in der Stadtverwaltung erhoben und gepflegt werden? Diese Überlegungen sind ja nicht Düsseldorf-spezifisch, also haben wir bei unseren Kolleginnen und Kollegen in anderen Kommunen nachgefragt. Per E-Mail haben wir uns an 84 Städte und Einrichtungen in Deutschland gewandt. Dabei lag der Fokus auf Kommunen mit mehr als 100.000 Einwohnern, die ein Open-Data-Portal bzw. ein Geo-Informations-Portal betreiben. Auch ein kommunales Rechenzentrum, das für seine Verbandsmitglieder Open Data bereitstellt, und die österreichischen Städte Linz und Wien haben wir nach Erfahrungen zum Thema Datenkatalog gefragt.

Ganz konkret wollten wir wissen:

  • Welche Tools und Werkzeuge nutzen Sie, um einen Überblick über die Daten Ihrer Verwaltung zu erhalten?
  • Wie spüren Sie die für Ihr Portal relevanten Daten auf und etablieren dann einen Arbeitsablauf, der zur Veröffentlichung und weiteren Pflege der entsprechenden Ressource führt?

Von 63 Kommunen haben wir eine Rückmeldung erhalten. Bei der überwiegenden Zahl der Rückmeldungen zeigt sich, dass in den Kommunen kein Datenkatalog existiert. Lediglich 12 Städte haben eine tabellarische Aufstellung mit einer systematischen Betrachtung der Daten, die in ihrem Portal veröffentlicht sind. Zwei Städte haben ihr Portal sogar wieder ganz oder teilweise eingestellt.

Aus den Antworten wird deutlich, dass die Kommunen im Regelfall mit eher unstrukturierten Datenlandschaften und vielen ganz unterschiedlichen Datenquellen umgehen müssen. Eine der häufigsten Rückmeldungen war daher wenig überraschend „Wir haben keinen zentralen Datenkatalog, finden die Idee aber spannend und sind sehr am Ergebnis der Umfrage interessiert.“

Nichtsdestotrotz gibt es etliche Ansätze, die bereits in Kommunen praktiziert werden. Dazu zählen:

  • systematische Auswertungen des städtischen Internetauftritts mit dem Ergebnis einer Auflistung der zum Download angebotenen Informationen
  • Umfragen und Befragungen zu offenen Daten in den Fachbereichen der Verwaltung
  • Datenbankabfragen aus Fachverfahren

In der Regel wurden die Ergebnisse als nicht sehr befriedigend eingestuft. Auswertungen von Datenbanken liefern z. B. keine Einsichten in Datensammlungen, die auf Tabellenkalkulationsprogrammen basieren. Nicht immer sind alle Speicherorte im Zugriff der IT-Abteilungen. Umfragen und Befragungen werden oftmals nicht in der wünschenswerten Qualität beantwortet. Möglicherweise führt die Angst vor zusätzlichen Aufgaben und das mangelnde Wissen über Open Data zu vagen Antworten in diesem Zusammenhang.

Kein Datenkatalog im engeren Sinne, aber ein hilfreiches Werkzeug zum Datenmanagement kann möglicherweise das auf Semantic Mediawiki basierende OGD-Cockpit sein, das unter anderem von der Stadt Bonn zusätzlich zum Open-Data-Portal eingesetzt wird.

In einigen Städten wie Freiburg und Dortmund ist die Statistikplattform DUVA Grundlage für Open Data und ermöglicht je nach Organisationsmodell eine zentrale Datenhaltung bestimmter Einzeldaten, z. B. Bevölkerungsdaten, für unterschiedliche Zwecke.

Was bedeutet das für die Idee des zentralen Datenkatalogs?
Aufgrund unserer eigenen Erfahrungen und den Rückläufen aus den anderen Kommunen werden wir die Idee aktuell nicht weiterverfolgen. Zumindest auf kommunaler Ebene muss die Vielzahl und unterschiedliche Architektur der eingesetzten Verfahren berücksichtigt werden. Wir werden uns sicher im kommenden Jahr mit den Möglichkeiten des OGD-Cockpits beschäftigen und wir prüfen gemeinsam mit anderen Anwendern der DKAN-Plattform, die durch die Stadt Köln bereitgestellt wird, inwieweit automatisierte Berichte realisiert werden können. Was uns gut gefallen hat, war ein Vorschlag aus Chemnitz, bei der Einführung der E-Akte in den jeweiligen Metadaten ein Feld vorzusehen, das den Inhalt als Open Data kennzeichnet und nach dem gefiltert werden kann.

Und natürlich führen wir auch unsere eigene Tabelle weiter.

Kommentare

Mit dem erwähnten OGD-Cockpit ist es durchaus möglich, einen gesamten Datenkatalog zu verwalten, allerdings nicht unbedingt zentral, sondern durchaus dezentral, da die verschiedenen Ämter oder Abteilungen gemeinsam die Informationen über den Datenstand einpflegen können.

Bonn geht hier sehr weit und bietet das OGD-Cockpit auch für BürgerInnen im Internet einsehbar an. Das ist ein möglicher Use-Case, die Erfahrung mit vielen Verwaltungen zeigt aber, dass die Idee eher wäre, ein OGD-Cockpit rein intern zu betreiben. Hier könnten dann auch interne Anmerkungen über den Status eines Datensatzes oder Begründungen, warum ein Datensatz NICHT veröffentlicht werden kann, hinzugefügt werden.

Ein Datenverzeichnis über alle erfassten Daten könnte jederzeit auch aus dem OGD-Cockpit exportiert werden, da es viele Exportformate und eine API gibt.

Man kann den schon etwas älteren Umsetzungsstand z. B. auch hier sehen: https://www.ogdcockpit.eu/Testdatensatz_Schulstandorte,_Pendlerstatistik...

Die Idee ist, dass man in der internen Vorbereitsungsphase natürlich nicht alle Metadaten schon erfassen muss, aber die, die man intern benötigt sollten natürlich schon so erfasst werden, dass sie möglichst kompatibel zu den OGD-Metadatenstandards sind. Im Falle der Veröffentlichung können diese Metadaten dann an ein Datenportal weitergereicht werden.

Im Beispiel ist der österreichische Metadatenstandard (unterteilt in den verpflichtenden "Metadatenkern" und die optionalen "weitere Metadaten") abgebildet. Eine DCAT.AP.de-Kompatible Version steht ab Q1/2020 zur Verfügung.

Eine dem DCAT.AP-de-Standards nähere Version wurde als Prototyp hier umgesetzt: http://lippe.ogdcockpit.eu/Testkommune:Zweiter_Testdatensatz

Neuen Kommentar schreiben

You must have Javascript enabled to use this form.