Open Data

Der freie Zugang zu und die breite Nutzung von Datenbeständen leisten einen wichtigen Beitrag zur Weiterentwicklung einer Wissensgesellschaft und bilden eine wichtige Säule für die Digitalisierung der Wirtschaft und der Gesellschaft. Open Data in Politik und Wirtschaft sowie der freie Fluss von Daten in Behörden und Unternehmen werden die notwendige Entwicklung in allen Bereichen der Digitalisierung fördern. Der Umgang mit Daten wird zu einem Wettbewerbsfaktor, zumal die Corona-Pandemie den Bedarf an Open Data verstärkt hat.

Die Nutzung von Open Data kann auch das Vertrauen zwischen Politik und Zivilgesellschaft, zwischen Verwaltung, Wirtschaft und Medien stärken. Open Data haben ebenfalls das Potenzial, die Wirtschaft eines Landes anzukurbeln und gesellschaftlichen und politischen Wandel herbeizuführen. Mit Open Data kann die Transparenz in der öffentlichen Verwaltung erhöht und die Beteiligung der Gesellschaft an Entscheidungsprozessen gestärkt werden. Darüber hinaus sind Open Data die Grundlage für Innovation und Wachstum in Unternehmen. Und nicht zuletzt lassen sich mit Open Data digitale Ökosysteme kreieren. 

In der Regel werden Open Data von öffentlichen oder gemeinnützigen Einrichtungen bereitgestellt. Doch auch privatwirtschaftliche Unternehmen spielen eine Rolle in der Open-Data-Bewegung, obwohl die Zahl der Unternehmen im deutschsprachigen Raum, die eigene Daten als Open Data veröffentlichen, noch verhältnismäßig gering ist. Es handelt sich dabei vor allem um Betreiber öffentlicher Infrastruktur, zum Beispiel Verkehrsbetriebe und Stadtwerke.

Im kulturellen Kontext entspricht Open Data der Philosophie, Wissen mit so vielen Menschen wie möglich zu teilen. Im politischen Kontext unterstützen Open Data den Ansatz von Transparenz und Bürgerbeteiligung.

Was sind Open Data?

Das Open Data Handbook der Open Knowledge Foundation, einer internationalen Non-Profit-Organisation zur Verbreitung von Wissen, definiert Open Data so: „Offene Daten sind Daten, die von jedermann“ durch den Einsatz offener Nutzungsrechte „frei benutzt, weiterverwendet und geteilt werden können. Die einzige Einschränkung betrifft die Verpflichtung zur Nennung des Urhebers.“

Open Data sind primär Rohdaten: Wetterdaten, Geodaten, Umweltdaten, Verkehrsinformationen, Statistiken und medizinische Forschungsergebnisse. Diese Daten dienen unter anderem der Erfüllung staatlicher Aufgaben und sind von öffentlichem Interesse. Personenbezogene Daten dürfen nicht als Open Data bereitgestellt werden.

Als Standard für Open Data gelten die zehn Prinzipien der Sunlight Foundation: leichte Zugänglichkeit, Maschinenlesbarkeit, Vollständigkeit, Diskriminierungsfreiheit, Verwendung offener Standards, Primärquellen, Aktualität der Daten, Lizenzierung, Dauerhaftigkeit und Nutzungskosten.

Das Open Data-Konzept ist im akademischen Bereich nicht neu und ähnelt den Konzepten von Open Access, Open Content und Open Source.

Anfänge von Open Data

Die Anfänge der „Open Community“ gehen auf die Firma Netscape zurück. Ende der 1990er Jahre legte diese den Quellcode des hauseigenen Internet-Browsers offen, was damals einer technischen Revolution glich. Open Source, ein Ableger des heutigen Lizenz-Chaos, war geboren. Kurz darauf wurde die Open-Source-Initiative (OSI) gegründet, welche erstmals eine Open-Source-Definition veröffentlichte.

Der eigentliche Begriff „Open Data“ tauchte erstmalig 1995 in einem Dokument einer amerikanischen Agentur auf. Dabei ging es um die Offenlegung von geophysikalischen und Umweltdaten.

Gesetzliche Rahmenbedingungen von Open Data

Rechtliche Rahmenbedingungen für Open Data wurden in Deutschland mit dem Gesetz zur Förderung der elektronischen Verwaltung geschaffen, um beispielsweise datenschutzrechtliche Hürden bei der Bereitstellung der Daten zu vermeiden. Insbesondere wenn Unternehmen Open Data auch kommerziell nutzen wollen, stellen sich der Geschäftsführung schließlich Fragen zur Datensicherheit und möglichen lizenzrechtlichen Problemen. Um Lizenzprobleme zu vermeiden, schafft unter anderem die Datenlizenz Deutschland Klarheit.

Eine 2017 verabschiedete Änderung des E-Government-Gesetzes verpflichtete die Bundesverwaltung elektronisch erhobene Daten standardmäßig unentgeltlich als Open Data bereitzustellen. Damit wird eine Forderung aus der Digitalen Agenda der Bundesregierung erfüllt.

Open Data ist auch Teil der Hightech-Strategie 2025 der Bundesregierung, die unter anderem das Ziel verfolgt, die Möglichkeiten von Open Access, Open Science, Open Data und Open Innovation umfassender zu nutzen.

Merkmale von Open Data

Der Grad der Offenheit von Datensätzen kann anhand des „Fünf-Sterne-Modells“ von Sir Tim Berners-Lee veranschaulicht werden:

Fünf-Sterne-Modell
kein Stern
Daten im Web (Format egal), ohne offene Lizenz
1 Stern
Daten im Web (Format egal), mit offener Lizenz
2 Sterne
Daten in strukturiertem Format (z. B. Excel)
3 Sterne
Daten in strukturiertem, nicht proprietärem Format (z. B. csv statt Excel)
4 Sterne
Verwendung von eindeutigen URLs, sodass Datensätze verlinkt werden können
5 Sterne
Verlinkung der eigenen Daten mit anderen Daten, um Kontext herzustellen

Verfügbarkeit und Zugriffsmöglichkeit

Open Data stehen in einem zweckmäßigen und bearbeitbaren Format frei zur Verfügung, bevorzugt als Download aus dem Internet.

Verarbeitung und Weitergabe der Daten

Open Data erlauben eine Verarbeitung, Weitergabe und Zusammenführung mit anderen Datensätzen. Die Daten müssen maschinenlesbar sein.

Universelle Partizipation

Jeder darf Open Data nutzen, verarbeiten und weitergeben. Es darf keine Diskriminierung gegenüber Anwendungsbereichen, Personen oder Gruppen geben. Es darf ebenso keine Einschränkung der Verwendung der Daten geben (zum Beispiel begrenzt auf nicht-kommerzielle Anwendung).

Zahlen und Fakten

Die Studie Open Data. The Benefits – Das volkswirtschaftliche Potential für Deutschland der Konrad-Adenauer-Stiftung besagt, dass Open Data helfen können, jährlich einen volkswirtschaftlichen Mehrwert von 43,1 Milliarden Euro und 20.000 Arbeitsplätze in Deutschland zu schaffen.

Die Capgemini-Studie The Economic Impact of Open Data – Opportunities for Value Creation in Europe geht von einem Marktwert offener Daten zwischen 199 und 334 Milliarden Euro im Jahr 2025 aus.

Open-Data-Beispiele

Zu den bekanntesten Open Data zählt die Online-Enzyklopädie Wikipedia. Ein Paradebeispiel ist zudem das Smartphone, auf dem zahlreiche Apps verdeutlichen, welche Lösungen für den Alltag aus offenen Daten entstehen können (zum Beispiel Fahrplanauskunft im öffentlichen Nahverkehr).

Das offene Datenportal der EU ist Kernbestandteil der EU-Strategie für Open Data. Es bietet zentralen Zugang zu Daten von Institutionen, Agenturen und sonstigen Einrichtungen der EU und fördert deren innovative Nutzung sowie die Freisetzung ihres wirtschaftlichen Potenzials.

Auch in Deutschland wurde ein zentrales Datenportal für Open Data geschaffen. Es bietet einen einheitlichen, zentralen Zugang zu Verwaltungsdaten aus Bund, Ländern und Kommunen für Unternehmen und Privatpersonen.

Eine weitere Anwendung ist Visualize No Malaria, welche die Bereitstellung von Gesundheitsdaten zur aktuellen Verbreitung von Malaria-Infektionen vereinheitlicht und mit offenen Geodaten kombiniert. Diese Initiative hatte durch den Einsatz von Open Data eine positive Auswirkung auf 1,8 Millionen Menschenleben.

Ein weiteres Beispiel bildet eine Anwendung, welche den Energieverbrauch öffentlicher Gebäude mit den offenen Standort- und Wetterdaten kombiniert, um die optimale Ausrichtung von Solarpanels zu ermitteln. Diese Initiative ebnete Helsinki den Weg zur CO₂-neutralen City.

Open Data in verschiedenen Sektoren

In der Landwirtschaft wird Open Data eingesetzt, um die Ernte zu verbessern und die wachsende Bevölkerung ernähren zu können. Im öffentlichen Sektor hilft Open Data Regierungen, die Effizienz ihrer öffentlichen Dienste zu steigern und damit bessere lokale Dienstleistungen zu erbringen, das Vertrauen der Bürger aufzubauen und das Engagement der Bürger im politischen Prozess zu stärken. Open Data wird als Katalysator für die digitale Transformation in der Verwaltung eingesetzt.

Die Nutzung von Open Data setzt einen Paradigmenwechsel und Kulturwandel in Wirtschaft und Verwaltung voraus. Es gilt, Open Data in laufende Arbeitsprozesse zu integrieren und dabei den Zusatzaufwand möglichst gering zu halten. Dies ist mit einem durchdachten Konzept möglich, welches die technischen und organisatorischen Rahmenbedingungen sowie die kommunikative Begleitung der damit einhergehenden Veränderungen einbezieht. Denn der Nutzen von Open Data hängt davon ab, wie stark Wissen und Bewusstsein zum Umgang mit Open Data unternehmensintern verankert werden.

Potenziale von Open Date für Startups und Unternehmen

Open-Data-Kompetenz ist eine entscheidende Fähigkeit jedes Unternehmens, welches sich an eine stets verändernde Umwelt anpassen möchte. Um Mehrwert zu generieren und damit Wissen zu vermehren, müssen Open Data auch in Anwendungen genutzt werden, um durch neue Impulse und das Verknüpfen mit anderen Datenquellen innovative Produkte, Dienstleistungen und Anwendungen und andere Formen der Wertschöpfung zu entwickeln. 

Die Bereitstellung von Open Data ermöglicht es Startups sowie großen und kleinen Unternehmen, dauerhaft aktiv an Problemlösungen und Neuentwicklungen mitzuwirken, die Effizienz zu steigern, Wettbewerbs- und Standortvorteile auszubauen, Prozesse zu optimieren und Einsparungspotenziale zu identifizieren. Für Startups ist es zudem möglich, Geschäftsideen mit dem Erheben von Open Data zu entwickeln. So können beispielsweise Unternehmenskunden ihre Daten im Rahmen des Crowdsourcing als Open Data zur Erhöhung der Transparenz zur Verfügung stellen.

Potenziale von Open Data für Einzelpersonen

Die Bürger profitieren vom Transparenzgedanken der Verwaltung und Politik als auch von der Wirtschaftsförderung durch Open Data. Der Gesellschaft kann Open Data zugute kommen, weil es Menschen hilft, beispielsweise ihre Mobilität und Arbeitsweise zu verbessern und die Welt, in der wir leben, besser zu verstehen.

Open Data informiert Menschen über Schlüsselthemen und unterstützt eine sachkundigere Debatte über kulturelle Themen.

Herausforderungen bei der Verwendung und Veröffentlichung von Open Data

Eine direkte Beziehung von Open Data zu unternehmensinternen Kundendaten herzustellen, ist nur bedingt möglich. Zudem sind zeitliche Verfügbarkeit und Aktualität der Open Data eingeschränkt. Sollen Open Data als Ergänzung für unternehmensinterne Analysen verwendet werden, ist das Wissen über diese Einschränkungen zwingend.

Darüber hinaus werden die Organisation und Vorbereitung der Open Data für eine Veröffentlichung oft als zeitaufwändig wahrgenommen, gekoppelt mit einer mangelnden Anerkennung dieses Einsatzes.

Pro- & Kontra-Argumente für Open Data

Das stärkste Pro-Argument für Open Data ist die vielvertretene Ansicht, dass alle Daten den Menschen gehören.

Ein weiteres Pro-Argument ist die Förderung der Forschung, wenn wissenschaftliche Erkenntnisse für alle Forscher frei zugänglich sind.

Weiterhin haben öffentliche Gelder die Generierung der Open Data erst ermöglicht, also müssen sie auch öffentlich zugänglich sein.

Darüber hinaus können besser informierte Bürger und Unternehmen genannt werden, die bei den Ämtern keine Kosten mehr durch zusätzliche Anfragen verursachen.

Und letztlich können Fakten nicht dem Urheberrecht unterliegen.

Ein Argument gegen Open Data ist das Urheberrecht und der damit verbundene Wunsch des Urhebers, mit seinen Daten Geld zu verdienen.

Ein weiteres Kontra-Argument ist die Konkurrenz zwischen durch Steuergelder geförderten Informationssammlungen und den Angeboten kommerzieller Anbieter.

Ein möglicher Missbrauch offengelegter Daten gilt als drittes Gegenargument.

Weitere Bedenken gibt es bezüglich der Datenqualität, Problemen bei der Herleitung und damit der Gefahr von Fehlinterpretation sowie der Vermischung von staatlichen und nicht-staatlichen Angeboten.

Kritik an Open Data

Kritiker bemängeln unter anderem, dass

  • zu viele irrelevante „Schnarchdaten“ veröffentlicht werden,
  • zu wenige relevante Daten als Open Data verfügbar sind,
  • Daten grundsätzlich nur zögerlich bereitgestellt werden,
  • verfügbare Datensätze nicht angemessen zugänglich bzw. auffindbar sind und
  • datenschutzrechtliche Fragen wie flächendeckende Nutzungsbedingungen und Lizenzfragen nicht ausreichend geklärt und nicht einheitlich geregelt sind.

Checkliste zur Verwendung von Open Data in Unternehmen

  • Open Data-Verwendungszweck definieren: Für welchen Zweck möchten Sie Open Data verwenden? Welchen Mehrwert (zum Beispiel Einblick in ein spezifisches Thema, besseres Eingehen auf Kundenbedürfnisse, private vs. kommerzielle Verwendung) könnten Open Data, die Sie nutzen möchten, Ihrem Vorhaben verleihen?
  • Datenlabel erkennen: Beinhalten ausgesuchte Open Data tatsächlich für Ihren Zweck benötigte Informationen? – Diese Frage können Sie beantworten, indem Sie die Metadaten der Open Data überprüfen.
  • Lizenzfragen klären: Liegen Lizenzinformationen zu Ihrem Datensatz vor? Ist eine Lizenz verfügbar, die es erlaubt, den Datensatz so zu verwenden, wie Sie es vorhaben (zum Beispiel kommerziell)? Enthält die Lizenz die Vorschrift anzugeben, wer der ursprüngliche Dateneigner war? Erfordert die Lizenz die „Weitergabe unter gleichen Bedingungen“, d. h., dass Sie das Ergebnis der Vermischung Ihrer Daten mit Open Data ebenfalls als Open Data veröffentlichen müssen? Liegen gegebenenfalls noch keine Lizenzinformationen zu Ihrem Datensatz vor? – Kontaktieren Sie den Dateneigentümer, um die erlaubten Open-Data-Verwendungszwecke abzuklären.
  • Dateiformate prüfen: Liegt der Datensatz z. B. in einem csv-Dateiformat oder in einem pdf-Dateiformat zum Download vor?
  • Datenqualität feststellen: Wie aktuell sind die Open Data, für die Sie sich interessieren? Wie regelmäßig werden diese aktualisiert? Verstehen Sie alle Felder und ihren Kontext? Was wissen Sie über die Genauigkeit dieser Open Data? Wie werden fehlende Daten gehandhabt?

Zukunft von Open Data

Open Data ist eine natürliche Ressource des digitalen Zeitalters. Open Data kann Treiber des gesellschaftlichen Wandels sein und das Verhältnis von Staat, Bürger und Wirtschaft entscheidend prägen. Verbesserte Rahmenbedingungen und politische Führung sind dafür zwingend erforderlich. So treibt die Datenstrategie der Bundesregierung vom 27. Januar 2021 die Open-Data-Politik weiter voran.

Die Open-Data-Strategie der Bundesregierung vom 6. Juli 2021 umfasst drei Handlungsfelder mit insgesamt 68 Umsetzungsmaßnahmen verschiedener Bundesministerien und Bundesbehörden:

  1. Verbesserung der Datenbereitstellung sowie Auf- und Ausbau leistungsfähiger und nachhaltiger Dateninfrastrukturen
  2. Steigerung einer innovativen, gemeinwohlorientierten und verantwortungsvollen Datennutzung
  3. Förderung von Datenkompetenzen und Etablierung einer Datenkultur in der Bundesverwaltung zur Erhöhung von Qualität und Nutzbarkeit bereitgestellter Daten.

Die Zukunft von Open Data liegt nicht nur in der Veröffentlichung weiterer Open Data, sondern in der Verknüpfung von Open Data zu Open Linked Data. Die Verknüpfung der Daten in Form von Knowledge Graphen hilft beim Verknüpfen relevanter Informationen.

Autorin:
Roksolana Pleshkanovska
M.Sc./M.A.