Dieser Artikel ist zuerst erschienen im Blog des Open Data Network. Der Autor ist Lucas Mohr.
In den USA hat die Open Government Arbeitsgruppe bereits ende 2008 die 8 Open Government Data Prinzipien für offene Regierungsdaten formuliert. Um die deutsche Regierung und deutsche Behörden bei der Öffnung der Daten zu unterstützen haben wir die Argumente ins deutsche übersetzt und präsentieren euch in loser zeitlicher Abfolge, 8 Thesen zu den Open Government Data Prinzipien. In der fünften Ausgabe dieser Reihe „Open Government Data Prinzipien“ geht es diese Woche um die
These 5 – Maschinenlesbar
Die Bereitstellung maschinenlesbarer Daten fordert Punkt fünf der Open Data Principles. Der Ruf nach standartisierten Datenformaten resultiert aus der Tatsache, dass Daten die nicht für eine automatisierte Verarbeitung strukturiert sind, sprich Daten in einem für Maschinen nicht nutzbaren Format, in aller Regel für den normalen Bürger nicht zu verwerten sind.
An dieser Stelle setzt Punkt fünf der Open Data Prinzipien an. Denn Daten können meist erst dann von den Bürgerinnen und Bürgern sinnvoll genutzt werden, wenn sie in gängigen Formaten zur Verfügung stehen. Hierdurch soll nicht nur die Auswertung von Daten nach eigenen Kriterien gewährleistet werden, sondern auch eine beliebige Verknüpfung und Weiterverwertung, inbesondere im Bereich der Programmierung.
Stehen Daten in nicht maschinenlesbaren Formaten zur Verfügung, ist es oftmals der Fall, dass diese mühsam per Hand eingeben werden müssen um ein gewünschtes Resultat zu erzielen. So bietet das ZDF beispielsweise eine preisgekrönte Anwendung an, die die Abstimmungsergebnisse der Bundestagswahl visualisiert, allerdings werden die entsprechenden Daten nicht automatisiert eingepflegt sondern müssen von Mitarbeitern per Hand eingetragen werden. Standardisierte und maschinell lesbare Formate würden diesen Missstand beheben und sprichwörtlich eine Nutzung der Daten für Jedermann zulassen.
Die 8 Open Government Data Prinzipien
1. Vollständigkeit
Alle öffentlichen Daten werden verfügbar gemacht. Als Öffentliche Daten werden hierbei Daten verstanden, die nicht berechtigten Datenschutz-, Sicherheits- oder Zugangsbeschränkungen unterliegen.
2. Primärquelle
Die Daten werden an ihrem Ursprung gesammelt. Dies geschieht mit dem höchstmöglichen Feinheitsgrad, nicht in aggregierten oder sonstwie modifizierten Formaten.
3. Zeitnah
Daten werden so zügig, wie zur Werterhaltung, notwendig zur Verfügung gestellt.
4. Zugänglich
Daten werden so vielen Nutzern wie möglich für möglichst viele Verwendungszwecke bereit gestellt.
5. Maschinenlesbar
Daten werden zur automatisierten Verarbeitung strukturiert zur Verfügung gestellt.
6. Nicht diskriminierend
Daten sind für Alle verfügbar, ohne dass eine Registrierung notwendig ist.
7. Nicht proprietär
Daten werden in standardisierten Formaten bereit gestellt, über die keine juristische Person die alleinige Kontrolle hat.
8. Lizenzfrei
Daten unterliegen keinem Urheberrecht, Patenten, Markenzeichen oder Geschäftsgeheimnissen. Sinnvolle Datenschutz-, Sicherheits- und Zugangsbeschränkungen sind zulässig.
Die Einhaltung dieser Prinzipien ist überprüfbar.
Dieser Artikel ist zuerst erschienen im Blog des Open Data Network. Der Autor ist Lucas Mohr.
Psst… Standardisierung, nicht „Standartisierung“.
„standartisierten“… *argh*