Datenmarathon: #FlashHacks macht 10 Millionen Firmendatensätze in 10 Tagen zugänglich

via missions.opencorporates.com

10 Millionen Datensätze über Firmen zugänglich machen in 10 Tagen: Das war das erklärte Ziel der #FlashHacks-Kampagne von opencorporates:

We are calling all bot writers to use their coding superpowers in setting corporate related data free!

Vom 7. bis zum 17. Juli war der selbstgesetzte Zeitraum, die Deadline lief heute während des Open Knowledge Festivals ab. Dort trafen sich die „Datenbefreier“, um zusammen Programme zu entwickeln, die öffentliche Daten aus Firmen- und Handelsregistern sammeln und in einer Datenbank zugänglich machen. Warum man öffentliche Daten „befreien“ muss, mag man sich fragen, aber die Antwort liegt schnell auf der Hand:

Die Regierungen versprechen immer wieder, dass sie die Daten zugänglich machen, aber das tun sie nicht. Es braucht Hacker, um sie in ein maschinenlesbares Format zu bringen, damit man sie sinnvoll nutzen kann. Wir wollen in den Mittelpunkt rücken, was die Entwickler Tolles leisten und auch Druck auf die Regierungen erzeugen – den eigentlich sollten sie das machen.

Das erklärte uns Chris Taggart, Mitbegründer und Geschäftsführer von opencorporates. Nicht zugängliche Daten sind also nicht immer unter Verschluss gehaltene Daten, die niemand sehen darf. Auch eingescannte Dokumente, die nicht einfach nach Stichworten durchsucht werden können, zählen dazu. Oder Informationen, für die man ein Login braucht, das nur eine bestimmte Anzahl an Dokumentenansichten pro Zeit erlaubt. Oder Daten, die so tief in den Ordnerstrukturen von Einrichtungen verborgen sind, dass man über normale Klickpfade kaum an sie heran kommt, wenn man nicht weiß, dass sie da sein müssen.

Opencorporates besteht schon seit 2010 und arbeitet seitdem unermüdlich daran, Daten über Unternehmen in einer Datenbank unter der Open Database License zu veröffentlichen. 75 Millionen Unternehmen aus über 80 verschiedenen Gerichtsbarkeiten befinden sich bereits in den Datenbeständen und der aktuelle Datenmarathon ist ein Ansporn dafür, dass es in kurzer Zeit noch viel mehr werden sollen. Doch es lief nicht alles von Anfang an glatt. Taggart gab zu:

Ich hatte die dumme Idee für diese #FlashHacks-Aktion. Und gestern hat sich das wirklich noch wie eine ziemlich dumme Idee angefühlt, denn um sechs Uhr abends hatten wir gerade mal 5,9 Millionen Datensätze zusammen. Es gab einen Bug im System, der den Import von einigen Daten unmöglich gemacht hat. Aber spätabends konnten wir den Fehler finden und morgens waren es dann plötzlich schon 8,2 Millionen.

Das alles wäre nicht möglich gewesen ohne alle diejenigen Programmierer, die mitgeholfen haben – auf dem Open Knowledge Festival, anderen Treffen oder von anderen Orten über das Internet.

Dass sich hier 60 Leute in den letzten Tagen immer wieder hier hingesetzt haben, in die Hitze und mit einem Bier in der Hand, ist wie ein Bekenntnis: Sie sind davon überzeugt, dass Daten frei sein sollten. Für Wissenschaft, für Bildung, für die Presse, für alle anderen auch. […] Denn in einer Demokratie geht es darum, die Welt zu verstehen und auf dieser Basis Entscheidungen treffen zu können.

Die #FlashHacks-Aktion zeigt auch, dass das Konzept von opencorporates funktioniert und es möglich ist, eine Gemeinschaft zu bilden, die gemeinsam an diesem Ziel arbeitet und dabei aus ganz unterschiedlichen Richtungen kommt. Das ist ein gutes Zeichen für die weitere Arbeit und fragt man Taggart nach den Zielen für opencorporates merkt man ihm großen Ehrgeiz an:

Wir wollen 10 Milliarden Datensätze rund um den Globus. Und wenn es bis zum Ende des Jahres 100 Millionen werden, wäre ich noch enttäuscht.

Zu diesem ambitionierten Vorhaben wünschen wir viel Erfolg und hoffen, dass es auch unsere Bundesregierung anspornt, mehr Offenheit zu fördern. Denn in Deutschland sind die Hürden hoch, wenn man Auskunft zu Unternehmen bekommen will. Ein Auszug aus dem Handelsregister ist kostenpflichtig und in einem Ranking der Open Knowledge Foundation schneidet Deutschland sehr schlecht ab, wenn es um die Zugänglichkeit Unternehmensdaten geht.

Eine weitere Frage die sich stellt ist: Was sagen eigentlich die Unternehmen dazu, dass ihre Daten so leicht zugänglich sind? Denn manche von ihnen würde man sicherlich lieber in den tiefen des Internets versteckt wissen. Welche Firma legt schon gern ihre gesamten Lobby-Beziehungen offen und will dass jeder sieht, wie viele Privatjets sie besitzt? Überraschenderweise gab es bisher noch keine rechtlichen Probleme für opencorporates, die Reaktionen seien aber gemischt. Eine Teil der betroffenen Firmen versuche schon, eine Löschung der Daten zu erwirken, doch das ist zum Scheitern verurteilt – denn die Daten sind ja bereits veröffentlicht, wenn auch niemand sie einfach finden würde. Eine zweite Gruppe nehme es einfach hin, andere hingegen erkennen selbst Vorteile in der offenen Datenbank. „Plötzlich beteiligen sich die Firmen, wenn sie sehen: ‚Oh, da ist ja ein falscher Eintrag‘ und ihn dann an offizieller Stelle korrigieren lassen können“. Und vielleicht passiert ja am Ende in Deutschland etwas ähnliches wie auf Mauritius: Dort benutzen Behörden inzwischen lieber die Datenbank von opencorporates, denn die eigenen Datenbestände sind viel zu unübersichtlich.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

2 Ergänzungen

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.