Dem Deutschen Bahn-Konzern ist es endlich gelungen, einige Datensätze als Open Data zu veröffentlichen. Das eigene Datenportal soll weiter wachsen und ist offenbar Teil einer größeren „Innovationsstrategie“, die sich auch gegen die Konkurrenz durch die Fernbusse richtet. Ohne die Arbeit einzelner Engagierter wäre es nie so weit gekommen.
Besser spät als gar nicht: Seit gestern stellt die Deutsche Bahn nun die ersten fünf Datensätze in einem eigenen im Beta-Betrieb befindlichen Datenportal zur Verfügung. „Es ist der Anfang einer neuen strategischen Ausrichtung: Auch wir als DB haben die Vorteile von Open Data erkannt und möchten uns öffnen“, heißt es in einem begleitenden Blogpost.
Die Datensätze sind in ihrer jetzigen Form – bis auf die Daten zur Netzabdeckung aus der recht neuen DB-Netzradar-App – eher in die Kategorie “Schnarchdaten” einzuordnen. Die Streckenverlaufsdaten zum Stuttgarter Bauvorhaben S21 wären vor fünf Jahren vielleicht mal relevant gewesen; die Liste der 12.000 Bahnsteige und ihrer Kantenlängen sind ohne entsprechenden Kontext wenig nützlich. Ihnen fehlen – wie auch dem Verzeichnis von 15.000 Betriebsstellen – die Geoinformationen. Wenigstens enthält die Liste der gut 5000 Bahnhöfe die jeweilige Postanschrift, so dass per Geocoding hier Abhilfe geschaffen werden kann. In den nächsten Tagen sollen aber weitere Daten folgen, etwa Echtzeitinformationen über den Status von einem Teil der Aufzüge.
Immerhin lässt das Datenportal der Bahn erahnen, was alles möglich sein könnte, wenn sie sinnvoll Infrastrukturdaten, Fahrpläne und Preistabellen über eine Schnittstelle (API) veröffentlicht: Also Daten, wo nötig versehen mit Geopunkten und einem Identifikationssystem, damit über die jeweiligen IDs Verknüpfungen über die Datensätze hinweg machbar sind. Die französische Bahn SNCF macht es vor: Dort gibt es seit Mitte 2012 ein Open Data-Portal; seit geraumer Zeit lassen sich über eine API z.B. Fahrpläne abrufen.
Das längst überfällige Datenportal zeugt davon, wie Privatisierungs- und Börsenträume dem Gemeinwohl im Weg stehen. Fünf verschiedene Firmen/Projekte des Bahnkonzerns werden als seine Unterstützer gelistet. Wieviele Stunden an Sitzungen im Gestrüpp des mittleren Managements dafür nötig waren, will man gar nicht so genau wissen. Wie sehr sich der DB-Konzern mit seiner Intransparenz selber im Weg steht, verrät ein Detail, das neulich im Blog der OpenRailwayMap (einem Seitenprojekt der OpenStreetMap) veröffentlicht wurde: So stammten zehn Prozent der Zugriffe auf dieses offene Streckennetz in diesem Jahr von Rechnern aus dem IP-Bereich des Bahnkonzerns.
Klar ist: Das Datenportal wäre ohne die Arbeit von Einzelnen nicht möglich gewesen. In gewisser Weise zeigte die Bahn dabei Größe. Sie leistete sich als Berater den externen Experten Michael Kreil: Der Programmierer (ehemals OpenDataCity, jetzt bei einer Zeitung) hatte 2012 mit seinem Projekt „OpenPlanB“ die Fahrplandaten der DB befreit. Dafür erhielt er einen offenen Brief vom Bahn-Vertrieb. In diesem wurde ihm die Schädigung der Open Data-Idee vorgeworfen wurde. Das scheint aber vergessen – dankenswerter Weise haben Kreil, andere Open Data-Bewegte sowie Engagierte im Bahnunternehmen selbst über die letzten Jahre hinweg nicht aufgegeben.
Nun wird sich zeigen müssen, was genau hinter den Worten von Bahnchef Rüdiger Grube steckt. Laut Berliner Morgenpost kündigte er gestern an, „sämtliche Infrastrukturdaten seines 37.000 Kilometer umfassenden Schienennetzes noch in diesem Monat frei verfügbar zu machen“. Das Datenportal ist offenbar Teil einer „Innovationstrategie“ mit der sich auch der Konkurrenz durch die Fernbusse erwehrt werden soll. Sein Ursprung geht nicht zuletzt auf zwei „Hackathons“ in diesem Jahr zurück – der dritte findet kommenden Monat statt. Zudem startet die Bahn einen „Accelerator“ für Softwareprojekte rund um ihre Infrastruktur: 25.000 Euro für drei Monate gibt es von der „Mindbox“. Die liegt angemessener Weise in einem S-Bahnbogen an der Berliner Jannowitzbrücke direkt an der Spree – schräg gegenüber des c-base e.V.
–
Grafik oben entstand aus Daten der DB Projekt Stuttgart–Ulm GmbH – CC:by – Link
Disclaimer: Der Autor war einer der Mitbegründer von OpenDataCity und war dort bis Anfang 2014 tätig.
Korrektur: Der 3. Hackathon startet am 11.12.15, also nicht nächste Woche, sondern Mitte Dezember.
Danke für den Hinweis.
„Die Datensätze sind in ihrer jetzigen Form – bis auf die Daten zur Netzabdeckung aus der recht neuen DB-Netzradar-App – eher in die Kategorie “Schnarchdaten” einzuordnen.“
Gemach, gemach, der Anfang ist immerhin gemacht. Die Daten sind auch mitnichten Schnarchdaten, sondern für Interessierte durchaus interessant. Viele Infos sind für am Netzzugang interessierte Parteien ebenso wie für Nerds durchaus spannend, da (wie beschrieben) die diversen DB-Unternehmen bislang eher das Gegenteil von Open Data vorgelebt haben. Mal eben nachfragen ging im allgemeinen nicht. Geoinformationen in allgemein verständlichen Formaten hat die Bahn möglicherweise selbst noch nicht vorliegen.
Überfällig ja (insbesondere da es sich hier um ein Staatsunternehmen handelt), den Rant-Tonfall des Autors finde ich aber etwas unangemessen.
der begriff „schnarchdaten“ bezieht sich darauf, dass diese daten bisher bei der bahn geschlafen haben, und schön längst hätten aufgeweckt werden können.
Richtig. Natürlich mag sich manch einer mehr erwartet haben, aber ich stelle mir das bei einem solchen Konzern auch nicht ganz so einfach vor. Da gibt es zunächst einmal ganz offensichtlich heftigen Widerstand von internen Kritikern, die erst einmal überzeugt werden müssen. Und was es noch schwieriger machen dürfte: Die entsprechenden Rechte an den Daten liegen womöglich irgendwo auf sehr viele unterschiedliche (Unter-)Firmen und Personen verteilt.
Wenn ich mir die erste Einschätzung auf okfn.de durchlese, dann will die Bahn zudem mit der Community kleine Schritte gemeinsam gehen, statt mal eben das große Ding alleine durchzuziehen und daran dann grandios zu scheitern:
„Da die DB dankenswerterweise den bewährten Weg gehen möchte, kleine Schritte in Absprache mit der Community zu gehen, anstatt große Würfe zu versuchen und am Ende ohne Flughafen dazustehen: Wir freuen uns über euren Input!“
(http://okfn.de/blog/2015/11/ein-erster-blick-auf-aufzugsdaten/)
In dem Blogpost wird zudem das Problem angesprochen, dass die (Aufzug-)Daten eine ganz unterschiedliche Qualität haben. Nicht überall seien die Datensätze vollständig oder es fehlten einzelne Parameter. Die wurden womöglich bisher noch gar nicht erhoben.
Daher sollte man jetzt erst einmal abwarten, was da am Ende noch alles kommt. Wenn sich das Projekt nicht weiterentwickelt, ist ja immer noch genügend Zeit zum kritisieren.
„Disclaimer“ ist übrigens falsch: http://wirres.net/article/articleview/8470/1/6/
https://media.ccc.de/v/MRMCD15-6986-i_like_trains#video