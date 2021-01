Maximilian Richt ist Open-Data-Aktivist und Ehrenamtlicher bei der Open Knowledge Foundation Deutschland. Mit kleineAnfragen.de entwickelte er einen Dienst, der es Bürger:innen einfach machte, über parlamentarische Anfragen und Regierungsantworten auf dem Laufenden zu bleiben. Kleine Anfragen sind wichtige Instrumente der parlamentarischen Demokratie, mit denen Abgeordnete der Regierung auf die Finger schauen können. Die Antworten sind in der Regel öffentlich, die enthaltenen Informationen bilden eine wichtige Grundlage für politische Berichterstattung und Debatten. Die nun eingestellte Plattform war mit praktischen RSS-Feeds, sinnvollen Metadaten und maschinenlesbaren Dokumenten eine wichtige Wissensressource für Journalist:innen, Zivilgesellschaft und Politik.

Zugang zu den vergrabenen Daten der Parlamente

netzpolitik.org: Du hast kleineAnfragen.de zum Ende des Jahres 2020 abgeschaltet. Warum?

Maximilian Richt: kleineAnfragen bezog die Anfragen und Antworten aus den Websites der Parlamentsdokusysteme der Landtage. Die Landtage haben immer wieder ihre Seiten umgestaltet und ihre Parlamentsdokusysteme von einem der zwei Anbieter auf dem Markt (GLOMAS und j3s) etwas aktualisieren lassen. Sie haben dabei aber nie auf Open Data und Maschinenlesbarkeit gesetzt. Teilweise haben sie die Infosysteme neu angestrichen, neue HTML-Templates gebaut, ohne den technischen Unterbau besser zu machen. Das hat dazu geführt, dass ich für jede Aktualisierung bei jedem Landtag von vorne beginnen durfte, die Scraper dafür zu bauen. Das kann ich auf Dauer nicht ehrenamtlich leisten.

netzpolitik.org: Wie funktionierte kleineAnfragen.de?

Maximilian Richt: Mittels Scrapern. Das heißt, es wurden automatisiert die Parlamentsdokumentationssysteme der Landtage abgefragt und teilweise die Seitenzahl- und Suchparameter manipuliert, um möglichst alle neuen und geupdateten Anfragen und Antworten zu bekommen. Aus den Suchergebnissen wurden dann (falls vorhanden) Metadaten wie Fraktion und Datum extrahiert, die PDFs mit der eigentlichen Anfrage wurden dann nochmals durch verschiedene Texterkennungen gejagt und mit diversen regulären Ausdrücken dann noch Personen, Fraktionen, Ministerien, aber auch Tabellen- und Verschlusssachen-Marker extrahiert.

Das ist deutlich fehleranfälliger als man erwartet. Außerdem ist es auch spannend, an welchen Stellen sich überall Vertipper einschleichen können. Die gesammelten Daten haben wir dann in eine Volltextsuche geworfen und noch Feeds und E-Mail-Abos darauf angeboten.

netzpolitik.org: Warum ist das wichtig?

Maximilian Richt: Weil die Parlamentsdokumentationssysteme der Länder und des Bundestags alle, gelinde gesagt, schwierig zu benutzen sind. Eine wirkliche Volltextsuche in den Dokumenten ist eine Ausnahme, viele Parlamente vergeben immer noch händisch ein paar Schlagwörter für jedes Dokument. Zudem gibt es auch Parlamente wie Sachsen, bei denen das Dokumentationssystem nicht nur belastend in der Bedienung ist, sondern auch Links auf gefundene Dokumente unmöglich sind. Die URL zur jeweiligen PDF wird nach 15 Minuten einfach ungültig. Das ist alles längst nicht mehr zeitgemäß – und so versauern eigentlich interessante Informationen, weil sie niemand findet. Ein schönes Zitat aus der Washington Post dazu: “The solutions to all our problems may be buried in PDFs that nobody reads”.

“All diese interessanten Informationen findet doch niemand“

netzpolitik.org: Wie ist kleineAnfragen.de entstanden und wer hat sich in den letzten Jahren darum gekümmert?

Maximilian Richt: Entstanden ist es im September 2014, am selben Tag, als auf Zeit.de ein Artikel über den Zustand von Bahnbrücken erschien. Dort hatte ich mich über die Datenquelle gewundert und bin zum ersten Mal auf das Werkzeug der Kleinen Anfrage gestoßen. Ein paar Stunden später steckte ich knietief in einigen hundert Browsertabs der verschiedenen Landtage und dachte mir: Das muss doch besser gehen, all diese interessanten Informationen findet doch niemand.

Aufgehängt wurde das Projekt dann bei der Open Knowledge Foundation. In der Anfangszeit hatte ich auch kurzzeitig Unterstützung beim Bau weiterer Scraper. Seitdem lag es aber weiterhin nur auf meinen Schultern, Anpassungen, Wartungen und Anrufe irritierter Menschen, warum ihre Anfrage nicht findbar wäre, inklusive.

netzpolitik.org: Du hast die Arbeit an kleineAnfragen.de schon Ende 2019 eingestellt. Verschwindet die Seite mit der Abschaltung des Dienstes nun komplett aus dem Netz?

Maximilian Richt: Nein. Im Gegensatz zu Behörden, bei denen mit jedem Website-Relaunch oder einer Ministeriumsumbenennung viel verloren geht, versuche ich es als Langzeitarchiv möglichst lang verfügbar zu lassen. Das bedeutet nicht nur einen kompletten Abzug in das Internet Archive und die Wayback Machine zu werfen, sondern von der aktuellen Rails-Anwendung mit (noch) funktionierender Suche auf statische HTML-Dateien zu wechseln, sodass das eigentliche Langzeit-Hosting kein besonderer Aufwand ist.

netzpolitik.org: Wie können Menschen ohne deinen Service über Kleine Anfragen auf dem Laufenden bleiben?

Maximilian Richt: Gute Frage. Es existieren auch Bezahlangebote für politisches Monitoring, im Zweifel können also Interessengruppen, die es sich sowieso leisten können, recht schnell auf solche Dienste wechseln. Aber sonst wird es schwieriger. Vereinzelt bieten Landtage auch Feeds an, der Bundestag hat mit „Heute im Bundestag“ und @hib_nachrichten auf Twitter auch ein redaktionelles Angebot. Am ehesten möglicherweise noch über https://www.parlamentsspiegel.de – was, wenn der Landtag von Nordrhein-Westfalen seinen Job schon früher besser erfüllt hätte, übrigens kleineAnfragen.de überflüssig gemacht hätte.

netzpolitik.org: Wieso das?

Maximilian Richt: Der Landtag NRW betreibt den Parlamentsspiegel, der ein Gemeinschaftsprojekt aller Landtage ist. Alle Landesparlamente liefern – teilweise automatisch mit einem XML-Export [PDF], teilweise händisch per PDFs in E-Mails – ihre neuen Dokumente beim Parlamentsspiegel ab. Dort kann also eine zentrale Recherche- und Abrufmöglichkeit bestehen. Das Angebot des Parlamentsspiegels ist jedoch, wie man dem Footer der Website entnehmen kann, in 2010 steckengeblieben. So gibt es auch dort keine Volltextsuche in den Dokumenten und auch dort fehlen Suchsnippets, sodass eine komfortable Recherche nicht möglich ist.

Mitte 2019 ist ein Hinweis aufgetaucht, dass die „Überarbeitung der Suchmöglichkeiten und Trefferanzeigen sowie eine Erneuerung der IT-Umgebung des Parlamentsspiegels“ vorbereitet wird, seitdem ist jedoch nichts sichtbares passiert. Eine IFG-Anfrage zu Dokumenten blieb erfolglos. Eine Kontaktaufnahme 2019 per Mail, noch vor der Ankündigung der Abschaltung von kleineAnfragen, wurde Wochen später postalisch mit „sind nicht zuständig“ abgewiesen.

Open Data ist in den Parlamenten noch nicht angekommen

netzpolitik.org: Zum Jahresende zeigten sich auf Twitter viele betroffen vom Ende deines Dienstes. Wenn wir jetzt mal nach Verantwortlichen suchen: Wer ist schuld daran, dass du kleineAnfragen.de einstellen musstest?

Maximilian Richt: Schuld ist schwierig. Es ist aus meiner Sicht nicht nur das Verschlafen, sondern vor allem das Abfinden mit technisch längst überholten Infrastrukturen. Das wird auch in den Parlamenten und ihren Verwaltungen noch heute weiter gelebt und nicht als anzugehendes Problem erkannt. Natürlich hätte ich auch noch auf Jahre weiterhin alle paar Wochen Scraper anpassen und Tippfehler korrigieren können – doppelte Arbeit, da dies ja bereits bei den Parlamenten auch passiert, und einen Burn-Out inklusive.

Am Ende sehen wir hier leider wieder, dass Open Data noch lange nicht in den Landesparlamenten oder bei den Abgeordneten angekommen ist. Der Leidensdruck mit den eigenen Angeboten ist auch weiterhin nicht so hoch, dass sie Änderungen beschließen wollen. Außerdem gibt es zu wenig Geld und Stellen für Infrastrukturaufgaben wie die zeitgemäße Bereitstellung von Informationen.

netzpolitik.org: Was hättest du dir an Unterstützung gewünscht?

Maximilian Richt: Mittlerweile hoffe ich ja nicht mal mehr auf den ganz großen Wurf. Einen Weg weg von schlecht eingescannten, in Word „gesetzten“ Dokumenten als PDF sehe ich bei den Parlamenten auch in den nächsten Jahren nicht, obwohl Maschinenlesbarkeit und ein vollständig digitaler Dokumentenflow längst überfällig sind. Deshalb geht mein Wunsch eher Richtung offener Schnittstellen zu den bereits existierenden Daten der Parlamente, zu Gesprächen mit Leuten hinter den Parlamentsdokumentationssystemen, zur gemeinsamen Überlegung mit dem Landtag NRW, wie man den Parlamentsspiegel jetzt opensourcen und weiterentwickeln kann, sodass kleineAnfragen unnötig wird.

Und ganz ehrlich: nach der Ankündigung der Abschaltung hätte ich mir auch mehr Nachdruck von Leuten gewünscht, die kleineAnfragen.de tagtäglich genutzt haben. Und damit meine ich auch Journalist*innen, denn den intensivsten Kontakt zu Parlamenten, Abgeordneten und Verwaltungen sehe ich immer noch dort. Dass die Abschaltung selbst auf Netzpolitik.org erst 4 Monate nach der Ankündigung eher zufällig zum Thema wurde, ist bitter.

Ich glaube mit dem nötigen Druck auf die Parlamente, besonders aus journalistischer Ecke, die Daten zu öffnen, hätten wir heute auch in der Recherche andere Möglichkeiten.

netzpolitik.org: Danke für deine Arbeit und das Interview.