Zum Ende von kleineAnfragen.de„Die Lösung zu all unseren Problemen könnte in PDFs schlummern, die niemand liest“

Wichtige Parlamentsinformationen sind eigentlich öffentlich, doch kaum jemand findet sie. Maximilian Richt wollte das ändern. Mit kleineAnfragen.de hatte er ein Angebot geschaffen, das die vergrabenen Informationen allen einfach zugänglich machte. Wir haben ihn gefragt, warum er den Dienst jetzt abschalten musste.

Auch kleineAnfragen.de wird jetzt archiviert
Nachdem kleineAnfragen.de fünf Jahre lang versucht hat, Parlamentsinformationen für alle zugänglicher zu machen, wird der Dienst nun selbst archiviert. Gemeinfrei-ähnlich freigegeben durch unsplash.com Ula Kuźma

Maximilian Richt ist Open-Data-Aktivist und Ehrenamtlicher bei der Open Knowledge Foundation Deutschland. Mit kleineAnfragen.de entwickelte er einen Dienst, der es Bürger:innen einfach machte, über parlamentarische Anfragen und Regierungsantworten auf dem Laufenden zu bleiben. Kleine Anfragen sind wichtige Instrumente der parlamentarischen Demokratie, mit denen Abgeordnete der Regierung auf die Finger schauen können. Die Antworten sind in der Regel öffentlich, die enthaltenen Informationen bilden eine wichtige Grundlage für politische Berichterstattung und Debatten. Die nun eingestellte Plattform war mit praktischen RSS-Feeds, sinnvollen Metadaten und maschinenlesbaren Dokumenten eine wichtige Wissensressource für Journalist:innen, Zivilgesellschaft und Politik.

Zugang zu den vergrabenen Daten der Parlamente

kleineAnfragen.de wird leider eingestellt
Der Kopf hinter kleineAnfragen.de: Maximilian Richt - Alle Rechte vorbehalten Fiona Krakenbürger/OKFN

netzpolitik.org: Du hast kleineAnfragen.de zum Ende des Jahres 2020 abgeschaltet. Warum?

Maximilian Richt: kleineAnfragen bezog die Anfragen und Antworten aus den Websites der Parlamentsdokusysteme der Landtage. Die Landtage haben immer wieder ihre Seiten umgestaltet und ihre Parlamentsdokusysteme von einem der zwei Anbieter auf dem Markt (GLOMAS und j3s) etwas aktualisieren lassen. Sie haben dabei aber nie auf Open Data und Maschinenlesbarkeit gesetzt. Teilweise haben sie die Infosysteme neu angestrichen, neue HTML-Templates gebaut, ohne den technischen Unterbau besser zu machen. Das hat dazu geführt, dass ich für jede Aktualisierung bei jedem Landtag von vorne beginnen durfte, die Scraper dafür zu bauen. Das kann ich auf Dauer nicht ehrenamtlich leisten.

netzpolitik.org: Wie funktionierte kleineAnfragen.de?

Maximilian Richt: Mittels Scrapern. Das heißt, es wurden automatisiert die Parlamentsdokumentationssysteme der Landtage abgefragt und teilweise die Seitenzahl- und Suchparameter manipuliert, um möglichst alle neuen und geupdateten Anfragen und Antworten zu bekommen. Aus den Suchergebnissen wurden dann (falls vorhanden) Metadaten wie Fraktion und Datum extrahiert, die PDFs mit der eigentlichen Anfrage wurden dann nochmals durch verschiedene Texterkennungen gejagt und mit diversen regulären Ausdrücken dann noch Personen, Fraktionen, Ministerien, aber auch Tabellen- und Verschlusssachen-Marker extrahiert.

Das ist deutlich fehleranfälliger als man erwartet. Außerdem ist es auch spannend, an welchen Stellen sich überall Vertipper einschleichen können. Die gesammelten Daten haben wir dann in eine Volltextsuche geworfen und noch Feeds und E-Mail-Abos darauf angeboten.

netzpolitik.org: Warum ist das wichtig?

Maximilian Richt: Weil die Parlamentsdokumentationssysteme der Länder und des Bundestags alle, gelinde gesagt, schwierig zu benutzen sind. Eine wirkliche Volltextsuche in den Dokumenten ist eine Ausnahme, viele Parlamente vergeben immer noch händisch ein paar Schlagwörter für jedes Dokument. Zudem gibt es auch Parlamente wie Sachsen, bei denen das Dokumentationssystem nicht nur belastend in der Bedienung ist, sondern auch Links auf gefundene Dokumente unmöglich sind. Die URL zur jeweiligen PDF wird nach 15 Minuten einfach ungültig. Das ist alles längst nicht mehr zeitgemäß – und so versauern eigentlich interessante Informationen, weil sie niemand findet. Ein schönes Zitat aus der Washington Post dazu: “The solutions to all our problems may be buried in PDFs that nobody reads”.

“All diese interessanten Informationen findet doch niemand“

netzpolitik.org: Wie ist kleineAnfragen.de entstanden und wer hat sich in den letzten Jahren darum gekümmert?

Maximilian Richt: Entstanden ist es im September 2014, am selben Tag, als auf Zeit.de ein Artikel über den Zustand von Bahnbrücken erschien. Dort hatte ich mich über die Datenquelle gewundert und bin zum ersten Mal auf das Werkzeug der Kleinen Anfrage gestoßen. Ein paar Stunden später steckte ich knietief in einigen hundert Browsertabs der verschiedenen Landtage und dachte mir: Das muss doch besser gehen, all diese interessanten Informationen findet doch niemand.

Aufgehängt wurde das Projekt dann bei der Open Knowledge Foundation. In der Anfangszeit hatte ich auch kurzzeitig Unterstützung beim Bau weiterer Scraper. Seitdem lag es aber weiterhin nur auf meinen Schultern, Anpassungen, Wartungen und Anrufe irritierter Menschen, warum ihre Anfrage nicht findbar wäre, inklusive.

netzpolitik.org: Du hast die Arbeit an kleineAnfragen.de schon Ende 2019 eingestellt. Verschwindet die Seite mit der Abschaltung des Dienstes nun komplett aus dem Netz?

Maximilian Richt: Nein. Im Gegensatz zu Behörden, bei denen mit jedem Website-Relaunch oder einer Ministeriumsumbenennung viel verloren geht, versuche ich es als Langzeitarchiv möglichst lang verfügbar zu lassen. Das bedeutet nicht nur einen kompletten Abzug in das Internet Archive und die Wayback Machine zu werfen, sondern von der aktuellen Rails-Anwendung mit (noch) funktionierender Suche auf statische HTML-Dateien zu wechseln, sodass das eigentliche Langzeit-Hosting kein besonderer Aufwand ist.

netzpolitik.org: Wie können Menschen ohne deinen Service über Kleine Anfragen auf dem Laufenden bleiben?

Maximilian Richt: Gute Frage. Es existieren auch Bezahlangebote für politisches Monitoring, im Zweifel können also Interessengruppen, die es sich sowieso leisten können, recht schnell auf solche Dienste wechseln. Aber sonst wird es schwieriger. Vereinzelt bieten Landtage auch Feeds an, der Bundestag hat mit „Heute im Bundestag“ und @hib_nachrichten auf Twitter auch ein redaktionelles Angebot. Am ehesten möglicherweise noch über https://www.parlamentsspiegel.de – was, wenn der Landtag von Nordrhein-Westfalen seinen Job schon früher besser erfüllt hätte, übrigens kleineAnfragen.de überflüssig gemacht hätte.

netzpolitik.org: Wieso das?

Maximilian Richt: Der Landtag NRW betreibt den Parlamentsspiegel, der ein Gemeinschaftsprojekt aller Landtage ist. Alle Landesparlamente liefern – teilweise automatisch mit einem XML-Export [PDF], teilweise händisch per PDFs in E-Mails – ihre neuen Dokumente beim Parlamentsspiegel ab. Dort kann also eine zentrale Recherche- und Abrufmöglichkeit bestehen. Das Angebot des Parlamentsspiegels ist jedoch, wie man dem Footer der Website entnehmen kann, in 2010 steckengeblieben. So gibt es auch dort keine Volltextsuche in den Dokumenten und auch dort fehlen Suchsnippets, sodass eine komfortable Recherche nicht möglich ist.

Mitte 2019 ist ein Hinweis aufgetaucht, dass die „Überarbeitung der Suchmöglichkeiten und Trefferanzeigen sowie eine Erneuerung der IT-Umgebung des Parlamentsspiegels“ vorbereitet wird, seitdem ist jedoch nichts sichtbares passiert. Eine IFG-Anfrage zu Dokumenten blieb erfolglos. Eine Kontaktaufnahme 2019 per Mail, noch vor der Ankündigung der Abschaltung von kleineAnfragen, wurde Wochen später postalisch mit „sind nicht zuständig“ abgewiesen.

Open Data ist in den Parlamenten noch nicht angekommen

netzpolitik.org: Zum Jahresende zeigten sich auf Twitter viele betroffen vom Ende deines Dienstes. Wenn wir jetzt mal nach Verantwortlichen suchen: Wer ist schuld daran, dass du kleineAnfragen.de einstellen musstest?

Maximilian Richt: Schuld ist schwierig. Es ist aus meiner Sicht nicht nur das Verschlafen, sondern vor allem das Abfinden mit technisch längst überholten Infrastrukturen. Das wird auch in den Parlamenten und ihren Verwaltungen noch heute weiter gelebt und nicht als anzugehendes Problem erkannt. Natürlich hätte ich auch noch auf Jahre weiterhin alle paar Wochen Scraper anpassen und Tippfehler korrigieren können – doppelte Arbeit, da dies ja bereits bei den Parlamenten auch passiert, und einen Burn-Out inklusive.

Am Ende sehen wir hier leider wieder, dass Open Data noch lange nicht in den Landesparlamenten oder bei den Abgeordneten angekommen ist. Der Leidensdruck mit den eigenen Angeboten ist auch weiterhin nicht so hoch, dass sie Änderungen beschließen wollen. Außerdem gibt es zu wenig Geld und Stellen für Infrastrukturaufgaben wie die zeitgemäße Bereitstellung von Informationen.

netzpolitik.org: Was hättest du dir an Unterstützung gewünscht?

Maximilian Richt: Mittlerweile hoffe ich ja nicht mal mehr auf den ganz großen Wurf. Einen Weg weg von schlecht eingescannten, in Word „gesetzten“ Dokumenten als PDF sehe ich bei den Parlamenten auch in den nächsten Jahren nicht, obwohl Maschinenlesbarkeit und ein vollständig digitaler Dokumentenflow längst überfällig sind. Deshalb geht mein Wunsch eher Richtung offener Schnittstellen zu den bereits existierenden Daten der Parlamente, zu Gesprächen mit Leuten hinter den Parlamentsdokumentationssystemen, zur gemeinsamen Überlegung mit dem Landtag NRW, wie man den Parlamentsspiegel jetzt opensourcen und weiterentwickeln kann, sodass kleineAnfragen unnötig wird.

Und ganz ehrlich: nach der Ankündigung der Abschaltung hätte ich mir auch mehr Nachdruck von Leuten gewünscht, die kleineAnfragen.de tagtäglich genutzt haben. Und damit meine ich auch Journalist*innen, denn den intensivsten Kontakt zu Parlamenten, Abgeordneten und Verwaltungen sehe ich immer noch dort. Dass die Abschaltung selbst auf Netzpolitik.org erst 4 Monate nach der Ankündigung eher zufällig zum Thema wurde, ist bitter.

Ich glaube mit dem nötigen Druck auf die Parlamente, besonders aus journalistischer Ecke, die Daten zu öffnen, hätten wir heute auch in der Recherche andere Möglichkeiten.

netzpolitik.org: Danke für deine Arbeit und das Interview.

Du möchtest mehr kritische Berichterstattung?

Unsere Arbeit bei netzpolitik.org wird fast ausschließlich durch freiwillige Spenden unserer Leserinnen und Leser finanziert. Das ermöglicht uns mit einer Redaktion von derzeit 15 Menschen viele wichtige Themen und Debatten einer digitalen Gesellschaft journalistisch zu bearbeiten. Mit Deiner Unterstützung können wir noch mehr aufklären, viel öfter investigativ recherchieren, mehr Hintergründe liefern - und noch stärker digitale Grundrechte verteidigen!

 

Unterstütze auch Du unsere Arbeit jetzt mit deiner Spende.

6 Ergänzungen

  1. Wieso wurden die Scraper bzw. die Technik der Webseite nicht Open Source gehalten? So hätte sich eine aktive Community aus entwicklern bilden können, welche die Scraper wartet.
    Ich für meinen Teil wäre sehr daran interessiert gewesen, in diesem Projekt auszuhelfen.

    Gibt es Pläne für eine Fortsetzung des Projektes?

    1. Das ist nett, dass du Unterstützung anbietest. Aber wie Maxi selbst schreibt:

      „Bitte seht davon ab, kurzfristig zu denken »aber das ist doch OpenSource, ich betreibe das selbst unter neuer Domain weiter«. Das ist unterm Strich kontraproduktiv: Was die Parlamente selbst erledigen müssten, hängt dann an der nächsten externen ehrenamtlichen Instanz.
      Denn unsere Frage ist: Hilft es überhaupt, wenn die Zivilgesellschaft beweist, wie es besser ginge? Aktuell betreiben Ehrenamtliche Infrastruktur und übernehmen die Aufgaben der öffentl. Hand. So ändert sich strukturell nichts.“

      (s. https://okfn.de/blog/2021/01/zur-abschaltung-von-kleine-anfragen/)

  2. Ich bin immer wieder beeindruckt, wie zurueckhaltend Max ist, wenn’s darum geht, die Verantwortlichen fuer das jahrelange Verschlafen zu benennen. Die parlamentarischen Informationssysteme wurden ueber Jahre hinweg immer wieder einmal angefasst, und einzige Auswirkung war dann am Ende, dass er die Scraper anpassen musste, damit nicht zornige hauptamtlich im Raederwerk eines Landtags Beschaeftigte bei ihm anrufen weil Dokumente nicht gefunden werden (quasi live miterlebt).

    Die passendere Antwort haette ich gefunden: Quasi *alle* sind schuld. Von den Verwaltungen ueber die beauftragten Dienstleister bis hin zu den Parlamentarier:innen, ihren Beschaeftigten zeigen alle auf die jeweils anderen – und alle tragen sie die Verantwortung mit. Auch wenn sie in der Zustaendigkeitsdiffusion sich immer schnell und gerne herausgewunden haben: Die Dienstleister haben keinen Auftrag von der Verwaltung, die Verwaltung glaubt, dafuer ein Mandat vom Parlament zu brauchen, und dem Parlament stieg offenbar niemand aufs Dach, die/der selber kleineanfragen nutzte.

    Was in der gesamten Gemengelage sehr spitz und deutlich auffaellt: Zwar schmuecken sich sowohl Bund als auch immer mehr Laender mit allen moeglichen Digitalisierungsinitiativen und „agilen“ IT-Powerhouses. Vor zwei Jahren hatten wir gefeixt, man koennte ja die praktische Umsetzungsfaehigkeit und strategische Kompetenz daran ablesen, ob sich bis Ende 2020 auch nur eines dieser Teams dem Themenkomplex kleineanfragen etc. annehmen wuerde. Dass es am Ende nicht eine der Gruppen auch nur *thematisieren* wuerde haette aber selbst ich nicht gedacht.

    1. Durchsuchbarkeit ist Aufgabe des Staates. Das ist nicht auch nur im entferntesten diskussionswürdig.

      Ich würde das sogar dem Zugriff durch die Politik insofern entziehen, als dass da keine Tricks möglich sein dürfen, sowie keine Beschönigung durch Maulkörbe möglich ist. Also eigenständige Webpräsenz des Durchsuchbarkeitsbehörde und eigenständige Publikation.

Ergänzung an Felix Pankratz Ergänzung abbrechen

Wir freuen uns auf Deine Anmerkungen, Fragen, Korrekturen und inhaltlichen Ergänzungen zum Artikel. Unsere Regeln zur Veröffentlichung von Ergänzungen findest Du unter netzpolitik.org/kommentare. Deine E-Mail-Adresse wird nicht veröffentlicht.