Zeit.de wird maschinenlesbar und öffnet seine Datenbank

Bei Zeit.de gibt es jetzt eine offene API, worüber man viele Informationen automatisiert aus der Datenbank abfragen kann. Die API bietet zu Zugang zu allen Texten der Print-Zeit seit 1946 und allen Texten bei Zeit.de seit 1996. Im Open Data-Blog bei Zeit.de erklärt Kai Biermann den Sinn und die Motivation:

Warum tun wir das? Wir glauben, dass in den hunderttausenden Artikeln noch viele spannende Informationen verborgen sind. Örtliche oder inhaltliche Zusammenhänge, Zeitbezüge – durch eine Verknüpfung können Dinge sichtbar werden, die beim einfachen Lesen nicht unbedingt zutage treten. Beispielsweise durch Visualisierungen. Oder durch Langzeitbeobachtungen. Wie oft tauchte der Begriff “China” in den vergangenen 66 Jahren in unseren Texten auf? Und in welchen Zusammenhängen? Wie hat sich also das China-Bild der Redaktion und vielleicht also auch das deutsche China-Bild in dieser Zeit gewandelt?

An die Volltexte kommt in der Beta-Phase noch nicht ran, aber individuelle Anfragen kann man bereits stellen (und bekommt dann vielleicht einen Zugang dazu). Mehr Informationen gibt es im Developer-Blog. Auf einem gerade stattfindenden Hackday bei Zeit.de hat Stefan Wehrmeyer ein Wortfindespiel gebastelt.

Ich bin etwas neidisch und hätte auch gerne eine offene API für die Inhalte dieses Blogs. Wie würde man das denn am sinnvollsten und ohne viel Aufwand bei einem WordPress-Blog machen?

Zeit Online ist Vermarkter dieses Blogs, aber sonst sind wir getrennt und unabhängig.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

10 Ergänzungen

  1. Das Wortsuchspiel ist nett, funktioniert aber nur mittelmäßig: Umlaute werden anscheinend nicht erkannt. Aus „Geräusche“ wird beispielsweise „Gerusche“.

  2. Hier der Link:
    http://explorer.content.guardianapis.com/

    Und mein korrigierter Text, der war etwas zu schnell getippt. Notfalls den anderen löschen.

    Mal bei guardian.co.uk gucken — Nebenbei: Von da kopiert die Zeit eh schon seit Jahren.

    Bei der Zeit wäre es gut, wenn man über die API die Artikel vom Kommentarsystem abtrennen könnte. Denn bei Kritik und Metakritik ist man bei der ZEIT sehr dünnhäutig und löschwütig geworden.

    Aus meiner Sicht sollten Disclaimer immer am Artikelanfang stehen. Aber eine prima Idee schon mal. Danke.

  3. @y2, wenn du dort auch so kleinlich bist, kann ich deren Duennhaeutigkeit verstehen.
    Es steht hier doch immer rechts oben, dass netzpolitik.org von Zeit.de vermarktet wird.

    1. @janosch: Es ist einfach guter Stil. Zumal man es es dann vorm Lesen weiß. Gute Wissenschaftler legen auch ihre Quelldaten offen und schreiben auch wer Ihre Studie finanziert hat und wo sie arbeiten.

      Und, da ich kleinlich bin:
      Diese Informationen gehören *in* den Artikel.
      Dir ist der Unterschied zwischen einem Bild das man nicht immer lesen kann und Text bekannt?

      Ich kommentiere nicht auf ZEIT ON. Wohl aber auf einer Meta-Plattform dazu. Macht mehr Spaß und ist interessanter.

      EOD.

      1. [details]Wer eine Studie finanziert hat, steht in wissenschaftlichen Artikeln im Allgemeinen aber auch erst am Ende.[/details]

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.