Afghanistan-KriegstagebuchWie aus großen Datensätzen die Zukunft vorhergesagt werden soll

Aus großen Datensätzen lassen sich mitunter Prognosen für die Zukunft ableiten. Ein Forscherteam hat jetzt aus den von WikiLeaks veröffentlichten Afghanistan-Kriegstagebüchern berechnet, wo und wie stark kriegerische Auseinandersetzungen in den Jahren nach den Daten auftreten würden. Im Vergleich mit den tatsächlichen Entwicklungen waren die Vorhersagen erstaunlich korrekt.

Afghan map at different times with intensity colors

Während WikiLeaks derzeit eher mit boulevardesken Meldungen Schlagzeilen macht, werden erste wissenschaftliche Untersuchungen aus den veröffentlichten Datensätzen bekannt. Jetzt wurde die Dissertation Point process modelling of the Afghan War Diary veröffentlicht, in der Andrew Zammit-Mangion zusammen mit einem kleinen Team die Afghan War Diary analysiert hat. Aus dem Abstract:

Unsere Ergebnisse zeigen, dass unser Ansatz ermöglicht, tiefere Einsichten in die Dynamik von Konflikten zu erhalten und eine erstaunlich genaue Vorhersage von bewaffneten Kämpfen im Jahr 2010 zu treffen, ausschließlich auf der Basis von Daten aus früheren Jahren.

Das Paper besteht zu einem Großteil aus statistischen Konzepten und Formeln. Erst im letzten Kapitel wenden sie ihre statistischen Herleitungen auf die 77.000 veröffentlichten Berichte an. Dazu nahmen sie vor allem die präzisen Zeit- und Ortsangaben jedes Berichts. Aus diesem Datensatz prognostizierten sie, wie stark die Kämpfe in den einzelnen Regionen Afghanistans in 2010 sein würden. Auf GitHub gibt’s den verwendeten Code.

Die Ergebnisse der Forscher kamen der Wirklichkeit erstaunlich nahe, wie Jon Bardin in der Los Angeles Times zusammenfasst. Das Modell wurde nicht einmal durch die Entsendung von weiteren 30.000 amerikanischen Soldaten durch Obama beeinflusst. Und es war auch in relativ ruhigen Regionen wie dem Norden erstaunlich genau.

Das ist nicht die erste Prognose der Zukunft aus großen Datensätzen der Vergangenheit oder Gegenwart. Bereits vor zwei Jahren haben Forscher von HP Labs aus öffentlichen Tweets den Umsatz von Filmen an der Kinokasse berechnet. Ebenfalls 2010 investierten Google und die CIA in das Startup Recorded Future, dass aus Webseiten, Blogs und Tweets Prognosen abgeben will. Und gleich mehrere Forschungsteams wollen aus Twitter Prognosen für Börsenkurse errechnen.

Noch immer nicht alle Dokumente veröffentlicht

Neben Twitter bieten auch die von WikiLeaks veröffentlichten Daten noch viel Raum für spannende Forschung. Leider sind noch immer 15.000 Berichte der Afghan War Diaries nicht veröffentlicht. Damals hieß es, diese werden auch öffentlich, wenn man Hinweise auf Quellen entfernt hätte. Das ist bis heute nicht geschehen. Die Domain wardiary.wikileaks.org geht gar nicht mehr.

In einem Feature von WDR und DLF geht Marc Thörner diesen Berichten nach. Auch er bekam damals den vollständigen Datensatz von WikiLeaks, um sie für Tagesspiegel und WDR aufzuarbeiten. Durch seine Erfahrungen vor Ort in Afghanistan verfasste er eine Analyse mit tiefgehender politischer Einordnung des Konflikts. Doch kurz vor der koordinierten Veröffentlichung flog der Tagesspiegel aus dem Team der veröffentlichenden Medien heraus. Seine einen Tag später veröffentlichte Analyse fand kaum Beachtung.

Ein Uni-Forschungsseminar in Frankfurt bestätigt seinen Unmut:

Die Studentinnen Franziska Kreische und Katharina Ochsendorf werten zunächst die Medienberichte vom 26. und 27. Juli 2010 aus. Dabei stellen sie fest: Eine politisch gewichtete Analyse findet sich allein im Tagesspiegel vom 27.7.2010. Nur hier hätten sie Informationen über die Doppelspiele afghanischer Politiker und Parteien gefunden, Hintergründe über den Putschversuch gegen Karzai und die ethnisch motivierten Auseinandersetzungen.

Doch als sie die entsprechenden Passagen bei WikiLeaks in der Online-Veröffentlichung suchen, stellen sie fest: Gerade dieser politisch brisante Teil der Afghan Warlogs ist im Netz nicht zu finden.

Daniel Domscheit-Berg sagte Marc Thörner, dass die angekündigte Aufarbeitung und Veröffentlichung der Threat Reports wichtig gewesen wäre. Aber statt dessen hat sich WikiLeaks gleich dem „Hype um die nächste Publikation, den Irak-Dokumenten“ zugewendet.

Hier gibt’s die MP3.

7 Ergänzungen

  1. Bleibt nur zu hoffen, dass sie ihre freien Parameter nicht mit dem Wissen von 2010 getuned haben.

    1. Wenn genügend Rechenkapazität (z.B. Quantencomputer) verfügbar ist, und man als Datenbasis z.B. den Googleindex nutzt dann könnte man sicherlich SEHR genaue Prognosen, sowohl für ein Individuum als auch für das Kollektiv aller Weltbewohner errechnen.

      Wenn die Menschen aber die Prognose erfahren, diese Öffentlich wird. Dann könnte diese Information das Verhalten der Menschen so beeinflussen das sie die Prognose über den Haufen werfen. Deshalb müssten solche Prognosen von der herrschenden Elite vor den Menschen geheim gehalten werden um das Wissen zu nutzen um die Geschichte bewusst steuern zu können.

  2. Meine persönliche Prognose für die nächsten Jahre wird ganz einfach sein:
    1.Die Weltwirtschaft wird zusammenbrechen, weil infolge unseres völlig unkontrolliertem Finanzsystems, das auf Zins und Zinseszins beruht, (also de facto von vornherein dem Niedergang geweiht ist), hat längst den Siedepunkt erreicht.
    Die Deutsche Bank streicht stellen im Investmentwesen, das bedeutet, auch die haben längst begriffen, dass in der Zukunft keine Sau mehr viel in diesen maroden Karren investieren wird.
    Jetzt wird nur noch „Schadensbegrenzung“ betrieben, um noch zu raffen was zu raffen ist.
    Die warten nur noch die Ratifizierung des ESM-Vertrages ab.
    Sie hätten es gerne etwas früher gehabt, aber jetzt wo klar ist das Griechenland aussteigt wird es wohl etwas schwieriger für die Karlsruher Richter das Ding abzusegnen, aber die Lobbyisten kümmern sich mit aller Vehemenz gerade darum

    2. Auch wird es kein soften Übergang in ein Menschenwürdiges System geben, da fast alle Regierungen auf Kampf gebürstet sind.
    Die immer mehr mmgreifenden Restriktionen sind eine klare Ansage.

    3. Es wird sehr wahrscheinlich in der absoluten Endphase des neoliberalistischen Kapitalismuses, dann wohl doch einen Bürgerkrieg geben, worauf dann eine Art Diktatur unter dem Deckmantel einer Scheindemokratie folgt.
    Natürlich wird bis dahin weiterführend, umfangreiche Maßnahmen im Abbau von Sozialleistungen und in der Gesundheitsversorgung getroffen werden.

    1. Deckt sich (leider) mit meiner düsteren Prognose.

      Aber ach … was muß man sich nicht alles anhören. „Verschwörungstheorie“, „Fiktion“, „Ich kann mir das nicht vorstellen“, …

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.