Netzpolitik-Podcast 057: Die deutsche Blogosphäre kartografieren

Dieser Netzpolitik-Podcast 057 ist etwas besonderes: Einerseits habe ich mit John Kelly einen Interviewpartner dabei, mit dem ich erst vor zwei Folgen über „Mapping the global blogosphere“ in meinem Büro in Berlin besprochen habe. John Kelly ist Gründer von Morningside Analytics und Partner vom Democracy & Internet Project beim Berkman Center. Damals ging es um die Kartografierung der US- und iranischen Blogosphere, die er beide als Projekt abgeschlossen hat. Nun untersucht er weitere Blogosphären, darunter auch die deutschsprachige. Bisher gibt es ja wenig Netzwerk-Analysen und vor allem kein mir bekanntes Kartenmaterial, was die Vernetzung der deutschen Blogs visuell aufzeigt. Bei meinem New York Trip habe ich ihn besucht und nachdem seine Software innerhalb des deutschsprachigen Raumes für eine Woche ca. 10.000 Blogs und andere Seiten durchgespidert hat, konnte ich einen Blick auf die ersten Bilder werfen.

Die Arbeitsschritte der Kartografierung:

Die folgenden Bilder sind ganz frühe Alphaversionen, wie sie der Computer vor einer Bearbeitung ausgeworfen hat. In dem Podcast erklärt John den weiteren Weg. Zuerst laufen Spider (Software-Roboter, die automatisch Links folgen) eine gewisse Anzahl von Seiten ab, die Blogs sein könnten. In diesem Fall sind es ca. 10.000 gewesen. Aber hier ist nicht alles ein Blog. Im nächsten Schritt wird jeweils mit einem wissenschaftlichen Team im jeweiligen Kulturraum die Nicht-Blogs aussortiert, sowie alles, was Spam-Blogs sind. (Zu letzterem gibts gleich noch interessantes). Hier hat sich für den deutschsprachigen Raum Jan Schmidt als Koordinator angeboten und ich hoffe, die Zusammenarbeit klappt. Nach der Bereinigung laufen die Spider nochmal über die Daten und suchen nach weiteren Vernetzungen. Gleichzeitig wird mit den lokalen Teams dann in Form von kleinen Fragebögen pro Blog geschaut, welche Themen diese behandeln und ob es etwas über die AutorInnen zu erfahren ist (Geschlecht, ca. Alter, etc) und diese den Blogs zugeordnet. Zum Schluss wird dann eine vorläufige visuelle Endversion der Vernetzung erstellt. Bei den US- und iranischen Blogs sind hier ganz interessante Analysen bei herausgekommen. In den USA sieht man bei den politischen Blogs z.B. eindeutig die beiden grossen Lager. Aber auch Wolke der Law- und Tech-Blogs. Bei den iranischen Blogs sind tatsächlich die Poesie-Blogs mit ihrer Wolke am deutlichsten zu sehen. Das Material wird dabei ständig aktualisiert, um Veränderungen kennen zu können. Blogs werden stillgelegt oder andere steigen auf, etc.

Die deuschsprachige Blogosphäre als Alpha-Karte: (Grosse Auflösung)

Die vielen kleineren Wolken, die nicht beschriftet sind, sind tatsächlich Spam-Netzwerke. Bis auf die drei beschrifteten Wolken sind uns keine anderen Pattern aufgefallen.

Eine Kurz-Analyse des Alpha-Materials:

Nach einigen Stunden Analyse des Datenmaterials war offensichtlich, dass einerseits eine Vielzahl von „Massen-Medien“ wie Spiegel.de, Heise.de und was es nicht alles gibt noch dabei waren. Das liegt daran, dass Blogs diese viel verlinken. Aber was noch interessanter war: Es scheint im deutschsprachigen Raum viel mehr Spam-Netzwerk aus Blogs zu geben, als in anderen Sprachräumen. Während die „allgemeine Blogosphere“ als grosser Klumpen zu sehen ist und sich keine besonderen Netzwerke herausbildern, sind mir nur zwei besondere Wolken neben den vielen Spam-Wolken aufgefallen: Strickblogs und Blogsport.de! Erste Wolke sieht man am linken Rand und diese Wolke ist weitgehend selbstständig, d.h. es gibt wenig Vernetzung in die allgemein bekannten Blogs. trotzdem sind das eine ganze Menge Blogs, die sich irgendwie um Stricken, Handarbeiten und ähnliche Themen drehen. Ich kannte davon keines. Die andere Wolke hat mich überrascht. Denn Blogsport.de ist nur einer von einigen deutschsprachigen Blog-Betreibern und stellt trotzdem eine eigene Wolke da, die sichtbar ist. Das liegt vermutlich daran, dass hier viele Antifagruppen und ähnlich-thematische Blogs sich gegenseitig verlinken und wenig Kontakt zur allgemein bekannten Blogosphäre haben. Eine „rechte“ Wolke habe ich dabei nicht gesehen. Rechte Blogs wie PI waren nahe z.B. vom Lawblog zu finden. Was wiederum darauf schließt, dass z.B. es Leser gibt, die beide Blogs verlinken.

Ein kleiner Ausschnitt aus der Wolke „Bekanntes“: (Grosse Auflösung)

Ein kleiner Vergleich der Pattern:

Als Vergleich eine Alpha-Version der französischen Blogosphäre, nur um mal die unterschiedlichen Wolken zu zeigen. Ich hab mir auch noch die chinesische Alpha-Version angeschaut, die ähnliche Pattern hatte. Aber da verstanden wir beide nichts. Bei den Franzosen fiel mir auf, dass die überwältigende Mehrheit bei einem französischen Blog-Hoster ist, während in Deutschland die meisten unter einer eigenen Domain und wohl eigenen Blog-Systemen laufen (Wie schon geschrieben, sind das nur jeweils ca. 10.000 Samples und eher A-, B- und C-Blogger). Unglaublich viele Blogs in der französischen Ansicht waren bei canalblog.com gehostet. Die unterschiedlichen Pattern im Vrgleich zur deutschen Blogosphäre interpretierte John vorsichtig als unterschiedliche Reifegrade. Die deutsche Blogosphäre ist noch nicht so ausdifferenziert, wie z.B. die US-Blogosphäre. Und Deutschland scheint viel mehr Spam-Blog-Netzwerke zu haben, die sich gegenseitig verlinken, um bei Suchmaschinen nach oben zu kommen. Teilweise habe ich Spam-Netzwerke mit mehr als 50 Blogs gefunden, die auf den riesigen Punkten zu sehen sind.

Zum Vergleich die französische Blogosphäre in einer Alpha-Version: (Grosse Auflösung)

In dem ca. 24 Minuten langen englisch-sprachigen Podcast-Interview gibt es die Informationen nochmal ausführlicher und wir schauen uns dabei die Karten und das Material an. Es liegt als MP3 (22MB) und OGG (23MB) vor.

Ich bin gespannt auf die weiteren Ergebnisse. Die Arbeit von John Kelly ist sehr spannend und das Ziel ist, irgendwann einmal die globale Blogosphäre abbilden zu können. Ich wünsche ihm viel Erfolg dabei und freue mich schon auf die ersten Beta-Versionen, die dann von Spam bereinigt sind und etwas andere Pattern zeigen.

Ethan Zuckerman hatte auf der Media Re:public – Konferenz im März einen Vortrag von John Kelly mitgebloggt: John Kelly and mapping blogosphere links. Und auch das Internet & Democracy Projekt hat mitgebloggt: John Kelly: Parsing the Political Blogosphere.

18 Kommentare
  1. selbstmörder 5. Jun 2008 @ 12:44
Unterstütze unsere Recherchen und Berichterstattung für Grundrechte und ein freies Internet durch eine Spende. Spenden