Netzpolitik-Podcast 057: Die deutsche Blogosphäre kartografieren

Dieser Netzpolitik-Podcast 057 ist etwas besonderes: Einerseits habe ich mit John Kelly einen Interviewpartner dabei, mit dem ich erst vor zwei Folgen über „Mapping the global blogosphere“ in meinem Büro in Berlin besprochen habe. John Kelly ist Gründer von Morningside Analytics und Partner vom Democracy & Internet Project beim Berkman Center. Damals ging es um die Kartografierung der US- und iranischen Blogosphere, die er beide als Projekt abgeschlossen hat. Nun untersucht er weitere Blogosphären, darunter auch die deutschsprachige. Bisher gibt es ja wenig Netzwerk-Analysen und vor allem kein mir bekanntes Kartenmaterial, was die Vernetzung der deutschen Blogs visuell aufzeigt. Bei meinem New York Trip habe ich ihn besucht und nachdem seine Software innerhalb des deutschsprachigen Raumes für eine Woche ca. 10.000 Blogs und andere Seiten durchgespidert hat, konnte ich einen Blick auf die ersten Bilder werfen.

Die Arbeitsschritte der Kartografierung:

Die folgenden Bilder sind ganz frühe Alphaversionen, wie sie der Computer vor einer Bearbeitung ausgeworfen hat. In dem Podcast erklärt John den weiteren Weg. Zuerst laufen Spider (Software-Roboter, die automatisch Links folgen) eine gewisse Anzahl von Seiten ab, die Blogs sein könnten. In diesem Fall sind es ca. 10.000 gewesen. Aber hier ist nicht alles ein Blog. Im nächsten Schritt wird jeweils mit einem wissenschaftlichen Team im jeweiligen Kulturraum die Nicht-Blogs aussortiert, sowie alles, was Spam-Blogs sind. (Zu letzterem gibts gleich noch interessantes). Hier hat sich für den deutschsprachigen Raum Jan Schmidt als Koordinator angeboten und ich hoffe, die Zusammenarbeit klappt. Nach der Bereinigung laufen die Spider nochmal über die Daten und suchen nach weiteren Vernetzungen. Gleichzeitig wird mit den lokalen Teams dann in Form von kleinen Fragebögen pro Blog geschaut, welche Themen diese behandeln und ob es etwas über die AutorInnen zu erfahren ist (Geschlecht, ca. Alter, etc) und diese den Blogs zugeordnet. Zum Schluss wird dann eine vorläufige visuelle Endversion der Vernetzung erstellt. Bei den US- und iranischen Blogs sind hier ganz interessante Analysen bei herausgekommen. In den USA sieht man bei den politischen Blogs z.B. eindeutig die beiden grossen Lager. Aber auch Wolke der Law- und Tech-Blogs. Bei den iranischen Blogs sind tatsächlich die Poesie-Blogs mit ihrer Wolke am deutlichsten zu sehen. Das Material wird dabei ständig aktualisiert, um Veränderungen kennen zu können. Blogs werden stillgelegt oder andere steigen auf, etc.

Die deuschsprachige Blogosphäre als Alpha-Karte: (Grosse Auflösung)

Die vielen kleineren Wolken, die nicht beschriftet sind, sind tatsächlich Spam-Netzwerke. Bis auf die drei beschrifteten Wolken sind uns keine anderen Pattern aufgefallen.

Eine Kurz-Analyse des Alpha-Materials:

Nach einigen Stunden Analyse des Datenmaterials war offensichtlich, dass einerseits eine Vielzahl von „Massen-Medien“ wie Spiegel.de, Heise.de und was es nicht alles gibt noch dabei waren. Das liegt daran, dass Blogs diese viel verlinken. Aber was noch interessanter war: Es scheint im deutschsprachigen Raum viel mehr Spam-Netzwerk aus Blogs zu geben, als in anderen Sprachräumen. Während die „allgemeine Blogosphere“ als grosser Klumpen zu sehen ist und sich keine besonderen Netzwerke herausbildern, sind mir nur zwei besondere Wolken neben den vielen Spam-Wolken aufgefallen: Strickblogs und Blogsport.de! Erste Wolke sieht man am linken Rand und diese Wolke ist weitgehend selbstständig, d.h. es gibt wenig Vernetzung in die allgemein bekannten Blogs. trotzdem sind das eine ganze Menge Blogs, die sich irgendwie um Stricken, Handarbeiten und ähnliche Themen drehen. Ich kannte davon keines. Die andere Wolke hat mich überrascht. Denn Blogsport.de ist nur einer von einigen deutschsprachigen Blog-Betreibern und stellt trotzdem eine eigene Wolke da, die sichtbar ist. Das liegt vermutlich daran, dass hier viele Antifagruppen und ähnlich-thematische Blogs sich gegenseitig verlinken und wenig Kontakt zur allgemein bekannten Blogosphäre haben. Eine „rechte“ Wolke habe ich dabei nicht gesehen. Rechte Blogs wie PI waren nahe z.B. vom Lawblog zu finden. Was wiederum darauf schließt, dass z.B. es Leser gibt, die beide Blogs verlinken.

Ein kleiner Ausschnitt aus der Wolke „Bekanntes“: (Grosse Auflösung)

Ein kleiner Vergleich der Pattern:

Als Vergleich eine Alpha-Version der französischen Blogosphäre, nur um mal die unterschiedlichen Wolken zu zeigen. Ich hab mir auch noch die chinesische Alpha-Version angeschaut, die ähnliche Pattern hatte. Aber da verstanden wir beide nichts. Bei den Franzosen fiel mir auf, dass die überwältigende Mehrheit bei einem französischen Blog-Hoster ist, während in Deutschland die meisten unter einer eigenen Domain und wohl eigenen Blog-Systemen laufen (Wie schon geschrieben, sind das nur jeweils ca. 10.000 Samples und eher A-, B- und C-Blogger). Unglaublich viele Blogs in der französischen Ansicht waren bei canalblog.com gehostet. Die unterschiedlichen Pattern im Vrgleich zur deutschen Blogosphäre interpretierte John vorsichtig als unterschiedliche Reifegrade. Die deutsche Blogosphäre ist noch nicht so ausdifferenziert, wie z.B. die US-Blogosphäre. Und Deutschland scheint viel mehr Spam-Blog-Netzwerke zu haben, die sich gegenseitig verlinken, um bei Suchmaschinen nach oben zu kommen. Teilweise habe ich Spam-Netzwerke mit mehr als 50 Blogs gefunden, die auf den riesigen Punkten zu sehen sind.

Zum Vergleich die französische Blogosphäre in einer Alpha-Version: (Grosse Auflösung)

In dem ca. 24 Minuten langen englisch-sprachigen Podcast-Interview gibt es die Informationen nochmal ausführlicher und wir schauen uns dabei die Karten und das Material an. Es liegt als MP3 (22MB) und OGG (23MB) vor.

Ich bin gespannt auf die weiteren Ergebnisse. Die Arbeit von John Kelly ist sehr spannend und das Ziel ist, irgendwann einmal die globale Blogosphäre abbilden zu können. Ich wünsche ihm viel Erfolg dabei und freue mich schon auf die ersten Beta-Versionen, die dann von Spam bereinigt sind und etwas andere Pattern zeigen.

Ethan Zuckerman hatte auf der Media Re:public – Konferenz im März einen Vortrag von John Kelly mitgebloggt: John Kelly and mapping blogosphere links. Und auch das Internet & Democracy Projekt hat mitgebloggt: John Kelly: Parsing the Political Blogosphere.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

42 Ergänzungen

  1. Weil Du es im Beitrag erwähnst: Ich stehe in Kontakt mit John, hatte selbst aber noch keine Gelegenheit, mir die Daten näher anzusehen bzw. mich mit der Methode auseinander zu setzen. Das, was ich hier bei Dir lese, ist also auch neu für mich (und höchst faszinierend…) :)) Aber ich werde in den kommenden Wochen mit John Kelly mal etwas tiefer in die Analyse einsteigen…

  2. Wer jemals einen Spider geschrieben hat, ist auf ähnliche Ergebnisse gekommen.Das ist eine Frage der Spidertechnik. Verlasse ich mich dabei auf die Vernetzungsdichte innerhab eines Knotens bin ich in Deutschland bei den Top 100 wie festgenagelt.

    Natürlich haben wir in Deutschland SEO-Spaminseln und die SPAM-Schleudern der Neoliberalen, weil bei uns sehr gerne alles recht gründlich gemacht wird. Das sie sich isolieren liegt ebenfalls an der deutschen Mentalität. Wir verlinken die aus Prinz nicht.

    Wenn ich etwas über die Bedeutung aussagen will, brauche ich also andere Bewertungsmodelle.

  3. Herzlichen Glückwunsch,

    da haben wir ja mal wieder Tools die – weiterentwickelt – heute schon in den USA als Überwachungsinstrumente – inkl. Stochastik – gegen die eigene Bevölkerung eingesetzt werden.

    Träumt also schön weiter. Am gefährlichsten sind noch immer ahnungslose Autoditakten .

  4. Danke für den Hinweis, hab das korrigiert und die grossen Auflösungen müssten jetzt funktionieren.

  5. die podcast-dateien sind gerade nicht erreichbar. wir arbeiten daran und entschuldigen uns für die 404.

    update: die bilder in hoher auflösung funktionieren wieder.

    update 2: die podcasts laden gerade hoch, in ca. 12 ETA minuten sind sie wieder da.

    update 3: alle dateien wieder verfügbar, der sync hatte sich verirrt.

  6. Hi ,
    ich bin ja eigentlich sehr erstaunt, das es nicht eine große dichte Wolke gibt in Deutschland so wie in Frankreich. Oder aber so 5 bis 6 wolken die etwas dichter bei einander liegen. Das so wie sich das bis her darstellt ist man nicht gerade unter den Blogern sehr mit einander vernetzt, so wie man immer dachte. Das sieht nicht aus wie ein Netzwerk, das sieht aus wie kleine bis größere Gruppen, die gerne für sich alleine bleiben.

    Die Frage ist ob sich das ändern lässt und ob man das auf Bloger Seite auch gerne ändern würde???

    MfG

    Michael finger
    Holztechniker

  7. Vielleicht bedeutet die Dispersion nicht, dass die Vernetzung fehlt, sondern dass keine ZENTRALISIERUNG da ist.

    Das wäre doch mal was Positives.

  8. hi Peer,
    aber wenn man so bei Robert mitgelesen hat, stellt man fest, das die Vernetzung nach lässt bei den Blogs untereinander.

    Wobei du natürlich recht hast KEINE Zentralisierung ist schon sehr gut, so ist man schon mal sicher das es nicht von einem oder mehreren großen Blogern ausgeht, das Netzwerk der Bloger.

    MfG

    Michael finger
    Holztechniker

  9. Diese Karte ist das übliche Bild, dass man auch schon aus anderen Versuchen kennt, die blogs zu messen.

    Man wird immer wieder in den Top 100 hängenbleiben, da diese sich inzestiös verlinken. Da man am Ende immer wieder bei einem Basic herauskommt, einem Niggemeier oder ähnlich herauskommt, die dann wieder die gleichen Personen verlinken (wenn sie denn überhaupt noch verlinken) wird die Blogosphäre nie als gesamtes abgebildest werden.

    auf jedem Gebiet gibt es ein paar Blogs die einfach Meister ihrer Klasse sind, aber sobald diese eben in ihrem eigenen Kreis nur verlinkt werden, werden diese nie in solch einer Übersicht erscheinen.

  10. ich kam nun endlich auch mal dazu, den podcast anzuhören. super sache. aber bitte in zukunft auf die laustärke achten, das ist ja unerträglich leise. nochmla nachträglich normalisieren?

  11. Sorry, aber für die Analyse der dt. Blogs taugt der Algorithmus, den John Kelly verwendet (bzw. seine Software): leider nichts.

    Da gibt es besseres.

    Wobei, so fair sollte ich schon urteilen, es natürlich grundsätzlich spannend ist, gleich die ganze Blogosphäre zu karthografieren. Die Software, die ich kenne, ist im Vergleich zwar deutlich präziser (mit sehr instruktiven Wölkchen und Verbindungen, die sich dann bilden), aber keineswegs in der Lage, alle (!) deutschen Blogs zu katographieren.

    Tja. Insofern ist mein Beitrag vielleicht nicht sehr hilfreich. Ich habe auch, jedenfalls im Moment, keine genaue Ahnung mehr, wo ich das überlegene Tool finde, von dem ich oben sprach.

    Ich hätte es dann nämlich für euch verlinkt, inklusive einiger Beispiele. In der Summe finde ich das, was John K. macht, relative unbrauchbar. Aber vielleicht ist das auch ganz gut so.

    Nichts für ungut.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.