Das Internet wird hauptsächlich genutzt für…

David Fifield und Brandon Enright haben mit Hilfe des Tools nmap die 1 Million Websites mit dem meisten Traffic gescant, und ihre favicons (die kleinen Logos in der Adresszeile, bei Netzpolitik ist es das hier) gespeichert. Die 288.945 einzelnen Icons wurden dann nach ihrer Häufigkeit und Gesamtreichweite skaliert. Nun präsentiert nmap.org eine 37.440 x 37.440px Datei, die darstellt wie viele aufgerufene Seiten das jeweilige favicon hatten. Daraus lässt sich nicht direkt ablesen, was auch tatsächlich am intensivsten genutzt wird, aber immerhin, wie häufig auf das jeweilige Angebot zurückgegriffen wird.

Netzpolitik.org findet ihr übrigens hier links unten in der Ecke.

Weitere Details nach dem Klick auf
Update: Da bei nmap.org nicht genau beschrieben wird, nach welchen Parametern sich die Größe der Icons genau richtet, haben ich mal eine Email mit der Bitte um genauere Erläuterung geschrieben.

Hier findet sich dieselbe Analyse, basierend allein auf der Häufigkeit der Icons (daher die anfänglichen Unklarheiten, danke fürs Nachhaken, Christoph Kappes). In dieser Grafik wird z.B. Blogger.com recht groß, und google und Facebook sieht man gar nicht mehr, weil es nur einzelne Seiten sind. Meines Erachtens die interessantere Grafik, insbesondere im Hinblick auf Open-Source-CMS‘ wie Drupal, WordPress, Joomla, aber seht selbst.

In den FAQs werden einige Auffälligkeiten der Grafik besprochen.

David Fifield hat außerdem alle technischen Details, Dateien, und Programme auf seiner Website veröffentlicht.

Unix-User können über
bzr get http://www.bamsoftware.com/bzr/favicon-progs
sowohl das nmap-script als auch das Programm, mit dem die Grafik erstellt wurde, herunterladen.

21 Ergänzungen

  1. jetzt nocheinmal bauen mit clustern. „social web“ „raubkopien“ „pornos“ jeweils alle zusammen in einen rahmen und mal vergleichen.

    1. Hätte vermutet es kommt ein anderes Ergebnis raus. Eine interessante Übersicht der Pages aufgrund vom Traffic

  2. Pornos sind tatsächlich beim drüber gucken einige große icons dabei.
    Z.B.
    xhamster (Hamster unter twitter)
    xnxx (X auf blaum Grund unter der linken facebook kante)
    xvideos (XV auf weißem Grund. Verdächtig mittig platziert)
    Redtube (Schwarzes R auf rotem Grund rechts oben neben youtube)
    Youporn (YT auf Pinkem Grund ein gutes stück unter Wikipedia)

  3. Klasse! Und jetzt will ich eine Auswertung der Nutzer, die am meisten verlinken, twittern und bloggen mit Gravatar-Ansicht. Also, quasi die Web 2.0-Infografik der Nutzer – statt der Plattformen.

  4. Ich habe schon mehrmals gelesen, dass Social Networks inzwischen das Ansehen/Herunterladen von Pornographie als häufigste Beschäftigung im Internet abgelöst haben. Diese Grafik lässt das ebenfalls vermuten…

  5. Ich sag´s ungern, aber die Quelle sagt zur Errechnung der Icongrösse:
    „The area of each icon is proportional to the sum of the reach of all sites using that icon.“

  6. @ Christoph Kappes: Der Satz hat mich auch gewundert. Allerdings habe ich mir das Script unter http://nmap.org/svn/scripts/http-favicon.nse mal angeschaut, und mit nmap kann man den „reach“ auch gar nicht erfassen.

    Was aber wohl möglich und auch wahrscheinlich ist, ist dass die Daten von Alexa zur !Gewichtung! der Icons genutzt wurden. So wäre dann zu erklären, dass das auf vielen Servern laufende WordPress-favicon trotzdem so weit oben steht.

    Leider erläutern die Autoren ihr Vorgehen nicht besonders gut. Ich habe Ihnen jetzt eine Email geschrieben, und mal im Detail nachgefragt.

  7. Ich kann noch nicht vollständig nachvollziehen, was die da gemacht haben, aber eins sagt die Grafik mit Sicherheit nicht aus: Wofür das Internet hauptsächlich genutzt wird. Sie sagt vielleicht aus, welche Webseiten hauptsächlich genutzt werden. Aber Webseiten sind bekanntlich nur ein Teil des Internets.
    Deshalb nennt sich das Ding ja auch „Icons of the Web“ und nicht „Icons of the Internet“.

    Das mit dem amazon-Logo, welches zwar vorhanden, aber nur ganz klein ist, soll übrigens einer der Fehler bei der Datenerhebung sein.

  8. Das ist ja mal eine interessante Darstellung der Seiten aufgrund der Traffic. Hat ein paar grössere dabei die ich noch nicht kannte.
    mfg Martin

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.