Marketing der NSA: Wir rühren nur 1,6% des weltweiten Internetverkehrs an

nsa-eagleBereits am 9. August veröffentlichte die NSA ein Memorandum, mit dem sie kleine Einblicke in ihre Arbeit sowie ihre rechtlichen Begründung für die weltweite Überwachung des Internetverkehrs geben will. In diesem Dokument nennt die NSA auch erstmalig Zahlen, wie viel Daten angeblich von ihr abgegriffen und analysiert werden, nämlich 0.00004% des weltweiten Datenverkehrs im Internet. Was auf den ersten Blick nach wenig klingt – und selbstverständlich auch nach wenig klingen soll – entpuppt sich bei näherer Betrachtung als eine größere Menge an Daten, als sie täglich von Google verarbeitet wird. Entscheidend jedoch bleibt: eigentlich spielt die Menge der Daten überhaupt keine Rolle.

Die NSA sah sich mehr und mehr in die Defensive gedrängt und beschloss deshalb nun selbst in die Offensive zu gehen, indem sie ein Memorandum veröffentlichte. Das auf den 9. August datierte Dokument, versucht die Hintergründe und Rechtfertigungen für die weltweite Überwachung des Internetverkehrs durch die NSA zu erklären. Auf Seite 6 des Dokuments findet sich folgende Rechnung, die belegen soll, dass die NSA ja eigentlich gar nicht so viele Daten sammelt und untersucht wie es ihr immer unterstellt wird.

nsa_16

Demnach schätzt die NSA den gesamten Internetverkehr auf 1826 Petabyte pro Tag. Von diesen 1826 Petabyte, werden aber überhaupt nur 1,6% „angerührt“ (was genau „angerührt“, im englischen „touch“, bedeutet ist nicht klar), was rund 29.000 Terabyte (oder 29 Petabyte) entspricht. Von diesen 29.000 Terabyte werden aber angeblich wiederum nur 0,025% tatsächlich von der NSA untersucht, was rund 7 Terabyte pro Tag entspricht. Wie unter anderem The Atlantic Wire berichtet, entspricht dieses aber 0,0004% und nicht 0,00004% des gesamten Internetverkehrs, wie es die NSA fälschlicherweise behauptet. Die NSA analysiert also 10 mal mehr Daten, als sie in ihrem Memorandum angibt.

Arstechnica hat einige Vergleiche angestellt, die zeigen was für eine enorme Datenmenge von der NSA verarbeitet wird, auch wenn die Zahlen vielleicht etwas anderes suggerieren. So verarbeitet die NSA mit ihren täglichen 29 Petabyte erheblich mehr als der Internetriese Google, der auf täglich rund 20 Petabyte kommt. Und selbst einige amerikanischen Internetknoten können es nicht mit dem Datenaufkommen der NSA aufnehmen:

While 29.21 petabytes is a fraction of the overall traffic on the Internet, it is the equivalent of the traffic that passes through several major Internet exchanges each day. It amounts roughly to 2.77 terabits per second—more than the average throughput of the Equinix exchange network, the CoreSite Any2 Exchange, New York International Internet Exchange (NYIIX), and Seattle Internet Exchange (SIX) combined. In other words, the 1.6 percent of the total of Internet traffic „touched“ by the NSA could easily contain much of the traffic passing through the US‘ core networks. It can certainly include all the traffic inbound from and outbound to other nations.

Wie groß diese Menge ist, lässt sich aber auch im Vergleich zur deutschen Vorratsdatenspeicherung erkennen. Im März 2010, nach dem Urteil des Bundesverfassungsgerichts gegen die Vorratsdatenspeicherung, gab die Telekom bekannt, dass sie ihre gesamten Vorratsdaten lösche. Größe: 19 Terabyte. Mit den Worten der NSA: rund 0,00066% der Menge an Daten, welche die NSA pro Tag „anrührt“.

Sollten die Zahlen der NSA korrekt sein, lässt sich aus den Daten auch schließen, dass bei einer Datenbankabfrage der NSA, pro Anfrage rund 12 Megabyte an Daten verarbeitet werden, wie The Atlantic Wire vorrechnet:

Twenty million queries, as Drum points out [ein Artikel von Kevin Drumm bei MotherJones], is a lot of daily queries (or, if you prefer, database searches). It’s about 666,000, in fact, in a 31-day month. That’s about seven queries every second. (How the NSA defines „query“ in this context isn’t clear.) In the context of the amount of data the NSA processes, it’s also significant. Each day, using the 0.025 percent of 1.6 percent figure above, the government reviews about 7.304 terabytes of data. If you’re curious, the ratio of data reviewed to number of queries is about 12.2 megabytes — meaning that the government sets aside 12 megabytes for every query it runs.

Zusätzlich ist es aber auch interessant zu schauen, welche Dienste welchen Anteil am Internetverkehr haben. So berichtete Variety im Mai diesen Jahres, dass der Video-on-Demand Anbieter Netflix und Youtube für rund 49% des gesamten amerikanischen Internetverkehrs verantwortlich sind. Solche Videodaten sind für die NSA aber nahezu nutzlos. Sollten solche Dienste aus den Berechnungen ausgeschlossen werden, würde der Anteil der von der NSA untersuchten Daten, im Vergleich mit dem gesamten Internetverkehr, noch einmal steigen.

Wie arstechnica aber herausstellt, spielt die Menge an Daten welche die NSA sammelt und untersucht, eigentlich aber überhaupt keine Rolle.

Regardless how much data flows through the NSA’s tap points, all of it is getting checked. While the NSA may „touch“ only 29.21 petabytes of data a day, it runs its digital fingers through everything that flows through the tap points to do so.

Arstechnica geht davon aus, dass die NSA Tools zur Analyse von Datenpaketen einsetzt, um dadurch bestimmen zu können, welche Daten überhaupt relevant sind und daraufhin analysiert werden müssen. Um bei dem Beispiel von eben zu bleiben: erkennen die Tools Videodaten von Youtube oder Netflix, werden diese gar nicht erst „angerührt“, da kein Erkenntnisgewinn zu erwarten wäre. Gleichzeitig würden diese Analysen aber auch nicht in die offizielle Statistik der NSA einfließen. Wie bereits vorhin erwähnt: die genaue Definition von „touch“ ist unklar. Dennoch kann davon ausgegangen werden, dass die NSA etwas anderes darunter versteht als wir Bürger, wie es die EFF auch für eine Reihe anderer Begrifflichkeiten erklärt hat.

Es bleibt also festzuhalten, dass die NSA durch das geschickte Spiel mit Zahlen versucht den Eindruck zu erwecken, dass sie eigentlich überhaupt nicht viele Daten sammeln – jedenfalls im Vergleich zum gesamten weltweiten Internetverkehr. Tatsächlich verarbeitet sie aber täglich mehr Daten als Google oder einige Internetknoten in den USA zusammen, ganz zu schweigen von den Daten welche bei der Vorratsdatenspeicherung in Deutschland anfielen. Ebenso wichtig ist aber auch die Feststellung, dass die Angaben der NSA eigentlich überhaupt keinen Wert haben, da erstens der Begriff „touch“ nicht näher erläutert wird. Und zweitens, da die NSA vermutlich sowieso jeglichen Datenverkehr mitliest, aber eben nur in bestimmten Fällen näherer Analysen durchführt. Den Zahlen der NSA ist als keine ernsthafte Aussagekraft beizumessen.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

9 Ergänzungen

  1. Es ist doch vollkommen irrelevant welche Zahlen offiziell genannt werden. Es sind sowieso alles Lügen. Niemand kann dieser Zahlen verifizieren. Sich überhaupt Gedanken über Äußerungen eines notorischen Lügners zu machen, ist reine Zeitverschwendung.

    1. Nunja, sie lügen nicht direkt. Der Satz „Niemand hat vor, eine Mauer zu bauen“ würde heute so formuliert werden: „Es bestehen keine Pläne der SED, eine Mauer um ganz Berlin zu ziehen“. War ja auch nur Westberlin. Und Checkpoint Charlie war eher ein Tor. Und den Plan hatte das Ministerium, nicht die SED. Insofern ist das Ganze wie ein Negativ: Was zwischen den Zeilen steht kommt der Wahrheit näher als das, was man vordergründig sieht.

      Aber lügen? So plump sind unsere Herrscher jetzt nicht mehr.

      1. Es ist doch gleich ob mich direkt oder indirekt, ob relativieren anderweitig rhetorisch Rumwieseln. Letztendlich muss jede Aussage als Lüge bzw. als winzigen Teil einer möglichen Wahrheit betrachten.
        Außerdem wurde die NSA in letzter Zeit beim direkten Lügen ertappt:

        NSA: Wir machen das

        Presse: Aber die Daten belegen das

        NSA: Na gut, aber das ist alles nicht so schlimm. Das sind Einzelfälle.

        Presse: Unsere Daten widersprechen dem

        NSA: Da muss uns wohl ein kleiner Fehler unterlaufen sein…Das wollten wir gar nicht

        Presse: neue Fakten

        NSA: Na gut, dann geben wir euch halt ein paar aus der Luft gegriffene Zahlen

        Presse: to be continued…

        So geht das die ganze Zeit!

  2. Nicht damit beschäftigen. Alles Lügen, Drohungen, bestenfalls Ungenauigkeiten. They think, thy are making the world…. untrue.

  3. Also ich denke die Zahlen stimmen so und sie wurden veröffentlicht weil sie sich als so wenig anhören.
    Aber was seid ihr denn so negativ? Das ist doch mal ne (offiziell bestätigte) Zahl, mit der man hausieren gehen kann.
    Die NSA guckt sich mehr Daten an als Google. Das ist dieser Riesenkonzern, dessen Geschäftsmodell es ist, das Internet herunterzuladen.
    Die NSA guckt sich am Tag über 4000 mal so viele Daten an wie die Vorratsdatenspeicherung im Jahr (!) eingesammelt hat. Das ist das Ding, was vom Verfassungsgericht ohne Zögern einkassiert wurde weil es unsere Privatsphäre verletzt.
    usw.

  4. netflix und youtube stehen für 49% des amerikanischen Internet-traffics? wtf? Kann jemand diese Zahl erklären/belegen? Das erscheint mir doch recht viel!

  5. Da gab es einmal eine Geschichte von einem Gärtner und seinem Lehrling… der Lehrling hatte Erdbeeren in der Sonne stehen lassen und der Gärtner war stinksauer. Erwiderte der Lehrling: „Ja, was haben sie denn? Die Erdbeeren hatten vorher einen Wasseranteil von 99% und jetzt sind es halt nur noch 98%. Ist doch nur 1% weniger!“ In Wahrheit hatten die Erdbeeren aber die Hälfte an Gewicht eingebüßt… man sieht also, dass relative Zahlen immer mit ein wenig Skepsis anzufassen sind.

    „nur“ 1,6% klingt erstmal nicht viel, aber selbst wenn es „nur“ 1,6% allen Traffics einer jeden Person wären, so wäre dies mehr als jede 100. Anfrage, die von der NSA eingesehen werden kann… überlegt euch mal, wieviele solcher Anfragen ihr allein am Tag macht…

    Davon ab ist das ja, wie schon erwähnt, nur das Datenvolumen. Nicht die absolute Anzahl an Daten. Und ja, YT-Videos oder TV-Streams werden für die NSA weniger interessant sein als Textinhalte, die deutlich weniger Datenvolumen pro Anfrage brauchen. Vermutlich kämen alle E-Mails zusammen auf viel weniger als 1,6% des weltweiten (oder nur amerikanischen) Volumens…

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.