BreakpointDas Internet verrottet

Tote Links, gelöschte Webpages und geänderte URLs machen das Internet zu einem Ort der Sackgassen. Wie Informationen im Netz verschwinden, erinnert an einen der berühmtesten Bibliotheksbrände der Geschichte. Doch allzu oft sind es nicht Katastrophen, die Wissen vernichten, sondern Desinteresse.

  • Carla Siepmann
Holzschnitt, der eine brennende Bibliothek zeigt.
Verbrannte das Wissen in der Bibliothek von Alexandria? – Gemeinfrei: Holzschnitt: Hermann Goll

Als die Bibliothek von Alexandria in Flammen aufging, brannte das Feuer lichterloh. Riesige Stichflammen erhellten in dieser Nacht Ägyptens blau-schwarzen Himmel. Wesentliche Teile des gesammelten Wissens der Menschheit gingen verloren und der Verlauf der Menschheitsgeschichte wurde um Jahrhunderte zurückversetzt. Das könnte man zumindest meinen, wenn man History-Memern auf der Plattform Reddit glaubt.

Was in den einen Fällen plakativ als große Katastrophe der Menschheitsgeschichte gezeichnet wird, geschieht in anderen Fällen leise, schleichend und unbemerkt. Die wohl größte Ansammlung von Wissen und Dokumentationen befindet sich heute weder in einer Universitätsbibliothek noch in einem Staatsarchiv, sondern im Internet – und steht weitestgehend jederzeit zu unserer Verfügung. Unzählige Websites, digitalisierte Archive, Medienberichte, Videos, Fotomaterial und Zeitdokumente können wir mit wenigen Klicks direkt einsehen. 

Doch große Teile der im Internet veröffentlichten Dokumente sind schon heute nicht mehr verfügbar: Adressen haben sich geändert, Websites sind offline, Tweets gelöscht. 2023 waren rund 40 Prozent der 2013 hochgeladenen Seiten nicht mehr abrufbar. „Tote Links“ sind heute, rund dreißig Jahre, nachdem das World Wide Web für die breite Masse zugänglich wurde, ein verbreitetes Phänomen. „Link rot“ nennt man es, wenn verlinkte Belege und Verweise ins Nichts führen.

Wissen verbrennt nicht, es verrottet

Statt einer Antwort steht dann „Error 404: Page not found“ auf dem Bildschirm. Das ist nicht nur ein Problem für Forschende und Journalist:innen, deren Quellen verschwinden und Referenzen ungültig werden. Vielmehr ist es ein weitreichender Verlust an Wissen für die gesamte Öffentlichkeit. Die unendliche Verkettung von Informationen, das Netz aus Referenzen und neuen Quellen, die immer wieder gegenseitig aufeinander Bezug nehmen und dabei so umfangreich und gleichzeitig zugänglich sind wie nie zuvor, funktioniert nicht. 

Alles netzpolitisch Relevante

Drei Mal pro Woche als Newsletter in deiner Inbox.


Jetzt abonnieren

Dabei betrachten und nutzen viele Menschen das Internet als digitales Archiv. So als wäre das Sammeln von Links, das Posten von Fotos und Veröffentlichen von Texten im Internet ein Weg, dieses Material zu konservieren und als Dokumente unseres Abschnitts in der Geschichte der Menschheit haltbar zu machen. Das gilt für öffentliche Publikationen wie für private Erinnerungen: wissenschaftliche Abhandlungen, die nicht mehr in Büchern gedruckt werden, Zeitungsartikel, die Zeitungspapier nie gesehen haben, und private Erinnerungen, die statt in Fotoalben zu kleben auf Instagram gepostet werden. All diese Dokumentationen unserer Existenz, unseres politischen Seins, unserer wissenschaftlichen Erkenntnisse, unseres Alltags wie den Errungenschaften unserer Zeit, drohen zu verschwinden oder im Heuhaufen der geänderten Adressen und abgeschalteten Plattformen unauffindbar zu werden. 

Katastrophale Gleichgültigkeit

Inzwischen nehmen Forscher:innen an, dass die Bibliothek von Alexandria nicht in einem epochalen Feuer verbrannt ist. Als Caesars Legionen 48 vor Christus Alexandria in Brand setzten, erreichte das Feuer wohl nur ein kleines Lager der riesigen Bibliothek. Der wohl tatsächliche Grund für den Untergang der Bibliothek ist banal und vielleicht gerade deswegen katastrophaler als es ein Feuer je sein könnte: Gleichgültigkeit. Schriften, die auf Papyrus verfasst sind, müssen regelmäßig kopiert werden, weil das Material schnell zerfällt. Dass Bibliotheken bestehen, reicht nicht aus, um sie zu bewahren. Wer Bücher und Bibliotheken erhalten will, muss sie pflegen – sonst zerfallen sie. Dieses banale und doch endgültige Schicksal hat nicht nur die Bücher in Alexandria ereilt, sondern etliche Dokumente im Laufe der Geschichte. 

Es muss jemanden geben, der sich genug für den Inhalt eines Archivs interessiert, um ihn nicht nur abstrakt-grundsätzlich erhalten zu wollen, sondern zu reproduzieren. Denn ohne ständige Reproduktion ist Wissen nicht konservierbar. Buchseiten zerfallen zu Staub, auch ohne zu verbrennen. Websites werden abgestellt, Hoster geben ihre Dienste auf, Plattformen löschen alte Inhalte. Nicht ein großes Unglück vernichtet unser gesammeltes Wissens und – wenn man so polemisch sein möchte wie Redditors – lässt unsere Zivilisation untergehen, sondern der Mangel an Interesse an dem, was dort gesammelt wurde. 

Dafür, dass das nicht geschieht, setzt sich das „Internet Archive“ ein, das in diesem Jahr seinen dreißigsten Geburtstag feiert. Das Internet Archive ist nach eigener Beschreibung eine „digitale Bibliothek mit Internetseiten und anderen kulturellen Artefakten in digitaler Form“. „Wie eine gedruckte Bibliothek bieten wir Forschern, Historikern, Wissenschaftlern, Menschen mit Lesebehinderungen und der breiten Öffentlichkeit freien Zugang.“ Ihre Mission sei es, „universellen Zugang zu allem Wissen zu ermöglichen“. Über eine Billion Internetseiten hat das Projekt laut eigenen Angaben bereits archiviert. Damit ist das Internet Archive ein in der Form einzigartiges Projekt und seit vielen Jahren ein wichtiges Tool für Forscher:innen und Journalist:innen. Insbesondere, wenn es darum geht, Dokumente in ihrer ursprünglichen Form einzusehen. 

Journalist:innen sind auch Archivar:innen

Besonders besorgniserregend ist, dass insbesondere auch Medien sich aktiv an der Vernichtung von öffentlich zugänglichen Dokumentationen beteiligen. Viele Rundfunkanstalten löschen etwa die Hinweise auf vergangene Interviews oder Berichte bereits nach wenigen Jahren im Rahmen der Depublizierungspflicht, andere Medienhäuser löschen Meldungen, ändern Überschriften und URLs oder ganze Textabschnitte geräusch- und hinweislos. Damit missverstehen Journalist:innen ihre Funktion. Sie sind nicht nur Berichterstatter, die die Öffentlichkeit heute informieren sollen, sondern gewissermaßen auch Archivar:innen unserer Zeit für nachfolgende Generationen. Ein Gespräch, das im Radio zu hören war, hat nie stattgefunden, wenn auch der letzte Mensch, der es gehört hat, verstorben ist – außer, es gibt eine Dokumentation darüber. 

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.


Jetzt spenden

Umso fataler ist es, dass eine wachsende Zahl großer Medienhäuser dem Internet Archive den Zugang zu ihren Inhalten verweigert. Mindestens 241 Nachrichtenportale aus neun Ländern blockieren die Web-Crawler des Archivs, darunter „The Guardian“, „The New York Times“, „Le Monde“ und „USA Today Co.“. Das tun die Medienhäuser wohl aus Angst, dass ihre Inhalten zunehmend generative KI füttern. Der Journalist Martin Fehrensen sagte der Deutschen Welle, er sähe im Internet Archive die einzige funktionierende Beweismittelkette des offenen Webs: „Millionen Wikipedia-Quellenbelege verlieren ihren Anker, Recherchen zu Plattform-Accountability, also welche AGB galt wann, welche Moderationsregel wurde wie umformuliert, werden deutlich schwieriger, gerichtsfeste digitale Evidenz fällt weg.“ Deswegen würde es besonders den Medienhäusern selbst schaden, die Web-Crawler des Internet Archive zu blockieren. 

Digitale Dunkelzeit

Historiker:innen befürchten bereits jetzt ein „Digital Dark Age“. Der Begriff beschreibt die Sorge, dass aus dem digitalen Zeitalter der Menschheitsgeschichte nur wenige Dokumentationen überleben werden. Insbesondere dann, wenn spätere Generationen einmal keinen Zugriff mehr auf das Netz haben werden oder ihnen das Wissen darüber fehlt, wie man es benutzt. Viele Forschende empfehlen deswegen, möglichst viele Dokumente auszudrucken und analog zu archivieren oder sie mit einer Anleitung abzuspeichern, wie man die digitalen Dokumente nutzen kann. Tagebücher etwa waren über Jahrtausende hinweg relevante Quellen über das Alltagsleben früherer Generationen von Menschen. Ob ein Instagram-Account mit der Bio „My digital diary“ Historiker:innen in hundert oder tausend Jahren zugänglich sein wird, ist zweifelhaft. 

Wenn wir das im Internet gesammelte Wissen erhalten wollen, müssen wir uns für seine Inhalte interessieren. Etwa indem wir Webseiten nicht löschen, auch wenn wir deren Inhalt für veraltet halten, URLs nicht verändern und darauf achten, korrekt zu referenzieren. Dafür setzen sich inzwischen Kampagnen wie die des World Wide Web Consortiums „Cool URLs don’t change“ ein. Vor allem dürfen wir uns nicht auf große Anbieter und Plattformen verlassen, dass sie unsere privaten und zeitgeschichtlichen Dokumente für immer für uns aufheben dürfen. Auch wenn Instagram die Rückschau auf alte Storys „Archiv“ nennt, ist es keins. 

Damit die Informationen, die wir im Internet ablegen, tatsächlich langfristig erhalten bleiben, müssen wir sie vervielfältigen. Websites dezentral speichern, auf Festplatten, im Internet Archive und Dokumente analogisieren; oder wie Bianca Kastl in ihrer Kolumne sagen würde: degitalisieren. Das Internet ist kein nachhaltiges Archiv, weder für private, noch für zeitgeschichtliche Dokumente – zumindest aktuell nicht. Wenn wir nicht wollen, dass Reddit-Nerds in tausend Jahren den Mythos verbreiten, das gesammelte Wissen der Menschheit sei bei einem epochalen Brand eines großen Datencenters vernichtet worden, der die Geschichte der Menschheit um Jahrhunderte zurückversetzt hat – dann müssen wir anfangen, uns mehr für all das zu interessieren, was wir im Internet sammeln. 

Über die Autor:innen

  • Carla Siepmann

    Carla schreibt seit 2022 frei für netzpolitik.org. Sie interessiert sich für Gewalt im Netz, Soziale Medien und digitalen Jugendschutz. Seit 2023 erscheint ihre monatliche Kolumne auf netzpolitik.org.

    Kontakt: carla_siepmann@mailbox.org, @CarlaSiepmann


Veröffentlicht

Kategorie

Ergänzungen

Wir freuen uns auf Deine Anmerkungen, Fragen, Korrekturen und inhaltlichen Ergänzungen zum Artikel. Bitte keine reinen Meinungsbeiträge. Unsere Regeln zur Veröffentlichung von Ergänzungen findest Du unter netzpolitik.org/kommentare. Deine E-Mail-Adresse wird nicht veröffentlicht.

36 Kommentare zu „Das Internet verrottet“


  1. Michael Daum

    ,

    Hallo, hier meine 2c zu dem schönen Artikel.
    Erstens, Wissen existiert nur dann, wenn es Menschen wissen. Wissen existiert nicht allein dadurch, dass es irgendwo geschrieben steht, weder in Büchern noch im Internet an sich. Erst wenn ein Mensch es liest, kann aus Information Wissen werden. Insofern war das Wissen in den Büchern Alexandrias womöglich schon lang zuvor verloren, da es nach dem Brand nicht mehr von Menschen erneut aufgeschrieben werden konnte. Es hat sich nicht nur niemand für den Erhalt der Manuskripte interressiert, sonder es wurde auch nicht mehr gelehrt.
    Wir befinden uns heute zwar in einem Informations- aber nicht in einen Wissenszeitalter. Wir wissen in der Regel nicht, wie wir mit all der Information umgehen sollen und wie wir sie einordnen können. Nicht zuletzt verfügen die wenigsten über ein historisches Gedächtnis, auf dessen Grundlage sich tagesaktuelle politische Ereignisse einordnen ließen.
    Von daher sehe ich vielmehr jeden einzelnen in der Pflicht, persönliches Wissen explizit selber zu managen und diese Aufgabe nicht an dritte zu delegieren. Dies tun zu können ist aber bei weiten nicht naturgegeben. Im Gegenteil: heutige IT verhindert vielmehr diesen Prozess als ihn zu unterstützen. Man denke nur an die Vercloudung der Computer, der Reduktion von Mensch-Maschine-Schnittstellen aufs Klicken, Wischen und Scrollen. Wir verkommen eher zu einer Informationssenke als selber in der Lage zu sein, unkompliziert Information selbst zu archivieren und einzuordnen oder gar Information und Wissen selber beizusteuern.
    Eines darf man bei all dem nicht vergessen: ein Großteil des Menschlichen wissens ist informelles Wissen, Wissen, das nicht formal existiert. So viele Menschen wissen oder können so viel, diesen Menschen begegnen wir aber nicht mehr so einfach. Wäre es da nicht effektiver, wir würden das Internet Internet sein lassen und einfach mal wieder mehr miteinander quatschen, so ganz old degitalisiert?


    1. Anonym

      ,

      „Erstens, Wissen existiert nur dann, wenn es Menschen wissen. Wissen existiert nicht allein dadurch, dass es irgendwo geschrieben steht“

      Dem werden eine Menge Wissenschaftler vehement widersprechen.

      „ein Großteil des Menschlichen wissens ist informelles Wissen, Wissen, das nicht formal existiert.“

      Ich befuerchte, Sie haben keine Vorstellung ueber das mittlerweile erarbeitete Wissensgebaeude. Sowas galt vielleicht noch bei Goethe…


  2. Ron Vollandt

    ,

    Liebe Carla,

    40 Prozent der 2013 hochgeladenen Seiten sind bereits weg. Das ist keine Statistik, das ist ein stiller Schrecken. Wir reden von einem Jahrzehnt – nicht von Jahrhunderten. Die Bibliothek von Alexandria hatte wenigstens das Feuer als dramatisches Narrativ. Das hier ist einfach nur Gleichgültigkeit, die in kleinen Schritten Wissen auflöst.

    Der Satz über Journalist:innen als unfreiwillige Archivar:innen ist ein kluger Gedanke, der über die Medienkritik hinausgeht. Wer etwas dokumentiert, trägt Verantwortung für seine Auffindbarkeit. Das gilt für Nachrichtenportale genauso wie für jeden, der Inhalte öffentlich macht – und dann irgendwann den Server abschaltet.

    Dabei ist das eigentliche Paradox: Noch nie war so viel aufgeschrieben wie heute. Und noch nie war so viel davon fragil. Die Menge schützt nicht, sie täuscht.
    Das Thema, wie wir mit Sprache und Überlieferung umgehen – und was verloren geht, wenn niemand mehr aufpasst – hat mich schon länger beschäftigt. Einen Beitrag dazu gibt es hier über meinen Opa und die Altweibermühle: https://www.ron-vollandt.de/die-altweibermuehle/

    Herzlichen Dank für diesen wichtigen Text – bitte weiterschreiben.
    Ron


    1. Ketzer, der Belesene

      ,

      Da kannst du dich bei Wikipedia beschweren. Dein Text würde da reinpassen, würde aber wegen Relevanz gelöscht werden. Danken darf du den Exklusionisten. Ich denke aber die chinesischen KIs würden sich über deinen Text freuen, vielleicht dort reinpacken. Noch ist nichts verloren.


  3. Joachim

    ,

    In der Tat. Wissen und auch Kultur gehen hier verloren. Die Ursachen: das Netz wurde a) von den Medien und b) von Firmen wie Google übernommen und c) von Regierungen reglementiert.

    Die drei Aktöre haben unterschiedliche Interessen, doch in den Auswirkungen ähnliche Effekte. Zum Beispiel liegt ihnen nichts daran, dass ihre Besucher externen Links folgen und damit ihre Angebote verlassen. Alle Aktöre sind massiv Datengeil. Regeln wie „ändere keine etablierte URL“ sind Fremdworte für sie. Bidirektionalität ist unerwünscht, weil nur man selbst bzw die eigene Agenda „recht“ hat.

    Zunehmende Kommerzialisierung hat weite Teile des Netzes vernichtet und Information dem Profit untergeordnet. Das verändert unseren Umgang damit. Das macht uns zu Konsumenten und das war der Plan. Je dümmer wir werden, um so leichter produziert man billige Inhalte, um so mehr steigen die Profite.

    Nun kommt noch die KI, ungefragt und überall, redet uns nach dem Mund, schaltet eigenes Denken und eigenes tun ab. Texte dürfen eine Länge nicht überschreiten, weil sie sonst niemand liest.

    Es spricht einiges dafür, dass wir verdummen oder wie der Artikel sagt: die Menschheit um Jahrhunderte zurück versetzt werden könnte.


  4. Tim A.

    ,

    Ich habe ein relativ aktuelles Beispiel. Die tuxcademy.org ist seit einiger Zeit nicht mehr erreichbar (404 page not found) und somit auch deren tolle unter der Lizenz CC BY-SA veröffentlichten Linux-Handbücher. Sie wurden seit ca. 10 Jahren als Grundlage vieler Linux-Schulungen eingesetzt und es scheint nun keinen zentralen Ort mehr zu geben, an dem sie verfügbar sind. Das ist ein Verlust.


    1. DistroEx

      ,

      Ich habe diese Seite gefunden auf der Suche danach, *warum* tuxcademy verschwunden ist. Die Seiten von tuxcademy sind aber über das Internet Archive, also archive.org noch auffindbar, und damit auch die Handbücher.


  5. André

    ,

    1. Ich fass mir bei vielen Online-Shops immer an den Kopf: Foren, Blogs usw. verlinken tausende Produkte, die ärgerlicherweise immer wieder auf 404-Seiten führen. Das sind alles verlorene Verkaufsgelegenheiten. Ich habe bei der Einführung neuer Systeme und URL-Strukturen (wenn nicht vermeidbar bzw. Verbesserung) immer eine große Liste mit HTTP-30X-Umleitungen erzeugt (z.B. über htacces). Sowas ist trivial und viel bang for the buck. Gibt es die Produkte nicht mehr, dann gäbe es ebenfalls bessere Ziele als 404.

    2. Wenn man nicht die Backends alter Websites weiter unterhalten möchte (z.B. Content Management Systeme und Datenbanken), reicht manchmal schon einfach eine statische Spiegelung.


  6. Anonym

    ,

    Hab auch gern archive.today genutzt, um toten Links vorzubeugen . Paywalls zu umgehen, war zugegeben ein schöner Nebeneffekt.

    Ende ’25 hat sich dann das FBI auf die Jagd nach den Betreibern gemacht, und wies den kanadischen Provider Tucows unter Androhung von Strafen an, Daten über archive.today auszuhändigen. Ausgang offen, Buuh.


    1. Anonym

      ,

      Das kostenlose Archivieren ist der Reiz, aber auch genau das Problem an Internetarchiven.

      Es ist ja einerseits richtig, Journalist:innen an dem hehren Maßstab zu messen, dass sie Dokumentare des Zeitgeschehens sind. Andererseits sind Medienhäuser privatwirtschaftliche Unternehmen. Wenn die Menschen ihre Texte auf Archivseiten lesen, entgehen ihnen Abonnement- und Werbeeinnahmen.

      Journalismus muss bezahlt werden, sonst ist es Werbung. Das vergessen die Leute leider zunehmend, bei den ganzen Ansprüchen, die sie an ihn haben.


      1. Anonym

        ,

        „Journalismus muss bezahlt werden, sonst ist es Werbung.“

        Mit dem Primat der Gewinnmaximierung ist auch bezahlbar Journalismus idR Werbung im weitesten Sinn. Letztlich ist auch explizit dafür bezahler Haltungsjournalismus wie von taz und NP stark interessengeleitet.


      2. Anonym

        ,

        > Journalismus muss bezahlt werden, sonst ist es Werbung. Das vergessen die Leute leider zunehmend, bei den ganzen Ansprüchen, die sie an ihn haben.

        Der Spruch lautete „Journalismus heißt, Dinge zu veröffentlichen, von denen irgendwer nicht will, dass sie öffentlich werden. Alles Andere ist PR.“

        Abgesehen davon betrachte ich das Wissen darüber, wie man Paywalls umgeht, als wichtigen und unverzichtbaren Bestandteil von Internetkompetenz.


        1. Anonym

          ,

          „Der Spruch lautete „Journalismus heißt, Dinge zu veröffentlichen, von denen irgendwer nicht will, dass sie öffentlich werden. Alles Andere ist PR.““

          Das ist dann je nach Interpretation auch so ein spruchgewordenes Fehlurteil oder trivialer Kalenderspruch. Übrigens ist gerade PR etwas, das Leute mit gegenläufigen Interessen gerne nicht veröffentlicht sehen würden.

          „Abgesehen davon betrachte ich das Wissen darüber, wie man Paywalls umgeht, als wichtigen und unverzichtbaren Bestandteil von Internetkompetenz.“

          Davon wird halt kein Journalismus finanziert.


          1. Anonym

            ,

            > Das ist dann je nach Interpretation auch so ein spruchgewordenes Fehlurteil oder trivialer Kalenderspruch.

            Weder noch. Es ist eine Wahrheit, die nicht jeder kapieren will.

            Übrigens ist gerade PR etwas, das Leute mit gegenläufigen Interessen gerne nicht veröffentlicht sehen würden.

            > Davon wird halt kein Journalismus finanziert.

            Das ist mir egal. Es gibt kein Recht darauf, dass Geschäftsmodelle ewig funktionieren.


          2. Anonym

            ,

            „Es ist eine Wahrheit, die nicht jeder kapieren will.“

            Das sagen auch alle, die ausser ihrer Meinung keine Evidenz haben.

            „> Davon wird halt kein Journalismus finanziert.

            Das ist mir egal. Es gibt kein Recht darauf, dass Geschäftsmodelle ewig funktionieren.“

            Journalismus an sich ist eben kein Geschäftsmodell sondern eine gesellschaftlich wünschenswerte bis notwendige Aktivität.

            Zeitung, Pay-TV oder Werbeumfeld sind Geschäftsmodelle, in denen Journalismus uU ein Teil des Produktes ist. Spendenbasierter oder genossenschaftlicher Journalismus sind Geschäftsmodelle, halt nicht primär gewinnorientiert.

            In einer klassischen Zeitung waren übrigens die Werbenden die Kunden des gewinnorientierten Verlages und die Leser Teil des Produkts.

            ÖRR ist kein Geschäftsmodell sondern ein explizit unabhängig finanzierter Journalismus (und mediale Grundversorgung).


  7. Notorisch Rhetorisch

    ,

    Bedrohungen für Archiviertes gibt es doch immer. Die Trump-Administration ist m.W. auch eher kein Freund öffentlicher Archive denen sie eher Unterstützung versagen oder sie verbieten wollen. Die gehören; wie andere; eher der Fraktion „Die Geschichte schreibt der Sieger (um)“ an.

    Und Geschichte und speziell Wissen muss einfach dauerhaft konserviert werden.
    In seinem Buch „Kuckucksnest“ erwähnte Cliff Stoll schon damals eine Astronomen-Weisheit „Was du nicht notiert hast – ist nie passiert“

    Es ist wirklich unpraktisch das es heute so viel „Wissen“ gibt das es zu archivieren gälte, das die Aufzeichnungsdichte von Steintafeln nicht mehr ausreicht. Und jede bessere Aufzeichnungsart mit mehr Kapazität hat ihre Schwächen und hält wohl kaum die Jahr(zehn)tausende aus die man Steintafeln (Erosion vermeidend) zugestehen könnte. Also WIE, und vor allem WO und auch WAS sollte man denn genau Archivieren/konservieren/duplizieren? Diese Frage gilt es m.E. auch zu bedenken und ein Problem dabei ist doch das man jetzt nicht wissen kann welche Fragestellungen zukünftige Generationen in ihrer Aktuellen Lage überhaupt hätten. Wahllos einfach ALLES zu archivieren wird kaum möglich sein und wenn man Auswählt läuft man Gefahr das wichtiges untergeht und man den Nachfahren so ein verfälschtes Bild hinterlässt.

    Aber, das es in 1000 Jahren noch Redditoren gibt hoffe ich wirklich nicht! :)

    Und allen Webspeichernden oder link-ändernden sei die Fehlergruppe 3xx (moved) nahe gelegt. Das bietet zumindest die Option der Weiterleitung auf eine andere Quelle – so sie denn existiert. Dann bleibt nur noch das Problem zu lösen diese neue Quelle zu finden oder zu erstellen und die Information bliebe erhalten. So lange kein Trump ähh Nero die Bibliothek/Stadt/Welt an zündete.


    1. Ketzer, der Belesene

      ,

      Abgesehen von der wahllosen Archivierung. Das Archiv braucht auch einen Index, wenn es Wissen werden will. Da wir in der Zettabyte Era leben, wird das lustig die Datenbank zu durchsuchen, da sehen OpenAI-Datacenter alt aus. Denn wenn man nicht weiß, wo es steht, nützt das archivieren nichts.

      https://en.wikipedia.org/wiki/Zettabyte_Era

      „KI, kannst du mir Videoaufnahme von 2024 des Kamezuka-Park in Tokio abspielen, wenn möglich in 4K HDR?“ – Wolfie S. im Jahr 2029. Auch historische Videoaufnahmen können Wissen sein.


    2. Katja

      ,

      „So lange kein Trump ähh Nero die Bibliothek/Stadt/Welt an zündete.“

      Schon passiert. Oder wie war das mit der Löschung der Klimadatenbanken, die Forscher in jahrzehntelanger Arbeit zusammengetragen haben?


  8. Anonym

    ,

    Die Aufgabe eines Archivars oder einer Bibliothekarin ist immer auch das Auswählen. Kein Stadtarchiv hebt alle AGB örtlicher Supermärkte auf.

    Und ob diese Archive gerichtsfest sind?

    Und warum soll der „Urheber“ nicht das Recht haben, dass seine Inhalte vergessen werden?


  9. Anonym

    ,

    Aber gibt’s dafür nicht die DOI? Eine DOI Adresse kann im Gegensatz zu URLs sein Ziel nicht ändern und bleibt immer vorhanden.


    1. Constanze

      ,

      Durch einen DOI werden in der Regel wissenschaftliche Publikationen identifiziert.


  10. Ich wage mal die steile These, daß 50% der Informationen , die übers Internet zu finden sind (denn das Netz speichert null und nichts) so belanglos sind, daß eine Archivierung absoluter Blödsinn wäre. Schon allein die Differenzierung zwischen unütz und wichtigem Wissen fällt die meisten Nutzern schwer. Das Internet selbst ist da völlig neutral und überträgt nur Informationen von A nach B. Allerdings ist die Nutzung schon länger zum Produzenten/Konsumenten Netz verkommen. Wozu sonst bräuchte es im Zeitalter von Glasfaser noch unsymmetrische Zugänge? Und schlechtes Wissen allein nützt nichts, man muß es auch falsch anzuwenden wissen.
    Die Informationen, welche übers Netz zugänglich sind, sind volatil. Erstens gibt es keine Gewähr, daß die Informationen unter ein und derselben URL immer gleich sind oder falls nicht wenigstens durch Annotationen die Änderung sichtbar ist, noch haben sie einen sichtbaren Zeitstempel. In jedem Buch ist die Auflage und das Jahr des Erscheinens vermerkt, auf Webseiten nicht. Und in ein archivierbares, sprich druckbares Format lassen sich die Seiten nur schwer bringen, so lobe ich mir die FF Erweiterung PrintFriendly. Dann kann mein die Seiten wenigstens selbst im PDF Format archivieren, wenn es denn die Anbieter schon nicht tun.
    P.S. Meine private Bibliothek gedruckter Bücher ist nach über 60 Jahren immer noch stetig am Wachsen.


  11. Lesermeinung

    ,

    Zu keiner Zeit wurde der Masse der Bevölkerung ein zuverlässiger Langzeitspeicher bzw. ein günstiges Langzeitspeichermedium zur Verfügung gestellt. Somit sind die über die Zeit übermittelten Inhalte immer nur Fragmente aus Sicht der Vermögenden oder Herrschenden. Dazu kommen noch die Interpretationen der Historiker, die auch nicht immer richtig liegen müssen oder im Sinne derjenigen interpretieren, die sie bezahlen.
    Wenn man bedenkt, daß zudem bestimmte Information bekämpft wird oder der Geheimhaltung unterliegt, also nicht öffentlich verfügbar sein soll, obwohl sie vielleicht einen wertvollen Fakt darstellt, wird deutlich, daß es sogar mehrere Arten von Archiven gibt, vielleicht geben muß. Die Öffentlichkeit wird nie alles erfahren können/dürfen.


  12. Kay Linnard

    ,

    Das Internet vergisst nie. Es gibt mehrere Internet Archive in dem ALLE Seiten gespeichert sind und werden. Man muss nur wissen wie man dort hin kommt. Dann findet man ALLES… Hab sogar meine alten Webseiten aus den 90ern wiedergefunden…


    1. Constanze

      ,

      Ich weiß, ich weiß, Trolling-Verhalten soll man nicht unterstützen, aber könntest du bitte die verschiedenen Internet-Archive, die ALLE Seiten speichern, hier kurz angeben?
      (Entschuldigung.)


  13. Ketzer, der Belesene

    ,

    Ist das wirklich „Wissen“, was verrottet? Wenn ja, sollte man KI-Crawlern erlauben, seine Seiten zu scannen, weil die werden das gerne aufnehmen, besser als synthetische Daten. Die Chinesen stellen ihre LLM-Modelle meist mit MIT-Lizenz zur Verfügung (DeepSeek-V4-Pro, 1.6T parameters).

    Und mal abgesehen von der Machbarkeit der Archivierung, scannt die NSA nicht das „Internet“ mit ihren Fusion-Centers? Die müssen doch alle 5 Tage oder so das gescannte verwerfen, weil sie keinen Speicherplatz für den Traffic haben.

    Die derzeitige Speicherkrise macht das nicht besser. Und wer soll für die ganzen Festplatten aufkommen, welche die Fanseite von Hans-Dieter über den FC Hintertupfingen archiviert? Bandarchive mit einem Ping von 10 Min?

    Archivierung ja gerne, aber ich sehe Probleme bei der Machbarkeit, sofern man nicht den Planeten komplett überhitzen will, indem man noch mehr Datacenter aus dem Boden stampft.


    1. The deadliest poison known to AI

      ,

      > …, sollte man KI-Crawlern erlauben, seine Seiten zu scannen, weil die werden das gerne aufnehmen,

      Tauben füttern im Park mit iocaine
      https://iocaine.madhouse-project.org/


  14. Pranee

    ,

    Ach, hätte ich doch nur die uralten Fanseiten zumindest als Links abgespeichert. Teilweise sind diese tatsächlich noch vorhanden obwohl sie nur noch schwer per Suchmaschine auffindbar sind (z.B. theacorncafe, bonkers-online.com), oftmals ist es aber lost media, was aber auch dem Umstand geschuldet ist, dass a) ein Account gebraucht wird, z.B. für eine Yahoo-Gruppe und b) der Inhalt dahinter nicht archiviert werden kann. Ich kann eine Yahoo-Gruppe per archive.org auffinden, ich habe sogar das Feld für Username und Passwort parat, aber um auf altes Material zuzugreifen, müsste ich den Server ausfindig machen und die dort befindlichen Festplatten, sofern sie nicht entsorgt wurden. Sonst bleibt es bei 302, 303, 403 und 404.


  15. Horst Lindner

    ,

    Mein Deutsch Lehrer sagte immer, du musst nichts wissen, du musst nur wissen wo es steht – was du suchst.


    1. Anonym

      ,

      > du musst nichts wissen, du musst nur wissen wo es steht – was du suchst.

      Im Prinzip ja, wenn Suchende das notwendige Vorwissen bereits erlangt haben, um das zu Lesende verstehen zu können. Aber sage das niemals faulen und bequemen Menschen, denn die nehmen das allzu gerne wörtlich und bleiben dumm, weil sie sich schon damit zufrieden geben.


    2. Anonym

      ,

      „du musst nichts wissen, du musst nur wissen wo es steht – was du suchst.“

      Das ist dem klischeehaften Deutschlehrer angemessen, aber so pauschal natürlich falsch. Für einfache Fakten im Kontext Schulwissen, die man früher auswendig gelernt hat, trifft das zu: Hauptstadt von X, alle Werke von Goethe, usw.

      Ohne Wissensgrundlage lassen sich viele Fragen erst gar nicht stellen, um Antworten zu suchen, mit den Antworten bei Null anfangen würde uU Jahre dauern, Erfahrungswissen ist nicht einfach rezipierbar, und so weiter. Und selbst die obigen Fakten zT im Kopf zu haben ist oft wesentlich schneller oder für Assoziationen und Erkenntnisse notwendig.


      1. Anonym

        ,

        …und dann gibt es noch Methodenwissen, ohne das man keinen zielführenden Zugriff oder Verwendung auf externes Wissen hat. Wissenschaftliches Vorgehen an sich wäre ein Beispiel, zusammen mit Grundlagen von Naturwissenschaften und Mathematik.


  16. Mittlerweile bin ich dazu übergegangen, mir wichtige Netzfunde nicht nur zu bookmarken, sondern als Fullpage Screenshot zu speichern. Besser als nix.


  17. D.H.

    ,

    Es gibt neben dem Internet Archive viele Nationalbibliotheken, welche Websites archivieren (und leider aus urheberrechtlichen Gründen nicht gleich frei zugänglich machen). Sie sind zusammengeschlossen im International Internet Preservation Consortium: https://netpreserve.org


  18. Suma

    ,

    Das Internet verrottet schon seitdem es im Fokus der Massenmedien, der Politik und dem Aufkommen der großen Konzerne wie Google, Facebook und Co gekommen ist. Flächendeckende Breitbandzugänge haben das natürlich enorm erleichtert.

    Suchmaschinen und Strukruren basieren größtenteils auf Google, LLC. und Microsoft Corporation (Bing), Dienste sind omnipräsent, Amazon.com, Inc., Akamai Technologies. Kurz alles in amerikanischer Hand.

    Das Internet steht zwischen zwischen Politik, Corporate, Verwertungsgesellschaften, Lobbys und Werbeindustrie. Diese führen wenn man so will Krieg gegen Anwender, beanspruchen zuviel für sich selbst, zerstören in demselben Umfang Strukturen, Inhalte, Wissen, Kultur, verdrehen Tatsachen und gehen gegen alles vor, was nicht der jeweiligen Doktrin entspricht.

    Inhalte werden mehr und mehr als Paywalls verpackt (monopolisiertes Wissen für die die es sich leisten können), verbunden mit Werbung und teils tausenden Trackern, Ads usw. die selbst dann aktiv bleiben wenn ein Anwender zahlt.

    Anwender werden ausgenommen, bespitzelt, beklaut, belogen. Datenschutz ist von Grund auf verrottet, Eulas, Nutzungsbedinungen, Transparenz sind Fremdworte. Klauseln die Anwendern am liebsten jegliche Rechte absprechen uvm.

    Webarchive sind auch kein Garant für ältere Beiträge. Bei X, ehemals Twitter verschwanden doch beispielsweise riesige Zeiträume aus der Historie. Gegen eine Vielzahl von Archiven wird vorgegangen dank der Copyright und Verwertungsmafia. Repositories und Open Source sind ähnlichen Gefahren ausgesetzt. Liste beliebig fortführbar.

    Was in Zukunft als Plus dazukommt, werden Dinge wie ObjectionAI sein, weitere Instrumentalisierung im Sinne weniger. Quasi Faktenchecks auf LSD, auch eine unsinnige Instrumentalisierung seit Covid. Mittlerweile sogar für staatliche Agenda verwendet.

    Das Internet ist schon lange tot. Wir haben mittlerweile ein „Corporate Net“ als Spielplatz für verschiedenste Interessensverbände.


    1. Rainer Winters

      ,

      Längst habe ich damit angefangen, ALLE Beiträge und wichtigen auf meinen Computern liegenden Dokumente auszudrucken. Was glauben wohl, was die Dienste mit unliebsamen und anderen als redundant bewerteten Informationen machen? LÖSCHEN.

Schreibe eine Ergänzung!

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert