HTTP 301 – Umleitung


Themenpate: @drazraeltod

tote Links & permanente Umleitungen bei HTTP

https://de.wikipedia.org/wiki/Toter_Link
https://en.wikipedia.org/wiki/HTTP_301

Als Gegenmaßnahme gegen überraschend umgezogene Webinhalte bietet sich die WayBackMachine an: http://archive.org/web/ … das Internet vergisst zu viel!

Bild: CC0, https://www.flickr.com/photos/girliemac/6519540231

 

#301 – HTTP 301 – Umleitung

Anerzählt-Veteranen wissen, dass ich in Episode 200 einmal über HTTP Statuscodes gesprochen habe. Das sind vereinfacht gesagt Statuscodes, mit denen Computer im Internet untereinander kommunizieren, wenn Webseiten oder Dateien über das sogenannte HTTP-Protokoll abgerufen werden.  Diese Fehlercodes oder Statuscodes haben verschiedene Bedeutungen, je nachdem welche Zahl denn nun zurückgemeldet wird. In Folge 200 ging es natürlich um den Statuscode 200 und der bedeutet: Alles okay, super gelaufen! Und gibt damit eine Rückmeldung zu dem eben durchgeführten Vorgang.

Heute ist die Episode 301 und der Twitternutzer @drazraeltod hat vorgeschlagen, sich anlässlich der Folge 301 mit der HTTP-Umleitung zu beschäftigen, die eben auch so eine HTTP-Statuscode ist – die 301 nämlich. Und im Grunde geht es da um ein interessantes Phänomen, das sozusagen designbedingt im Internet existiert. Nämlich, dass Links gewissermaßen wegsterben. Also ungültig werden und nicht mehr erneuert werden.

Jetzt mag es ja sein, dass eine Datei einfach mal gelöscht wurde. Greift nun ein Internet Explorer, ein Chrome, ein Firefox oder ein Safari oder welcher Browser auch immer Dein Lieblingsbrowser sein sollte, auf genau diese Datei zurück, dann wird der Server, weil er die Datei eben nicht finden kann, eine 404 zurückschicken. Und 404 steht in dem Fall für “File not found”.

Jetzt gibt es aber Situationen, in denen Dateien eigentlich nicht gelöscht, sondern verschoben werden. Die alte Adresse ist also plötzlich nicht mehr gültig. Stattdessen gibt es eine neue Adresse. Jetzt könnte man natürlich sagen: Jo, dann gibt es halt unter der einen Adresse einen 404 Fehler “File not found”, Sache erledigt. Trotzdem wäre es natürlich schön, wenn man denn – falls bekannt – die Adresse eben auch erhalten könnte. Und genau dafür ist der Statuscode 301 gedacht.

Habe ich nun eine Datei verschoben, dann kann ich eben bei den meisten Webservern einrichten, dass eine neue Adresse zurückgemeldet werden soll und der Statuscode 301 verrät meinem Browser, dass es sich um eine Umleitung, um eine neue Adresse für eine bekannte Ressource handelt.

Zwischen 3 und 5% aller Links im Internet werden nach Schätzungen nach und nach ungültig. Die werden aber meistens nicht durch Löschungen ungültig, sondern oft auch durch Verschiebeoperationen und da wäre ein 301 Statuscode sehr, sehr nützlich.

Es gibt übrigens ein spannendes Projekt – das Internet Archive, das sich zur Aufgabe gestellt hat, alte vormals verfügbare Webseiten weiterhin verfügbar zu halten oder zumindest Schnappschüsse verfügbar zu halten. Der Weg über den man die dann abrufen kann, ist die genannte Wayback Machine.

Die Wayback Machine hat alte Versionen bekannter Webseiten in verschiedenen Versionsständen gespeichert, sodass man einfach mal gucken kann, wie denn eine bekannte Webseite zum Beispiel vor ein paar Jahren ausgesehen haben mag. Da kann man dann zum Beispiel sehen, wie wohl ebay vor fünf Jahren aussah oder Google vor zehn oder eben auch Dirks Webseite, als sie zum allerersten Mal live ging.

Die Wayback Machine ist im Übrigen ein sehr beeindruckendes Projekt. Es geht rein um die Langzeitarchive von digital frei zugänglichen Daten. Und gespeichert wird das Ganze in den USA in vier Rechenzentren und insgesamt 20.000 Festplatten. Und eine Kopie dieser Daten ist dann auch an einem ganz besonderen Ort – nämlich in der Bibliothek in Alexandria.

Nach aktuellem Stand ist die Größe der Sammlung über 18,5 Petabytes groß. Schon der Wahnsinn. Irgendwie.

Bis bald.

Kommentar verfassen

%d Bloggern gefällt das: