Home
Kennis en Economie
Recht en Veiligheid
Europa
Jihad vs McWorld
E-government
   archief december 2005
archief mei 2005
archief april 2005
Nieuwe democratie
Columns
Politici
Overzicht thema`s
Verkiezingen
Tools
Het Belgenrapport
Nieuwsbrief
Colofon
Poldi.Net




Hoe archiveer je internet?
Joan Arensman Gepost:     woensdag, 5 juni 2002, 18:00
Van:     < Joan Arensman - Eindredacteur Politiek-digitaal >
URL:     < http://www.politiek-digitaal.nl >

Content is op internet maar beperkt houdbaar. Websites worden razendsnel ververst en de archivering van internet is problematisch. Toch zijn er een aantal interessante initatieven die proberen de geschiedenis van internet vast te leggen. De twee belangrijkste zijn de Wayback Machine en de nieuwsgroepen van Google.

Wie weet nog hoe de site van Internet-gigant Yahoo er in 1996 uitzag? Of hoe de Nederlandse zoekmachine Ilse zijn activiteiten is begonnen? Een groot deel van de geschiedenis van internet lijkt voor altijd verloren te zijn gegaan. Het medium dat uitblinkt door constante vernieuwing en razendsnelle updates laat zich niet zo makkelijk archiveren. Toch is dat precies wat 'The Internet Archive', een Amerikaanse non-profit-organisatie, sinds 1996 met haar 'Wayback Machine' probeert te doen.

100 terabyte aan webpagina's
De website van Ilse in 1997Het verzamelde archief van The Internet Archive telt momenteel meer dan 10 miljard internetpagina's en is meer dan 100 terabyte groot; dat staat gelijk aan 100 miljoen megabyte. Het archief wordt voor het grote publiek ontsloten, door de mogelijkheid een internet-adres in te voeren, bijvoorbeeld 'www.ilse.nl'. De knop 'Take Me Back' leidt vervolgens naar een chronologisch overzicht van de opgeslagen Ilse-pagina's. Het belang van de Wayback Machine voor de geschiedschrijving van internet is zo makkelijk te onderkennen.


De website van CNN op 11 september 2001 Als voorbeeld mag het overzicht dienen dat The Internet Archive zelf maakte van de berichtgeving rond de aanslagen van 11 september 2001. Alle grote nieuwssites werden binnen enkele minuten na de aanslag omgetoverd tot speciale informatie-sites, waar bijvoorbeeld nauwelijks plaats was voor plaatjes als gevolg van de grote hoeveelheid dataverkeer. Miljoenen mensen zochten immers hun toevlucht tot internet om meer informatie te krijgen over de gebeurtenissen in New York en Washington.


700 miljoen berichten uit nieuwsgroepen
Een ander ambitieus project probeert de geschiedenis van nieuwsgroepen op internet vast te leggen. De zoekmachine Google, inmiddels met afstand de grootste van de wereld, maakte op 11 december 2001 het gigantische archief in één klap toegankelijk. Alle berichten die ooit in een nieuwsgroep zijn geplaatst, zijn nu via Google terug te vinden. Het archief loopt dan ook vanaf 1981, toen de eerste nieuwsgroepen operationeel werden, en bevat meer dan 700 miljoen berichten.

Het archief, dat Google in februari 2001 in handen kreeg door het bedrijf Deja over te nemen, bevat genoeg pareltjes om een boek mee te vullen. Zo vinden we in 1982 bijvoorbeeld de eerste discussie over AIDS. In oktober 1991 kondigt Linus Torvalds heel bescheiden zijn nieuwe operating system aan: Linux. In 1994 laat Marc Andreessen weten dat er een nieuwe versie van zijn Mosaic-browser aankomt: Netscape was geboren. En in september 1995 kondigt een bedrijfje met de naam Ebay aan dat het veilingen op internet gaat organiseren.

'Another Plane just hit'
Toch is ook hier de situatie rond 11 september 2001 het meest illustratief voor het belang van een dergelijk archief. De rillingen lopen je opnieuw over de rug als je de allereerste discussie leest die op 11 september 2001 om 08:51 uur (New York-tijd) werd gestart: 'Plane crashed into World Trade Center near the top'. 08:52 uur: 'WOW!!!! Watching right now. Scary!!!'. 08:53 uur: 'They're saying it was maybe a passenger jet...horrible situation'. En de ontsteltenis toen het tweede vliegtuig zich in het World Trade Center boorde: 'Another Plane just hit. Two planes 18 mins apart!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!'.

De beide bovenstaande archieven geven een indicatie hoe de geschiedenis van internet kan worden vastgelegd. De nieuwsgroepen zijn inmiddels door Google zeer goed ontsloten. Het web laat zich minder makkelijk vangen, maar The Internet Archive doet een interessante poging. Historici hebben daardoor voorlopig voldoende informatie om zich op te baseren, maar vele webpagina's zullen nooit meer boven water komen. Ze zijn gewist of overschreven en, net als de boekrollen uit de grote bibliotheek van Alexandrië in het jaar 642 na Christus, voor eeuwig verloren gegaan.


Links
The Internet Archive
De organisatie die met de Wayback Machine de geschiedenis van het web toegankelijk wil maken.

Google Groups
Doorzoek alle berichten in nieuwsgroepen sinds 1981 via Google Groups.

Ocassio
Het Nederlandse Instituut voor Sociale Geschiedenis probeert heeft een archief aangelegd van berichten in nieuwsgroepen over sociale kwesties. Het archief omvat nu 2,3 miljoen berichten.