L’idea che una parte della memoria di Internet possa diventare improvvisamente irraggiungibile non è più un’ipotesi lontana, ma una possibilità concreta.
La Wayback Machine, uno degli strumenti più utilizzati da chi lavora con le informazioni online, si trova oggi al centro di una tensione crescente tra editori e aziende tecnologiche.
Da quasi trent’anni, il progetto sviluppato da Internet Archive raccoglie e conserva copie di pagine web, costruendo nel tempo un archivio gigantesco che ha superato il traguardo del trilione di contenuti salvati. Un patrimonio che ha permesso a giornalisti, ricercatori e utenti comuni di consultare versioni passate di siti, verificare modifiche e recuperare contenuti scomparsi.
Negli ultimi mesi qualcosa è cambiato. Sempre più grandi testate stanno inserendo restrizioni nei propri file robots.txt, impedendo ai crawler dell’Internet Archive di accedere e archiviare le loro pagine. Tra i casi più evidenti c’è quello del The New York Times, che ha scelto una linea particolarmente rigida, arrivando a bloccare esplicitamente i bot dell’archivio.
Una posizione simile è stata adottata anche da USA Today, mentre The Guardian ha optato per un approccio più selettivo, limitando solo alcune tipologie di contenuti.
Dietro questa scelta c’è una preoccupazione che riguarda direttamente il presente e il futuro dell’informazione digitale: il timore che i contenuti archiviati possano essere utilizzati dalle aziende che sviluppano modelli di intelligenza artificiale senza autorizzazione. In altre parole, l’archivio verrebbe visto come una sorta di “porta laterale” attraverso cui accedere a dati che gli editori stanno cercando sempre più di proteggere.
Il nodo dell’intelligenza artificiale
Il punto critico non è tanto l’archiviazione in sé, quanto ciò che potrebbe accadere dopo. Le aziende tecnologiche, tra cui OpenAI, Google e Anthropic, stanno sviluppando sistemi sempre più avanzati che richiedono enormi quantità di dati.
Bloccare direttamente questi colossi è diventato più comune, ma il problema resta aperto: anche se un sito impedisce ai bot ufficiali di accedere, gli stessi contenuti potrebbero essere recuperati indirettamente attraverso archivi pubblici come la Wayback Machine. È qui che nasce il conflitto.
Gli editori, da una parte, difendono il valore economico e intellettuale dei propri contenuti. Dall’altra, chi sostiene l’archivio sottolinea che si tratta di una risorsa pubblica essenziale, non pensata per l’estrazione massiva di dati, ma per la conservazione della memoria digitale.

Un pilastro del giornalismo a rischio (www.bgexcel.info)
Per chi lavora nell’informazione, la Wayback Machine non è solo uno strumento utile: è spesso indispensabile. Permette di ricostruire cronologie, verificare modifiche silenziose negli articoli, recuperare pagine cancellate e mettere a confronto versioni diverse dello stesso contenuto.
Non a caso, oltre cento tra giornalisti e autori internazionali hanno firmato una lettera a sostegno dell’Internet Archive, evidenziando come senza questo tipo di strumenti diventerebbe molto più difficile svolgere un lavoro di verifica accurato.
Non esiste oggi un’alternativa pubblica e accessibile di pari dimensioni. Se l’archivio dovesse progressivamente svuotarsi a causa dei blocchi imposti dagli editori, una parte significativa della storia recente del web rischierebbe di andare perduta.
La memoria del web non è garantita
Il tema, in fondo, va oltre lo scontro tra editori e tecnologia. Riguarda il modo in cui conserviamo ciò che produciamo online ogni giorno. Internet viene spesso percepito come uno spazio permanente, ma in realtà è fragile, mutevole, facilmente cancellabile.
Senza strumenti come la Wayback Machine, intere porzioni di contenuti – articoli, pagine, progetti – potrebbero semplicemente sparire nel giro di pochi anni, senza lasciare traccia.
E mentre cresce il timore di un uso improprio dei dati da parte dell’intelligenza artificiale, si apre una domanda meno visibile ma altrettanto urgente: quanto siamo disposti a sacrificare della memoria collettiva digitale per proteggere il presente?








