OBSOLESCENZA DIGITALE.
– Il nodo della conservazione. Le diverse forme di obsolescenza digitale. Obsolescenza e formati dei file. Metadati, documentazione e policycontro l’obsolescenza. Bibliografia
Il nodo della conservazione. – Con il termine obsolescenza digitale s’intende la condizione che rende non leggibile e non intelligibile e, quindi, inutilizzabile una risorsa digitale, a seguito dell’indisponibilità dei supporti o degli strumenti di lettura e di trattamento dei dati. Il problema riguarda la capacità di difendere e preservare gli oggetti digitali rispetto ai rischi di deterioramento dei supporti e di perdita e inaccessibilità dei dati. Tali minacce possono essere analizzate e contrastate sul piano tecnologico, ma anche (se non soprattutto) con interventi di tipo organizzativo e con la pianificazione precoce di iniziative specifiche che devono tener conto della natura dei contenuti e degli oggetti che si intendono conservare oltre i termini previsti per la loro durata nel tempo.
Gli interrogativi che hanno guidato e guidano la letteratura di settore e i numerosi progetti di ricerca in materia si sono concentrati sulle soluzioni operative e sugli strumenti che consentono di limitare le conseguenze negative dell’obsolescenza e assicurare quindi la persistenza delle informazioni e dei documenti a costi sostenibili nel medio e nel lungo periodo. Punto di partenza è la definizione di conservazione digitale che le comunità scientifiche e di pratiche hanno fatto propria in questi anni, di cui una convincente formulazione (solo apparentemente limitata al settore documentario) è quella elaborata nell’ambito di InterPARES, il più longevo progetto internazionale (1999-2018) dedicato alla continuità digitale: «La stabilizzazione fisica e tecnologica e la protezione del contenuto intellettuale dei documenti, tesa ad assicurarne una catena di conservazione continua, duratura, stabile, costante ed ininterrotta, senza un termine prestabilito» (http://www.interpares.org/ip3/ ip3_terminology_db.cfm?term=1227).
Stabilizzazione fisica e tecnologica degli strumenti e dei supporti da un lato, protezione e persistenza dei contenuti dall’altro costituiscono gli obiettivi cui si ispirano le attività di contenimento dell’obsolescenza in ambito digitale, che vede come causa principale il continuo e rapido modificarsi delle tecnologie informatiche accompagnato dalla mancanza di interventi strategici. La storia degli ultimi cinquant’anni di trasformazioni tecnologiche ci mostra un fenomeno irreversibile e ineliminabile determinato da logiche di mercato finalizzate a sostituire i prodotti esistenti in nome dell’innovazione, ma anche, più banalmente, dovuto all’indisponibilità dei materiali di ricambio in grado di assicurare la sopravvivenza agli strumenti di lettura, di trattamento dei dati e di memorizzazione.
Le diverse forme di obsolescenza digitale. – In considerazione del fatto che l’o. d. deriva dai cambiamenti significativi delle tecnologie informatiche necessarie all’utilizzo delle risorse digitali, se ne distinguono almeno tre tipi, relativamente alle componenti tecniche alla base della produzione, gestione e fruizione delle risorse digitali: i supporti fisici per la memorizzazione dei flussi di bit, l’hardware necessario ad assicurarne l’accesso e il software finalizzato al reperimento, alla lettura, all’organizzazione e alla comprensione dei file.
L’obsolescenza dei dispositivi di memorizzazione si determina, in particolare, quando nuovi e migliori supporti (perché più potenti, più trasportabili, di minor costo o più flessibili) sostituiscono quelli in uso precedentemente, per es., nel caso di produzione di nastri magnetici di diversa densità o nel passaggio dai floppy disk di 5,25 pollici a quelli da 3,5, sostituiti poi dai CD (Compact Discs) e dai DVD (Digital Versatile Disc), e infine dalle chiavette USB (Universal Serial Bus). La funzione di memorizzazione non viene meno, ma cambiano significativamente e in forme irreversibili nel lungo periodo le tecnologie di immagazzinamento dati (storage), con rischi elevati di perdita di dati in assenza di un sistema di monitoraggio e un’adeguata pianificazione. Un caso emblematico, a questo proposito, è quello descritto da uno dei pionieri dei progetti di informatizzazione negli Stati Uniti, Charles Dollar, sull’utilizzo dei nastri relativi al censimento del 1960 presso il Census bureau di Washington. Nel 1960, l’ufficio si affidò esclusivamente a una tecnologia UNIVAC (UNIVersal Automatic Computer) per meccanizzare e analizzare i dati del censimento, che vennero memorizzati in formato elettronico proprietario su supporti prodotti anch’essi dalla UNIVAC (Ruggiero 2003). L’adozione nel 1975 di un nuovo sistema di memorizzazione, non compatibile con la versione precedente, mise a rischio la conservazione dei dati, di rilevanza storica, per la cui salvaguardia fu necessario il riuso di componenti presenti in altri sistemi attivi, che dovettero essere dismessi per consentire agli archivi nazionali statunitensi il recupero dei contenuti destinati alla conservazione permanente.
L’obsolescenza in materia di hardware è ancora più impegnativa e costosa da affrontare e non meno rischiosa, come ci ricordano i numerosi episodi di perdite di dati o gli ingenti investimenti necessari per recuperare le informazioni archiviate, per es. nel caso in cui i sistemi di lettura non siano disponibili, perché sostituiti da altri incompatibili o perché non più mantenuti dai produttori medesimi.
Per quanto riguarda, infine, i sistemi operativi e le applicazioni software, il fenomeno è legato allo sviluppo di nuove, più avanzate funzionalità degli applicativi di mercato. La garanzia di compatibilità retroattiva (ossia la capacità della nuova versione del prodotto di interpretare automaticamente e senza perdita di contenuto e di struttura le informazioni e i documenti, formati e mantenuti nelle precedenti edizioni del prodotto), che molti fornitori assicurano, costituisce uno strumento necessario, ma solo temporaneo, di contenimento dei rischi, poiché la rapidità di evoluzione delle soluzioni tecniche limita la durata di tale funzione (come conferma la comune, frustrante esperienza di testi realizzati con sistemi di videoscrittura non più leggibili dopo solo pochi anni dalla loro produzione).
Obsolescenza e formati dei file. – Su questo fronte, due sono gli aspetti su cui si concentra, in misura crescente, anche se non al medesimo livello, la preoccupazione di studiosi e professionisti: l’obsolescenza dei formati e la perdita di conoscenza sui modi in cui i dati sono strutturati e, perciò, reperibili. I rischi per la persistenza delle memorie digitali a causa di formati proprietari non tempestivamente monitorati o la totale assenza di informazioni relative alla progettazione di archivi digitali sono del resto da tempo testimoniati dalle sempre più frequenti denunce in tutti gli ambienti (pubblici e privati) di perdite gravi di dati, a fronte di investimenti cospicui: il primo caso, emblematico, fu quello del Combat air activities file (Cacta) relativo alle missioni di attacco aereo statunitense in Vietnam (1965-70), il cui formato proprietario e l’errato intervento di migrazione hanno impedito la localizzazione delle bombe inesplose per ben 25 anni dopo la fine del conflitto, fino a quando non sono stati individuati nei National archives di Washington i dati originali, adeguatamente conservati e, soprattutto, attentamente documentati (Ruggiero 2003).
Per quanto riguarda i formati dei file – ossia dei linguaggi e delle regole utilizzati per rappresentare e interpretare le informazioni codificate in una sequenza di bit in modo da assicurarne la trasmissione e la comprensione in ambito applicativo – la consapevolezza degli utenti è cresciuta e ha di fatto imposto agli stessi fornitori, grazie alle raccomandazioni internazionali che hanno inciso soprattutto in alcune aree di mercato, una diversa attenzione per l’utilizzo di standard aperti e di formati ben documentati, trasparenti, indipendenti dalle piattaforme tecnologiche, privi di protezione che ne limitino l’impiego, sicuri, orientati all’interoperabilità e quindi duraturi. Sono stati creati e resi liberamente consultabili registri che documentano in dettaglio le caratteristiche tecniche dei principali formati digitali, li descrivono e ne consentono la verifica e la validazione. Il più famoso e consolidato sistema di registrazione è quello sviluppato e gestito dagli archivi nazionali britannici PRONOM (http://www.nationalarchives.gov. uk/aboutapps/pronom).
Grazie alla pressione crescente esercitata dagli utenti e dagli operatori, ma anche alla presenza di produttori di software più propensi all’utilizzo di standard, non sono mancati successi rilevanti in quella che è stata, non a torto, definita la guerra dei formati, soprattutto per i pacchetti office di largo consumo. I pericoli per l’accessibilità e la conservazione, peraltro, non possono certo ritenersi definitivamente scongiurati, a fronte di un’importante fase di transizione tecnologica che ha portato, a partire dalla fine del primo decennio di questo secolo, alla nascita e alla diffusione massiva di nuovi prodotti, esplicitamente (ma non coerentemente) orientati a favorire la pervasività e la capacità di condivisione dei contenuti. Si fa qui riferimento ai dispositivi digitali progettati per il mobile computing, quali i tablet, gli smartphone e i book reader, e destinati ad accompagnare gli utenti in tutti i loro spostamenti. Tali sviluppi hanno reso indispensabile creare nuovi formati ‘adattabili’ ai diversi dispositivi, apparentemente aperti, in realtà solo interoperabili soprattutto all’interno dei sistemi proprietari per cui sono stati predisposti, dato che le logiche di mercato che governano tali processi sono finalizzate a catturare il maggior numero di clienti a scapito delle aziende concorrenti. I produttori hanno quindi ridotto gli investimenti e l’attenzione a favore degli standard, faticosamente conquistata dagli utenti grazie alle precedenti impegnative campagne di sensibilizzazione (almeno per quanto riguarda i formati) e hanno individuato soluzioni di minore compatibilità tra i diversi sistemi, accrescendo in questo modo i rischi e i costi per la conservazione nel medio e nel lungo periodo dei contenuti digitali.
Metadati, documentazione e policy contro l’obsolescenza. – I nodi da affrontare non si riducono tuttavia al controllo dei formati, né alla tenuta e gestione dei supporti di memorizzazione, poiché i contenuti informativi hanno necessità di essere compresi sia in rapporto ai significati che veicolano in quanto entità singole sia nelle relazioni all’interno delle collezioni e degli archivi digitali. È questo il compito che viene di norma affidato ai metadati, in quanto elementi informativi che consentono di individuare le risorse univocamente e in rapporto al loro contesto di produzione e di tenuta, rendendone possibile il reperimento nel lungo periodo anche a fronte di mutamenti nella localizzazione dei file, per es. per l’abbandono di interi domini oppure per l’aggiornamento strutturale dei portali che implichi lo spostamento o la cancellazione di contenuti. Tali informazioni accompagnano le risorse digitali nella forma di annotazioni digitali aggiuntive, la cui natura varia in base alle peculiarità dei materiali da descrivere e annotare e in considerazione dei collegamenti tra entità che i produttori o autori dei materiali ritengono indispensabile predisporre in origine e mantenere nel tempo, per consentire che gli utenti possano in futuro comprendere correttamente e riutilizzare le entità medesime. L’o. d. riguarda in modo diffuso anche questo tipo di componenti, la cui inadeguata conservazione mette a repentaglio la permanenza dei patrimoni digitali, tanto quanto il danneggiamento dei supporti o l’illeggibilità dei file. Si tratta, inoltre, di informazioni che raramente accompagnano il processo di memorizzazione o di migrazione delle risorse, se non in forme ridotte e grazie all’intervento del produttore e al suo specifico livello di consapevolezza. Esistono diverse tipologie di metadati e di standard correlati ai bisogni dei produttori e alla natura delle memorie da preservare: metadati descrittivi, come nel caso dello standard Dublin core per l’interscambio di entità singole, originariamente di natura bibliografica, o dell’Encoded archival description (EAD), per l’ambito archivistico e per la restituzione delle relazioni di contesto; metadati strutturali per il trattamento omogeneo di un pacchetto informativo, come nel caso di METS (Metadata Encoding and Transmission Standard); metadati specifici per la conservazione (PREMIS, PREservation Metadata: Implementation Strategies) e altro ancora.
Le tipologie sono molteplici e in alcuni casi l’applicazione di un modello standard costituisce lo strumento fondamentale per combattere gli effetti negativi dell’obsolescenza. È necessario tuttavia sottolineare che tra gli strumenti di maggiore peso non si deve trascurare il ruolo della documentazione originaria dei progetti informatici (per es., nella costruzione delle basi di dati o nell’organizzazione di siti web) e dello sviluppo di policy, che definiscano anticipatamente responsabilità chiare e forniscano indicazioni guida capaci di governare per tempo i rischi per la sopravvivenza delle memorie e contenere i costi, assicurando la sostenibilità delle iniziative di salvaguardia o di recupero.
Bibliografia: A. Ruggiero, Conservazione delle memorie digitali, rischi ed emergenze: sei casi di studio, 2003, http://www.iccu. sbn.it/upload/documenti/emergenze.pdf (23 ottobre 2015); S. Allegrezza, Requisiti e standard dei formati elettronici per la produzione di documenti informatici, «Archivi & computer», 2009, 23, pp. 44-84; G. Roncaglia, La quarta rivoluzione: sei lezioni sul futuro del libro, Bari-Roma 2010; M. Guercio, Conservare il digitale. Principi, metodi e procedure per la conservazione a lungo termine di documenti digitali, Bari 2013.