Web Agency

Verso InterPARES 3: un'alleanza di ricerca tra comunità e università

Luciana Duranti

in nn. 2-3/2006

La documentazione elettronica ha modificato ogni aspetto delle attività commerciali, della ricerca, del governo e della vita quotidiana. Email, voto elettronico, dati frutto di ricerca scientifica e di inchieste, documenti di società finanziarie e arte digitale sono solo alcuni dei materiali utilizzati nelle operazioni di tutti i giorni nella società moderna. Coloro che detengono questi documenti hanno necessità di mantenerli in modo che la loro affidabilità, accuratezza e autenticità possano essere dimostrate in ogni momento per sostenere, ad esempio, ricerca e innovazione, convalida legale, diritti d’autore, scoperte scientifiche, questioni di proprietà e precedenza riguardanti sia i governi che i singoli, e la responsabilità.

Anche la conservazione a lungo termine dell’autenticità deve essere una preoccupazione primaria, in primo luogo perché generazioni di materiale digitale sono già andate perdute a causa dei cambiamenti delle tecnologie e di pratiche di conservazione inadeguate, e in secondo luogo perché l’autenticità dei materiali digitali sopravvissuti è al presente difficile da provare, se non impossibile. Numerosi progetti di ricerca in tutto il mondo hanno affrontato questi problemi[1], ma lo sforzo di maggiore portata è stato compiuto dal progetto InterPARES (1999 – 2006), che – sulla base del patrimonio di conoscenze acquisite da altri progetti e creando nuova conoscenza con una ricerca originale – ha sviluppato una teoria, dei metodi e delle strategie essenziali alla conservazione a lungo termine di documenti autentici creati e/o mantenuti in formato digitale[2].
Questo insieme di concetti, principi e metodi rappresenta il fondamento e la cornice per qualunque soluzione di conservazione digitale. Tuttavia, una delle conclusioni più significative  di InterPARES è che tali soluzioni sono specifiche per l’ambiente e devono essere pianificate dai conservatori alla luce del contesto culturale, amministrativo, legale e funzionale nel quale operano; della natura e delle caratteristiche dell’organizzazione o dell’individuo che hanno prodotto la documentazione digitale; della tipologia del materiale prodotto e delle sue caratteristiche documentarie e tecnologiche; dei limiti imposti dalle risorse umane e finanziarie disponibili; dalla cultura organizzativa di colui che ha prodotto la documentazione e di chi la conserva e infine dalla possibilità di accedere a professionisti specializzati o a programmi formativi.
La teoria e i metodi proposti da InterPARES sono immediatamente applicabili alla struttura strategica e operativa di un archivio nazionale di grandi dimensioni, ma non possono essere applicati direttamente ad un’organizzazione di piccola o media grandezza senza adattamenti significativi e senza tradurre metodi e strategie in piani di azione concreti per ogni gruppo di documenti o di dati.
In questo contesto, le questioni da approfondire sono:
            1) Come si può adattare la conoscenza acquisita in materia di conservazione dei documenti digitali ai bisogni e alle condizioni delle organizzazioni di piccola e media grandezza?
            2) Tra le tipologie di documenti digitali che le piccole e medie organizzazioni devono conservare, quali hanno attualmente necessità di maggiori attenzioni e quali sono le questioni e i problemi più urgenti riguardanti la loro creazione e gestione?
            3) Quali piani di intervento possono essere ideati per la conservazione a lungo termine di questi nuclei documentari?
            4) Il piano di intervento messo a punto per un determinato insieme di documenti, può essere valido per un altro gruppo di documenti dello stesso tipo, prodotti e conservati da una persona o organizzazione analoga?
            5) Quali conoscenze e capacità sono richieste per coloro che devono ideare piani d’intervento per la conservazione di documenti digitali nelle piccole e medie organizzazioni?
Quanto siano urgenti queste domande è dimostrato da alcuni esempi:
            1) La maggior parte dei documenti e dei dati del Vancouver Olympic Committee (Comitato Olimpico di Vancouver) verrà prodotta utilizzando le più avanzate tecnologie. Questi documenti e dati saranno soggetti a tutta la normativa pertinente, come quella relativa a privacy e diritto d’autore, e al termine delle Olimpiadi del 2010 saranno non più correnti e verranno quindi trasferiti negli archivi della città di Vancouver, senza essere stati sottoposti fin dalla loro creazione alla normativa sulla gestione dei documenti predisposta dagli archivi, alla quale devono conformarsi solo gli uffici pubblici, nonostante tutti gli archivi comunali in Canada acquisiscano documenti di organizzazioni e individui privati. I documenti digitali di enti privati devono essere generati e mantenuti in maniera affidabile e accurata e, per avere buona riuscita, la loro conservazione autentica a lungo termine deve avere inizio al momento della creazione del documento; ad oggi, tuttavia, non si è stabilita una buona abitudine di collaborazione tra i privati produttori di documenti e gli archivi cittadini, che possa servire allo scopo. La ricerca aspira a costruire tale sinergia attraverso un’azione diretta.
            2) I documenti elettronici costituiscono l’80% dei casi di investigazione per truffa, secondo il gruppo di tecnologia forense del Pricewaterhouse Coopers, che ha analizzato il valore delle investigazioni negli ultimi due anni. Il numero dei casi di cui la società si è occupata in quel periodo è triplicato e in media ogni caso richiede l’analisi di 500.000 e-mail e documenti[3]. Un sistema di archiviazione affidabile contenente documenti la cui autenticità sia garantita da un custode altrettanto affidabile eviterebbe i costi altissimi in termini di risorse umane e finanziarie a carico degli investigatori, ma ad oggi non ne esiste alcuno. Questa ricerca può aiutare a progettare un tale sistema.
            3) Nell’aprile 2006 il British Columbia Privacy Commissioner riferì che il governo provinciale aveva fallito nel perseguire procedure atte a distruggere nastri di computer contenenti informazioni mediche su migliaia di cittadini. Lo scorso anno, quando una riorganizzazione del Ministero del lavoro e dell’assistenza statale portò alla chiusura di un ufficio regionale a Vancouver, 41 nastri di backup contenenti informazioni confidenziali su sieropositività, malattie mentali e abuso di sostanze stupefacenti riguardanti singoli individui finirono ad un’asta pubblica  e vennero prese da un quotidiano locale[4]. Per quanto possano esistere procedure adeguate per lo scarto, troppo frequentemente avvengono episodi di cattiva gestione, intenzionali o meno. Questa ricerca può aiutare a inserire in un sistema di controllo dei documenti una procedura di monitoraggio della gestione.
            4) TRIUMF, un laboratorio nazionale di fisica molecolare e nucleare che ha sede nel campus dell’Università del British Columbia, gestito da un consorzio delle quattro università che partecipano a questa ricerca, analizzerà e immagazzinerà i dati provenienti dal progetto ATLAS , condotto nei laboratori svizzeri del CERN. Si prevede che questi dati occuperanno  4,5 milioni di CD all’anno e dovranno essere conservati dal consorzio di università[5]. Questa ricerca può sviluppare un piano di intervento per questa impresa che non ha precedenti.
            5) Nel 2002, la «Rivista di biologia cellulare» «(The Journal of Cell Biology») ha sviluppato un test che ha rivelato che il 25% di tutti i manoscritti accettati contenevano una o più illustrazioni che erano state impropriamente manipolate[6]. Se questo test fosse stato messo a punto prima, si sarebbero potuti prevenire casi scandalosi, come ad esempio quello del dott. Hwang Woo Suk che mescolava immagini di cellule embrionali umane[7]. Una procedura formalizzata di accuratezza nel trasferimento dei dati  e deposito delle illustrazioni stabilita dagli archivi delle università avrebbe potuto prevenire la manipolazione dei risultati di ricerche.
Il problema della conservazione dei dati frutto di ricerche fu affrontato da uno studio condotto da un comitato incaricato del SSHRC nel 2001 – 2002. Il rapporto finale consigliava la creazione di un archivio nazionale di dati, ma ancora non si è fatto nulla[8]. Questa ricerca svilupperà piani di intervento da realizzare negli archivi delle università.
 
            Risultati
La prima serie di risultati costituirà, per ciascuno dei partner coinvolti nella sperimentazione, un insieme di piani di intervento specifici per i documenti elettronici esistenti. Dopo un’analisi comparativa tra le autorità nazionali e organizzative, questi piani di intervento possono dare origine a progetti modello per tipologia di documenti, produttori di documenti o archivisti, all’interno dello stesso paese o a livello internazionale. L’applicazione di una teoria e di metodi generali a concrete realtà particolari darà origine alla seconda categoria di prodotti, cioè, un insieme di moduli per l’insegnamento rivolti ai bisogni delle associazioni professionali per i programmi di formazione continua, delle istituzioni e dei progetti di archiviazione per la formazione del loro staff interno e delle università per i piani di studio. Ovviamente il nostro risultato più importante sarà costituito da professionisti competenti e preparati.
 
            Metodologia
Questo tipo di progetto richiede attività di ricerca. L’attività di ricerca è un insieme di metodi partecipativi ed iterativi, che nel portare avanti un’azione (in questo caso l’archiviazione di documenti elettronici) svolge allo stesso tempo ricerca. Ovviamente, l’attività di ricerca produce collaborazione tra i membri della comunità e i ricercatori in un programma di azione e di riflessione indirizzato a un cambiamento positivo. Le tappe della ricerca previste in questo progetto sono le seguenti:
            Stabilire il contesto e il ciclo di ricerca—Inizialmente ogni partner identificherà un insieme di documenti digitali per i quali sarò sviluppato un piano di archiviazione. Questo è il contesto di risoluzione di un problema attraverso la teoria e di sviluppo di una teoria attraverso la risoluzione di problemi.
            Raccolta di dati – Verranno raccolti dati riguardanti il contesto e i limiti di ogni sperimentatore e l’insieme specifico di materiale, le tipologie documentarie, i vincoli tecnologici, il significato funzionale e culturale, etc.
            Prima ripetizione: sperimentare soluzioni diverse in contesti diversi— Tutti i partner rifletteranno su questi dati e formuleranno insieme diverse possibili soluzioni dalle quali emergerà un solo piano d’intervento che verrà sperimentato e includerà strategia, protocolli, requisiti funzionali, procedure e un risultato previsto.
I risultati della sperimentazione includeranno la verifica dell’esecuzione di questo piano nei confronti dei benchmarks e delle linee di intervento stabilite nell’attuale ricerca.
            Confronto tra le prime iterazioni—I risultati del test verranno distribuiti tra i ricercatori e analizzati. Una valutazione di questi risultati ci permetterà di riflettere sull’intervento e raffinare i rispettivi piani di azione.
            Seconda iterazione: soluzioni raffinate per contesti particolari—Dopo questa valutazione, inizierà un nuovo ciclo del processo. Questa seconda iterazione considererà le anomalie nei risultati dei test, e beneficerà della comprensione guadagnata dal confronto tra i contesti.  Nel fare ciò, si raffineranno i nostri piani e i metodi di esecuzione. La seconda iterazione continuerà con piccoli aggiustamenti, fino a raggiungere l’accordo su un piano d’azione definitivo che si adatti ad ogni contesto.
            Confronto tra le seconde iterazioni—I dati verranno confrontati tra gruppi – le organizzazioni di partecipanti al progetto dello stesso tipo (ad esempio archivi cittadini, archivi universitari) – per stabilire quali sono i fattori critici che determinano la soluzione più appropriata per questi contesti e se sono collegati a tipologie documentarie, tecnologia, cultura o funzione organizzativa, o ad altri elementi ambientali.
Questo confronto permetterà di fare delle affermazioni di carattere generale. Inoltre, una volta l’anno, i risultati verranno confrontati con risultati di ricerche parallele condotte all’estero. Il confronto dei risultati non si appoggerà sul vuoto visto che tutti i partner internazionali condivideranno lo stesso sito web e saranno in continua comunicazione..

            Riflessione, analisi e sintesi—Lungo tutta la ricerca, i collaboratori rifletteranno sui risultati e sui processi per rendere espliciti le loro ipotesi e indirizzi, in modo da formulare considerazioni teoriche. Questa conoscenza riflessiva ed impegnata darà la possibilità ai partecipanti di legare la riflessione critica ai processi critici del loro incarico. Perciò, mentre il progetto inizierà con una teoria che ispirerà la pratica, man mano che andrà avanti la pratica raffinerà la teoria in continua trasformazione.



[1] Most notable is the Open Archival Information System (OAIS) Reference Model, available at http://public.ccsds.org/publications/archive/650x0b1.pdf.  The information model articulated in the OAIS standard has been the foundation of several other projects, such as CEDARS, PREMIS and Persistent Archives, respectively accessible at http://www.leeds.ac.uk/cedars/, http://www.oclc.org/research/projects/pmwg/, and http://www.sdsc.edu/NARA/. Also the Camileon and METS projects, accessible at http://www.si.umich.edu/CAMILEON/ and http://www.loc.gov/standards/mets/, as well as the ERPANET project, available at http://www.erpanet.org/, have strongly contributed to the building of a consistent body of general knowledge on digital preservation.
[2]InterPARES (International Research on Permanent Authentic Records in Electronic Systems) was funded by two consecutive Social Sciences and Research Council (SSHRC) of Canada Major Collaborative Research Initiatives (MCRI) grants. It is a multidisciplinary international project involving twenty-one countries, public and private sectors, academics and professionals, record makers, record keepers and record preservers. For its products see http://www.interpares.org/ip2/ip2_products.cfm
[3] “PWC On Fraud Trail.”  Financial Director (December 13, 2005) 22.
[5] Shaw, Gillian. “Universities here join in massive experiments.” The Vancouver Sun (April 19, 2006) E3.
[6] Wade, Nicholas. “It May Look Authentic; Here's How to Tell It Isn't.” The New York Times (January 24, 2006) F1.
[7] Levin, Steve. “Stem Cell Researcher Admits Phony Data.” Pittsburgh Post-Gazette (Pennsylvania) (March 8, 2006) A-1.
[8] SSHRC and National Archives of Canada, We Build Understanding.  National Research Data Archive Consultation (Needs Assessment Report, May 2001); SSHRC and National Archives of Canada, We Build Understanding. National Research Data Archive Consultation. Final Report (June 2002).

Fondazione Ansaldo