Archiviazione digitale e formato PDF/A

In questo post si svilupperanno i seguenti argomenti
  • Le problematiche dell’archiviazione digitale dei documenti
  • Il formato PDF/A
  • Obbligatorietà del formato PDF/A nel deposito d’alcuni documenti
  • Strumenti leciti e gratuiti per confezionare file in formato PDF/A
  • Controllo dei file PDF/A
1. Le problematiche dell’archiviazione digitale dei documenti

Siamo in un epoca di transizione in cui sempre più spesso si sostituiscono i documenti “su carta” con documenti digitali.
I motivi sono molteplici, per citare solo alcuni:
  • Economicità rispetto ai costi della carta
  • Rilevante riduzione degli spazi d’archiviazione
  • Aggiornabilità e condivisione veloce dei dati
  • Inviabilità di documenti complessi e di grandi dimensioni via WEB a costi ridottissimi ed in tempo reale.
A questi grandi benefici corrisponde però un (possibile) problema, quello della conservazione per lungo periodo di questi dati.
La durata dei dati scritti sulla carta è pari… alla durata della carta.
Nelle nostre biblioteche possiamo consultare, quali preziosi documenti storici, libri contabili del XIII° secolo. Fu, infatti, in questo periodo che la più economica carta sostituì in occidente la costosa pergamena.
Sorge ora la domanda, ma fino a quando potrò consultare i miei preziosi file?

La risposta non è facile perché dipende:
  • Dalla durata del supporto (Floppy, CD, DVD). Non è facile fornire dati a causa della relativa giovinezza di tutti i supporti esistenti, ma certo non si tratta di una durata molto lunga, ad esempio le case produttrici dichiarano una durata dei CD di 100 anni, ma abbiamo molti casi di dati persi su CD (per decadimento del supporto) dopo soli 10 anni.
  • Dalla disponibilità nel tempo dell’apposito lettore. Per leggere un documento di carta al massimo mi serviranno degli occhiali, ma per leggere un file devo disporre di lettori CD/DVD, Floppy, Card reader ecc. Ma in informatica i formati cambiano. Se a suo tempo avete salvato preziosi dati su un floppy di dimensione 5,25, su un disco Jaz, su un nastro Ditto Max, su una cartuccia Sparq… non troverete lettori per estrarre i dati.Se siete incuriositi dai formati obsoleti rimando a questa pagina
http://www.icpsr.umich.edu/dpm/dpm-ita/oldmedia/disks.html

  • Dalla disponibilità nel tempo del software idoneo a leggere quel particolare file. I software si evolvono, le case software chiudono o sono assorbite, i sistemi operativi cambiano… e vecchi file informati obsoleti non sono più apribili perché manca l’idoneo software. Il Britain’s National Archive ha stimato di essere in possesso di una quantità di informazioni - informati non più normalmente leggibili - tale da poter riempire 580mila enciclopedie!
I primi due punti richiedono un’accurata gestione nel tempo dell’hardware e dei supporti utilizzati, riversando i dati su nuovi supporti ad alta diffusione quando i supporti utilizzati si avviano ad essere obsoleti.

Invece per l’aspetto software, onde assicurare la disponibilità del software idoneo ad aprire il documento anche dopo molti anni, è stato avviato il progetto per il formato PDF/A


2. Il formato PDF/A

Per assicurare la disponibilità dei dati nel lungo periodo sono state intraprese molte iniziative, quella che sta ottenendo maggiore successo è legata al formato PDF/A, uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l'archiviazione nel lungo periodo di documenti elettronici.

Il Portable Document Format, comunemente abbreviato PDF, è un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli.

In altri termini posso ottenere un file PDF da qualunque applicativo (Word, Writer, Calc, Excel, Power Point, AutoCAD ecc.) sostanzialmente come un’evoluzione della “stampa su file”.

Un file PDF può descrivere documenti che contengono testo e/o immagini in qualsiasi risoluzione. È un formato aperto, nel senso che chiunque può creare applicazioni che leggono e scrivono file PDF senza pagare i diritti (Royalty) all’Adobe Systems.

Adobe ha un numero elevato di brevetti relativamente al formato PDF ma le licenze associate non includono il pagamento di diritti per la creazione di programmi associati.
Il documento PDF non include informazioni specifiche per software, hardware e sistema operativo usato. Ciò permette che il documento sia visualizzato e stampato nella stessa esatta maniera indipendentemente dalla piattaforma e/o dispositivo utilizzato per leggerlo.

Anche questo fatto ha contribuito a farlo diventare un formato standard de facto molto diffuso per la condivisione dei documenti.

L’unico problema per la stampa di documenti in formato.PDF “normale” può derivare dall’uso dei caratteri locali (ad esempio le vocali italiane accentate) e se chi stampa ha il proprio PC impostato su una lingua diversa.

Il PDF/A è stato sviluppato per definire uno standard internazionale del Portable Document Format (PDF) per l'archiviazione e la preservazione dei documenti.

Questo standard ha, alla data attuale, due livelli di conformità:

  • PDF/A-1a = Il massimo richiesto dallo standard
  • PDF/A-1b = Il minimo richiesto dallo standard
Seguendo queste indicazioni nel gennaio 2007 la Adobe ha intrapreso la strada della standardizzazione per far diventare il PDF un formato standard ISO 19005-1:2005, ovvero un formato internazionale standardizzato e gratuito.
Sostanzialmente questo formato “incapsula” tutte le informazioni necessarie nel file assicurando che documenti siano completamente "auto-contenuti". Tutte le informazioni necessarie per la visualizzazione del documento sono incorporate nel documento stesso. Queste comprendono tutti i contenuti (testi, immagini raster e grafica vettoriale), i caratteri, i colori e le informazioni.

I software di lettura sono diffusissimi e gratuiti, quali ad esempio Acrobat (o Adob
e) Reader.

In relazione a questi software colgo l’occasione per consigliare l’utilizzo della versione più recente concepita per il Vostro sistema operativo.

Potete verificare quest’aspetto alla pagina ufficiale dell’Adobe a quest’indirizzo:

http://www.adobe.com/it/products/reader/systemreqs/#90win

E’ opportuno specificare che questo formato ha anche due svantaggi:
  • Dal momento che un documento PDF/A deve includere tutti i font che utilizza, un file PDF/A sarà più grande dell'equivalente file PDF che non include i font.
  • La maggioranza degli strumenti di generazione di PDF che permettono la conformità allo standardPDF/A, come lo strumento d’esportazione PDF presente nella suite Microsoft Office 2007, eliminerà la trasparenza d’ogni immagine presente nel documento perché tale caratteristica è vietata nelPDF/A-1.

Se interessati è disponibile un breve videotutorial




3. Obbligatorietà del formato PDF/A nel deposito d’alcuni documenti

Sono sempre di più le Amministrazioni e gli Enti che richiedono questo formato nei documenti digitali da presentare quali ad esempio Università per le tesi di laurea.
Inoltre, per rimanere in un ambito a noi usuale, a partire dal 15 gennaio 2009 devono essere prodotti in formato PDF/A (per l’esattezza PDF/A-1b) tutti i documenti elettronici portanti atti per i quali la legge prescrive la pubblicazione tramite iscrizione o deposito nel Registro delle Imprese.


4. Strumenti leciti e gratuiti per confezionare file in formato PDF/A
Come già accennato possiamo ottenere questo formato convertendo i file originati dai vari applicativi.
Trattandosi di una particolare “stampa su file”, vari software forniscono questa possibilità nella cartella “Stampanti” del computer, mentre altre rendono disponibile un comando solitamente definito “Esporta in PDF”

Per disporre di queste potenzialità sono disponibili vari software, alcuni sono dei validi strumenti a pagamento, ma nel prosieguo tratterò esclusivamente la possibilità di ottenere il risultato desiderato con applicazioni di lecito e gratuito utilizzo.

Se interessati rimando al seguente videotutorial di approfondimento




4.1 Open Office

Come sopra presentato dal video una eccellente soluzione lecita e gratuita è OpenOffice, a partire dalla versione 2.4 (caldamente consigliata la 3.0 o successiva per le più ampie potenzialità di gestione dei file PDF). OpenOffice è scaricabile gratuitamente dal sito:

http://it.openoffice.org/

possiamo produrre un PDF/A partendo da un documento realizzato con questo software o importato da altri software compatibili (esempio nel formato .doc) con la seguente procedura:


1) Aprire il documento di testo relativo al documento redatto con i propri strumenti

2) Dalla voce menu File scegliere quindi l'opzione Esporta nel formato Pdf3) Dal Menu Opzioni PDF che si presenta, nella sezione Generale , impostare la casella PDF/A-1
4) Attivare il tasto Esporta
5) Salva il documento.

Il documento così salvato (con estensione .pdf ) sarà in formato PDF/A.



Utilizzando il prodotto OpenOffice, a partire dalla versione 3.0, e scaricabile sempre gratuitamente, è anche possibile gestire l’esportazione in formato PDF/A di documenti importati da scanner o già disponibili in pdf “normale”

E’ necessario scaricare ed installare Sun PDF Import, un componente aggiuntivo per OpenOffice in grado di importare e modificare tutti i documenti in formato PDF, per scaricarlo usare il link seguente:

http://extensions.services.openoffice.org/project/pdfimport

Tra le varie potenzialità quest’estensione gratuita consente di acquisire un’immagine da scanner e di esportarla in formato PDF/A con la seguente procedura:

1) Aprire l’applicativo Writer di OpenOffice

2) Scegliere Inserisci

3) Operare la scelta Immagine, da Scanner

4) Cliccare Avvia

5) Acquisita l’immagine passare al suo salvataggio

6) Dalla voce menu File scegliere quindi l'opzione Esporta nel formato Pdf

7) Dal Menu Opzioni PDF che si presenta, nella sezione Generale , impostare la casella PDF/A-1

8) Attivare il tasto Esporta

9) Salva il documento con il nome scelto

Questa estensione inoltre consente di aprire ed editare (scrivere, modificare…) i file in formato PDF; è molto comoda e soprattutto gratuita.


4.2 Installare una stampante virtuale

E’ comunque possibile utilizzare anche una stampante virtuale mediante la quale “stampare in PDF” da qualsiasi applicazione abbiate installato sul vostro computer.
Esistono numerose soluzioni, sia gratuite che a pagamento. Nel campo del software di gratuito utilizzo particolarmente interessante è PDF Creator della PDF Forge.
E’ necessario disporre della versione 0.9.8 o successiva, che utilizza Ghostscript 8.64 per produrre i files PDF.

Il software può essere gratuitamente scaricato all’indirizzo

http://www.pdfforge.org/

Questo software consente un altissimo livello di gestione del documento in formato PDF, per quanto di nostro interesse dobbiamo avere l’avvertenza - quando compare la finestra di richiesta del nome del file da salvare – di scegliere il formato PDF/A dalla lista a discesa dei formati.

Per gli appassionati di informatica è possibile operare installando direttamente Ghostscript 8.64,
scaricandolo da:

http://pages.cs.wisc.edu/~ghost/doc/GPL/gpl864.htm


Si tratta però di una modalità più impegnativa di installazione da parte dell’utente comune.


5. Controllo dei file PDF/A

Purtroppo non esistono attualmente prodotti open source in grado di fornire un controllo affidabile dei file PDF/A.
Esistono al riguardo prodotti a pagamento, si veda al riguardo il sito:

http://www.pdfa.org/

alla sezione Validate PDF/A

Tra i prodotti commerciali utilizzabili si segnala:

  • Adobe Acrobat 8 Professional e superiori, che esegue la verifica di conformità del documento allespecifiche dello standard di formato ISO 19005 definite. La funzione di verifica è attivataselezionando il link presente nella sezione “Informazioni PDF” del documento stesso.
Si tratta di soluzioni non propriamente economiche. Per una verifica sporadica, quale quella necessaria ad un comune utente è possibile utilizzare un controllo valido (ma non assolutamente certo), messo a disposizione dal software gratuito Acrobat Reader nella versione 9.0 o successiva, operando come segue:

1) Aprire Acrobat Reader 9.0 o successivo
2) dal menu Modifica e selezionare la voce Preferenze
3) verificare/impostare l'opzione visualizza i documenti in modalità PDF/A con il valore Solo per documenti PDF/A (in genere opzione predefinita in installazione).


All’apertura di un documento PDF con Acrobat Reader 9 può apparire in automatico, ad inizio pagina, una barra blu con l’informativa “il documento viene visualizzato in modalità PDF/A”.

Se non appare tale dicitura, certamente il formato del documento non è conforme allo standard PDF/A.

Se appare la dicitura indicata, il formato del documento dovrebbe essere compatibile allo standard PDF/A, ma la certezza del formato può essere verificata con certezza solo con gli strumenti prima indicati.

Commenti

Post popolari in questo blog

Legalmail e rubrica LDIF

Visualizzazione e stampa del formato XBRL

I nuovi formati PDF/A-2 e PDF/A-3