Page 1

regesta.exe srl

Note in archivio Descrizione della piattaforma tecnologica

via Monte Zebio 19, 00195 Roma – Codice fiscale - Partita Iva - Iscrizione Registro Imprese di Roma 09825831002


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

Riferimenti Oggetto Categoria Destinatario Riferimenti Nome File Versione Data di creazione Ultimo aggiornamento Autore Approvazioni

Riferimenti Note in archivio Descrizione della piattaforma tecnologica

Noteinarchivio_architettura_software_01.pdf versione 1.0: pag. 16 22 marzo 2008 Donato Lanzellotto

Riservatezza Regesta.exe srl fornisce queste informazioni prevedendo che sarĂ mantenuto il corretto livello di riservatezza sui relativi contenuti. Il documento non potrĂ  essere fotocopiato o riprodotto, in tutto o in parte, i contenuti non potranno essere divulgati a terzi, senza il consenso scritto di Regesta.exe srl.

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

2


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

Sommario INTRODUZIONE ....................................................................................................................................... 4

IL SISTEMA XDAMS™............................................................................................................................. 4 LA DESCRIZIONE ARCHIVISTICA....................................................................................................................... 5 LA DESCRIZIONE E LA GESTIONE DEI DOCUMENTI MULTIMEDIALI ............................................................................................. 5 EAD (ENCODED ARCHIVAL DESCRIPTION) ......................................................................................................................... 6 DESCRIZIONE DELLE FUNZIONALITÀ ................................................................................................................. 7 LA GESTIONE DEGLI ALLEGATI DIGITALI ............................................................................................................ 9 IL COLLEGAMENTO CON GLI ALLEGATI ............................................................................................................................... 9 IL MAG .................................................................................................................................................................... 10 LE MODALITÀ DI RICERCA ............................................................................................................................ 11 LA RICERCA AVANZATA ................................................................................................................................................ 12 L’INTEGRAZIONE CON OAI-PMH ................................................................................................................. 13 LE CARATTERISTICHE DEL SERVIZIO ................................................................................................................................. 13 EXTRAWAY® XML ENGINE ................................................................................................................... 15 LE CARATTERISTICHE DEL MOTORE ................................................................................................................ 15 METADATI ................................................................................................................................................ 16 SUPPORTO NATIVO DEL LINGUAGGIO XML..................................................................................................... 16 FUNZIONALITÀ DI RICERCA .......................................................................................................................... 16

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

3


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

INTRODUZIONE La piattaforma tecnologica, comprende un sistema completo di content management di archivi e documenti multimediali, destinato a rispondere sia alle esigenze di backoffice che a quelle di fruizione sul canale Internet di contenuti digitali multimediali. Per la realizzazione dell'intero sistema, fortemente basato sulle potenti tecnologie JAVA-XML, sono state TM utilizzate le piattaforme xDams per la gestione e l'accesso al patrimonio ed Extraway® quale strumento per l'information retrieval XML.

IL SISTEMA XDAMS™ TM

xDams è un ambiente specializzato e integrato per il trattamento di documenti eterogenei sulla base di una tecnologia, una sintassi descrittiva e una metodologia comuni: tale piattaforma costruita in modalità totalmente web-based è fondato sull'utilizzo di un formato dati aperto come XML quale modello di rappresentazione e formato di conservazione dei dati, e dall'adozione di software OpenSource come JAVA 2 ENTERPRISE EDITION e Jboss Application Server quali ambiente di sviluppo che ne garantiscono una diffusione multipiattaforma sia lato client che lato server. Le caratteristiche di interoperabilità e condivisione delle risorse sono garantite dall'utilizzo della tecnologia XML (eXtensible Markup Language), standard emanato dal W3C nel 1998., oltre che dall'adozione del protocollo OAIPMH per l'esposizione attraverso attività di Harvesting dei set di banche dati trattate dalla piattaforma. TM

xDams è la soluzione per gli archivi realizzata da regesta.exe. •

Una piattaforma di gestione documentale sviluppata interamente sul web, ideata e realizzata per il trattamento, la gestione, la fruizione integrata di archivi storici multimediali, l’accesso a diverse tipologie di risorse digitali, immagini fotografiche, documenti audiovisivi, file musicali. • Una piattaforma per pubblicare e comunicare sulla rete il patrimonio di informazioni e risorse che ogni azienda, ogni ente accumula nel corso della propria storia. • Una piattaforma aperta, che utilizza il protocollo TCP/IP per l’accesso alle informazioni e l’erogazione dei servizi, adotta lo standard pubblico XML per la conservazione dei dati a lungo termine, si fonda su un’architettura totalmente multipiattaforma, utilizza componenti software open source come Linux, Apache e Jboss. L’accesso alle banche dati avviene attraverso un potente motore di ricerca testuale, la consultazione di indici e dizionari di campo, la navigazione della struttura gerarchica di ogni singolo fondo archivistico, strumenti di ricerca condivisi tramite gli authority files. Le caratteristiche di interoperabilità e condivisione delle risorse sono garantite dall’adozione della tecnologia XML. L’utilizzazione di questo standard rende le basi dati indipendenti da specifiche soluzioni applicative. I database realizzati con altri sistemi informativi possono facilmente “migrare” nella piattaforma. Per la codifica delle informazioni descrittive xDams adotta lo standard EAD (Encoded Archival Description). xDams rende anche disponibili diversi strumenti di interoperabilità delle banche dati: attraverso un gateway Z39.50; con l’esposizione di un repository XML accessibile all’harvesting sulla base del protocollo OAI-PMH; per mezzo di web Services. I campi di applicazione sono essere riassunti sotto:

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

4


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

 

 



 

 

mail@regesta.com | www.regesta.com

Archivi storici. La gestione di archivi storici segue le regole della descrizione multilivello e si articola nelle diverse aree informative previste dalla norme ISAD(G). Archivi fotografici. L’applicativo consente la gestione di singole immagini e di collezioni fotografiche per ogni tipologia di supporto fisico (foto, dagherrotipo, immagine digitale, etc). La catalogazione dell’immagine può essere realizzata in un contesto gerarchico sulla base dello standard definito dall’ICCD per la scheda F. Archivi audiovisivi. La piattaforma di catalogazione dell’audiovisivo consente un’archiviazione dettagliata del documento filmico, prevedendo aree specifiche per il trattamento dei dati identificativi, di accesso al contenuto, di descrizione fisica di ciascuna copia conservata, secondo le norme FIAF. Archivi sonori e archivi sonori di tradizione orale. La banca dati Archivio sonoro consente la catalogazione di tutte le tipologie di supporti, bobine di nastro magnetico, nastri digitali, audiocassette, dischi, sia editi che inediti, l’archiviazione analitica dei singoli brani di registrazioni sonore (musicali e non) e/o audio-video, il collegamento alle risorse digitali descritte secondo lo schema MAG elaborato dall'ICCU. Biblioteche. Il modulo consente la descrizione e la catalogazione di risorse bibliografiche di tutte le tipologie (manoscritti, monografie, pubblicazioni seriali, libretti musicali, ecc.), anche a partire dall’import dei relativi file UNIMARC, nonché il collegamento alle risorse digitali attraverso il set di metadati MAG sviluppato dall’ICCU. Pubblicazioni. Il modulo prevede la codifica XML dei dati secondo il modello MODS (Metadata Object Description Schema) standard per la descrizione di risorse bibliografiche basato su XML sviluppato dalla Library of Congress Iconografia e iconografia musicale. L’archivio opere d’arte e iconografia recepisce gli standard della scheda Opere d’arte (OA) dell’ICCD. Per rispondere alle esigenze catalografiche e descrittive specifiche del settore dell’iconografia musicale sono stati aggiunti l’authority file strumenti musicali e l’authority titoli. Strumenti musicali. L’archivio strumenti musicali è organizzato sulla base della scheda OA, secondo l’articolazione proposta dai musicologi Curt Sachs ed Erich von Hornbostel in famiglie di strumenti: aerofoni, cordofoni, idiofoni, membranofoni. Authority files. Gli authority files, comuni a tutti gli archivi, sono codificati sulla base della DTD EAC. Garantiscono il controllo e la normalizzazione dei dati inseriti per alcune tipologie di campi informativi e forniscono informazioni descrittive e di contesto per specifici elementi, nomi di persona, nomi di luogo, enti, società.

La descrizione archivistica XDAMS consente di inserire, modificare, gestire esclusivamente in rete Intranet/Internet i dati descrittivi sulla documentazione conservata. Per archivi già schedati in sistemi automatizzati adottati in precedenza, sarà possibile importare all’interno di una piattaforma condivisa tutto il contenuto descrittivo. Le caratteristiche di interoperabilità e condivisione delle risorse sono garantite dall’utilizzo della tecnologia XML. Sulla scorta degli ultimi progressi nel campo della descrizione delle risorse archivistiche, XDAMS adotta lo standard EAD (Encoded Archival Description) una DTD/XML per la codifica delle risorse archivistiche, come verrà approfondito più avanti.

La descrizione e la gestione dei documenti multimediali XDAMS estende il proprio servizio anche al trattamento digitale di materiale di diverso tipo: fotografie, oggetti d’arte, materiali audiovisivi, garantendo

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

5


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

• • •

mail@regesta.com | www.regesta.com

l’acquisizione delle immagini mediante la scelta dei macchinari più adatti al grado di definizione dell’immagine voluto e meno invasivi per gli oggetti fisici la descrizione secondo procedure standard sia nel caso di materiale multimediale considerato come insieme a sé, sia per la descrizione di risorse archivistiche a cui venga associato materiale originale digitalizzato le funzioni di search and retrieval nell’insieme degli archivi digitali acquisiti

EAD (Encoded Archival Description) EAD è una DTD/XML standard per la codifica di strumenti di corredo archivistici tramite SGML. La versione 1.0, elaborata nel 1998 dalla SAA (Society of American Archivists) in collaborazione la Library of Congress, è stata recentemente aggiornata nella nuova EAD version 2002 (http://www.loc.gov/ead/). Obiettivo di EAD è fornire le istituzioni archivistiche di strumenti di ricerca elettronici. Per raggiungere tale obiettivo, EAD, come standard, deve tenere necessariamente conto delle diversità esistenti tra le pratiche descrittive adottate da ogni comunità scientifica, e si propone quale formato di comunicazione che consente agli istituti archivistici di mettere a disposizione per utenti locali o remoti i propri strumenti di corredo, principalmente via Internet. 1 Le principali caratteristiche di EAD sono le seguenti : 1. è un sistema per la gestione e la condivisione del patrimonio archivistico, e per la conservazione, accessibilità, utilizzo, conservazione fisica o trattamento del materiale 2. utilizza la tecnologia SGML/XML per la conservazione e la comunicazione fisica dei dati. In alcuni ambienti la descrizione archivistica può essere creata e mantenuta adottando tecnologie informatiche come database relazionali o object-oriented, e EAD verrà utilizzata principalmente quale meccanismo di importazione, anche per la generazione e pubblicazione di inventari a partire dalle schede descrittive presenti nel sistema. In altre situazioni, gli archivi possono gestire i dati descrittivi direttamente mediante sistemi basati su SGML/XML 3. La tecnologia standard di cui si serve (SGML/XML) rende lo standard indipendente da specifiche piattaforme hardware e software, per cui la continuità della struttura e del contenuto garantisce l’accettabilità e la validità nel tempo di ogni applicazione che lo utilizzi 4. permette il recupero retrospettivo di strumenti di ricerca archivistici (guide, inventari, ecc.) in formato cartaceo e la loro pubblicazione elettronica 5. I nomi degli elementi e degli attributi di EAD devono essere il più possibile universali dal punto di vista della lingua e dell’applicazione, al fine di favorire l’interscambiabilità e la portabilità. Nello stesso tempo, è importante approntare meccanismi capaci di accogliere il linguaggio specifico e i differenti output dei media utilizzati 6. EAD è aperta a proposte di modifica, da effettuare nel modo più trasparente possibile, e preferendo l’aggiunta piuttosto che la modifica di elementi, facendo in modo che le versioni successive della DTD EAD siano compatibili con quelle precedenti. Sebbene EAD abbia cominciato il suo sviluppo negli USA basandosi sulle pratiche descrittive locali, le sue evoluzioni sono state osservate con attenzione dalla comunità archivistica internazionale e sono state costantemente sottoposte a test di funzionalità ed applicabilità a livello internazionale, particolarmente attraverso il confronto con lo standard per la descrizione dei dati ISAD(G).

1

Dal sito http://sun3.lib.uci.edu/~blandis/eadwg/, gennaio 2001.

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

6


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

A differenza di quest’ultimo, EAD non è uno standard per il contenuto dei dati, né fornisce indicazioni su come esprimerli, ma sulla struttura in cui inserirli. In quanto tale risulta così quale completamento dello standard maggiormente condiviso a livello internazionale, nei confronti del quale è risultato perfettamente compatibile.

Descrizione delle funzionalità La soluzione realizzata si basa sull’utilizzo di specifici moduli aventi le seguenti carattristiche: 1. È un sistema integrato di gestione e accesso agli archivi. 2. Si tratta di un applicativo interamente web based, che utilizza il protocollo TCP/IP per l’accesso ai dati e l’erogazione dei servizi. 3. Utilizza XML come standard di comunicazione e di conservazione fisica dei dati e la piattaforma documentale Extraway™ per la creazione degli indici e l’accesso ai dati. 4. Per la descrizione archivistica e la codifica delle risorse archivistiche adotta lo standard EAD2002 (Encoded Archival Description), pienamente compatibile con ISAD(G) Le principali caratteristiche della piattaforma sono: 1. È un sistema multiutente, in grado di offrire l’accesso differenziato all’utenza, sia essa deputata alla gestione o solamente alla consultazione dei dati. 2. È un sistema multiarchivio, che consente di raccogliere e interrogare dati archivistici di differente provenienza e formato. 3. È un sistema multimediale, che oltre a offrire la descrizione di documenti d’archivio, consente di associare a essi, o di ordinare autonomamente, altre tipologie di documenti, come immagini fotografiche, documenti audiovisivi, file musicali, ecc. L’architettura del sistema informativo è strutturata per ogni singolo account in due sottoinsiemi descrittivi: 1. una o più banche dati per la descrizione archivistica: ogni fondo archivistico inserito nel sistema risiede su un’autonoma banca dati XML, immagazzinata in un’apposita directory del file server; 2. un Authority file comune a tutte le banche dati esistenti, che svolge una tripla funzione nel sistema:  controlla e normalizza l’inserimento nelle banche dati archivistiche dei valori in una serie di campi qualificati (access point);  fornisce le informazioni di carattere generale e di contesto (informazioni identificative, anagrafiche, biografiche, bibliografiche, ecc.) per specifici elementi descrittivi: persone, famiglie, corporate bodies;  consente un accesso qualificato a tutti i records descrittivi che contengono quei valori su tutto il sistema informativo. L’ancoraggio ad un unico authority centrale e la condivisione della struttura informativa di descrizione del contenuto consentono una immediata integrazione di archivi eterogenei con la disponibilità di indici comuni e di strumenti di ricerca condivisi. Le modalità di utilizzazione del sistema: 1. modalità di gestione (management mode): permette di definire e controllare la lista e le proprietà degli archivi, la struttura, gli utenti e i loro privilegi, i livelli di accesso alle informazioni, le relazioni e i workflow operativi; 2. modalità operativa (staff mode): Consente di accedere agli archivi con privilegi di inserimento e gestione dei dati, oltreché di aggiungere descrizioni e allegati digitali; 3. modalità di navigazione (user mode) Le tipologie di utenti: 1. Account Manager: si tratta dell’amministratore del singolo account ed ha dunque facoltà di: a. creare e aggiungere utenti e archivi

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

7


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

b.

gestire i criteri di accesso per gli utenti registrati indicando a quali archivi e con quali privilegi di accesso per ogni archivio ogni utente possiede. I privilegi di accesso potranno essere modificati dall’Account Manager in qualsiasi momento. 2. Archive Manager: tale utente ha facoltà di amministrare l’organizzazione di uno o più archivi presenti sul proprio sistema attraverso una serie di tools specifici per: c. riordinare e riorganizzare l’archivio, rinumerare le schede descrittive, visualizzare i permessi, ecc.; d. stampare il singolo record o l’inventario di una sezione specifica o dell’intero archivio per l’eventuale pubblicazione; e. esportare in XML l’intero archivio o parte di esso. 3. User: sotto tale tipologia di utente rientrano tutti gli utenti che hanno il compito di aggiungere, modificare o eliminare le schede delle unità di descrizione.. 4. Guest: qualsiasi utente esterno all’istituzione che voglia accedere alla documentazione d’archivio potrà utilizzare tutte le funzionalità di ricerca a sua disposizione ma non potrà modificare il contenuto delle schede descrittive; l’utente guest può agire solo sull’insieme di archivi resi disponibili alla consultazione esterna dall’Account manager; inoltre,all’interno delle banche dati pubbliche la disponibilità delle singole descrizioni archivistiche e di ogni allegato digitale presente sul sistema è subordinata a specifici criteri di visibilità (per la gestione di documentazione riservata o ad uso limitato). L’accesso alle banche dati avviene attraverso quattro modalità: 1. la ricerca libera su tutte le schede descrittive; 2. la consultazione di liste controllate di parole chiave (persone, enti, luoghi) e dei dizionari di campo; 3. la consultazione degli authority files e la successiva proiezione sulle schede descrittive esistenti su uno qualsiasi delle banche dati archivistiche esistenti 4. la navigazione della struttura gerarchica di un singolo fondo archivistico; selezionando sulla struttura il singolo titolo dell’unità di descrizione sarà possibile visualizzare: a. la scheda descrittiva breve, con gli elementi identificativi essenziali; b. la scheda descrittiva completa di tutte le informazioni inserite dallo schedatore; c. gli allegati digitali, se presenti. È inoltre possibile, a seconda del tipo di accesso assegnato dal gestore, procedere nella stampa e nel download della documentazione digitalizzata. Ad ogni scheda descrittiva può essere allegato uno o più files digitali di diverso formato: files immagine, audiovisivi, musicali, documenti, o qualsiasi altro file digitale; tutti gli allegati vengono salvati entro una struttura di directory del file server, creata automaticamente dal sistema. Nel set di procedure di XDAMS è integrato un applicativo per l’upload di allegati digitali singoli (un solo file) o multipli. Per ogni singolo file allegato è possibile: 1. specificare un titolo specifico o di gruppo 2. indicare uno specifico criterio di visibilità (per default si assume quello della scheda). 3. Inserimento di schede negli authority files: a. b.

può essere effettuato sia dalla banca dati dell’archivio che da quella dell’authority file specifico; da qualsiasi punto venga effettuato, l’inserimento interviene (in inserimento, modifica ed eliminazione) su di un’unica banca dati, dando così modo di verificare in tempo reale l’univocità di ogni singola authority entry.

Funzionalità dell’archive manager: 4. riordinamento degli archivi (spostamento di singoli rami o di selezioni di schede, rinumerazione di tutto o parte della banca dati, eliminazione e inserimenti di livelli descrittivi) 5. produzione di strumenti inventariali a stampa: a. è possibile stampare una selezione di schede o uno specifico ramo d’inventario,

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

8


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

b. c. d.

mail@regesta.com | www.regesta.com

definire dinamicamente la lista dei campi da stampare e il loro layout grafico, indicare se accodare alla stampa delle schede quella degli indici dei controlaccess della selezione, salvare il documento in formato pdf.

La gestione degli allegati digitali La piattaforma consente il trattamento digitale di materiali eterogenei: fotografie, oggetti d'arte, materiali sonori e audiovisivi, garantendo: • la descrizione secondo procedure standard sia nel caso di materiale multimediale considerato come insieme a sé, sia per la descrizione delle risorse archivistiche a cui venga associato materiale originale digitalizzato • ad ogni scheda descrittiva può essere allegato uno o più files di diverso fomato: immagini, video, audio o altro formato digitale; gli allegati vengono salvati in una struttura di directory del file server, creata automaticamente dal sistema. Le modalità di collegamento allegati viene descritta nel paragrafo "il collegamento degli allegati". • le funzioni di search and retrieval nell'insieme degli archivi digitali acquisiti Per la tipologia immagine, in generale sono previsti 3 passaggi: • Upload o collegamento del file digitale al documento descritto • Produzione dei formati per la fruizione web • Generazione del record MAG, secondo le specifiche di mapping identificate per l'archivio di origine

Il collegamento con gli allegati La piattaforma consente l'aggancio di riproduzioni digitali alle schede documentarie secondo diverse modalità: • Modo associa: la scheda di immissione delle informazioni descrittive, consente di allegare una risorsa digitale in modo piuttosto semplice, attraverso un'interfaccia che consente l'individuazione e la selezione del file all'interno di un sistema di directory presente sul server di gestione degli allegati digitali. Tale operazione consente di non effettuare alcun invio di allegati ma solamente di stabilire il legame tra il documento e le risorse individuate. Questa modalità viene utilizzata nel caso in cui gli allegati siano già collocati correttamente sul server di gestione secondo la nomenclatura prevista. • Modo upload: attraverso questa componente è possibile inviare sul server di gestione allegati, contestualmente al salvataggio delle informazioni descrittive di un documento, una o più risorse digitali individuate su un proprio percorso locale (disco della propria workstation piuttosto che un percorso sulla rete LAN). Il file inviato, prima di essere memorizzato sul percorso stabilito per quella tipologia di scheda, viene rinominato secondo una codifica standard che prevede una univocità globale del file all'interno della rete internet. • Modo spostamento: questa modalità è utile nel caso si voglia evitare la seconda opzione piuttosto onerosa per il traffico di rete che può generare (la pesantezza degli allegati digitali su tratte di rete LAN non particolamente veloci può portare a tempi lunghi nella fase di invio sul server) e prevede la copia preventiva di tutto il materiale digitale da allegare alle schede su un repository dedicato a tale attività, comunque presente sullo stessa piattaforma di storage dell'ambiente di produzione. Attraverso l'interfaccia applicativa della scheda di immissione, viene effettuata un'operazione di "spostamento" dell'allegato individuato dal repository di lavoro alla definitiva collocazione sul server di gestione effettuando anche una ridenominazione del nome del file secondo la codifica prevista.

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

9


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

A valle della fase di collegamento delle risorse digitali al documento, viene avviata una operazione di postelaborazione del formato originale inviato sul server. Il sistema di gestione degli allegati digitali prevede sostanzialmente di ricavare immagini ottimizzate per la consultazione anche sul canale Internet, oltre che sulla rete interna. I formati generati sono: • Alta qualità web: formato a 72 dpi derivante dal file originale inviato sul server, in genere l'accesso a questo formato è consentito ai soli utenti abilitati. • Bassa qualità web: formato a 72 dpi ottimizzato e ridotto rispetto al formato di origine. Viene utilizzato per la consultazione su internet. • Preview web: formato thumbnail utilizzata come anteprima nell'esito della ricerca sulla piattaforma di presentazione internet

Il MAG Gli allegati digitali di tipo "immagine", collegati ai documenti di archivio, vengono elaborati nella fase di post memorizzazione sul server di gestione del sistema di storage. Questa elaborazione consente di accedere ai metadati tecnici delle risorse digitali collegate, e di memorizzarle in una specifica bancadati per esigenze amministrative. Nei progetti di digitalizzazione e nelle attività di gestione degli archivi di oggetti digitali i metadati rivestono un'importanza crescente, tanto da venire considerati parte costituente della definizione di Oggetto Digitale. La realizzazione di una biblioteca digitale presuppone quindi un'accurata definizione dei metadati da associare agli oggetti che la compongono. Le istituzioni della memoria hanno sempre avuto a che fare con i metadati, la cui definizione più semplice è quella di "informazioni su altre informazioni". In una scheda di catalogo, la descrizione bibliografica è un metadato di natura descrittiva, mentre il numero d'inventario e la segnatura sono metadati di natura amministrativa e gestionale. Vi sono diverse proposte di tassonomia dei metadati. Per metadati si intende dati che identificano altri dati, ad esempio la scheda descrittiva di un libro o di una risorsa in genere. Gli elementi identificati (autore, titolo, data, ecc.) sono i metadati della risorsa. I metadati sono in sé dati che permettono di descrivere, archiviare, recuperare e accedere alla risorsa. Il problema è capire quale insieme di metadati sia maggiormente efficace per il recupero dell'informazione in ambiente condiviso come quello del web. Inoltre è importante descrivere correttamente per poter recuperare la risorsa, dunque il richiamo alla struttura risulta importante per contestualizzare la risorsa informativa e permetterne il recupero. I metadati possono essere distinti in due macrocategorie funzionali: • DESCRITTIVI: servono per l'identificazione ed il recupero degli oggetti digitali; sono costituiti da descrizioni normalizzate dei documenti fonte (o dei documenti nati in formato digitale), risiedono generalmente nelle basi dati dei sistemi di Information Retrieval all'esterno dell'archivio digitale, e sono collegati a quest'ultimo tramite appositi link. • AMMINISTRATIVI e GESTIONALI: evidenziano le modalità di archiviazione e manutenzione degli oggetti digitali nel sistema di gestione dell'archivio digitale, e sono necessari per una corretta esecuzione delle relative attività. Distinzioni più articolate fra tipologie diverse di metadati possono essere fatte sulla base delle loro funzioni specifiche, ad esempio mappandone le tipologie sui diversi ruoli dei metadati all'interno del modello logicofunzionale OAIS (Open Archival Information System, Sistema Informativo Aperto per l'Archiviazione) dell'archivio digitale .

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

10


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

Nel mondo digitale, data la labilità dell'informazione elettronica, i metadati amministrativi e gestionali assumono un'importanza preponderante ai fini della conservazione permanente degli oggetti digitali. Essi possono "documentare i processi tecnici associati alla conservazione permanente, fornire informazioni sulle condizioni ed i diritti di accesso agli oggetti digitali, certificare l'autenticità e l'integrità del contenuto, documentare la catena di custodia degli oggetti, identificarli in maniera univoca". Nel lavoro di definizione di un primo set standard di metadati amministrativi e gestionali si è tenuto conto delle principali iniziative e dei più significativi progetti realizzati in ambito internazionale. Sulla base di tali esperienze si ritiene di mettere in evidenza quanto segue: • più che per particolari tipologie di documenti fonte (es. periodici, musica a stampa o manoscritta, carte geografiche etc.), il set di metadati di base viene definito per tipologie di oggetti digitali; una prima distinzione può riguardare: o immagini statiche o testi prodotti con tecnologia ocr o suono o immagini in movimento e oggetti multimediali o born digital • i metadati ed il loro sistema di gestione devono essere completamente indipendenti da specifiche piattaforme HW e SW, al fine di favorirne un impiego generalizzato; • devono invece essere coerenti con le funzioni previste nel modello logico-funzionale standard dell'archivio degli oggetti digitali cui si fa riferimento (es. le funzioni di Immissione, Archiviazione, Gestione, Accesso, Amministrazione, Pianificazione della conservazione, nel modello OAIS). Scopo dello Schema è quello di dare delle specifiche formali standard per la fase di raccolta e di archiviazione dei metadati e dei dati digitali. Lo Schema è composto da un elemento wrapper, "metadigit", composto dalle seguenti 4 sezioni: • gen: informazioni generali sul progetto e sul tipo di digitalizzazione • stru: metadati sulla struttura del documento, composto, ad esempio, dal frontespizio, e dal contenuto delle pagine testuali • bib: metadati descrittivi sull'oggetto digitalizzato • img: metadati specifici relativi alle immagini fisse. Per queste si fa riferimento alla norma NISO (National Information Standards Organization) per i metadati sulle immagini statiche • ocr: metadati specifici relativi al riconoscimento ottico del testo • doc: metadati specifici relativi ai documenti testuali In aggiunta alle sezioni di base, la sezione img è stata arricchita di un ulteriore sezione relativa alla parte EXIF, per il trattamento delle informazioni tecniche prodotte da macchine digitali compatibili con questo standard

Le modalità di ricerca Attualmente i motori di ricerca sono sostanzialmente sistemi di ricerca full-text che non tengono conto della struttura del documento, ma ricercano e restituiscono documenti interi grazie all'individuazione delle "meta informazioni", parole chiavi inserite arbitrariamente nel testo codificato in HTML dal produttore della pagina. Nell'ambiente XML, le informazioni veicolate dai tag possono essere utilizzate da un sistema di information retrieval per individuare tutte le volte che una certa stringa compare al loro interno. La piattaforma offre diverse diverse modalità di ricerca sul patrimonio documentario, utilizzando al meglio le tipiche funzionalità di "search and retrieval" offerte dal sistema di indicizzazione che consentono di effettuare ricerche relative al contenuto utilizzando le tecniche di vector space, ricerche per somiglianza, wild-card,

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

11


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

operatori booleani e di prossimità. Sono dunque disponibili: • una ricerca semplificata o libera, in cui inserire i termini indipendentemente dalla loro posizione nei diversi campi della scheda. Attraverso questa modalità, è possibile interrrogare tutti i campi di una specifica bancadati, si può impostare la frase di ricerca riempiendo l'apposito campo, è consentito anche l'uso di wildcards (*,?) e operatori booleani ('e', 'o', 'e non', 'xor'). Su questo tipo di interrogazione è possibile impostare dei filtri per l'ordinamento oppure circoscriverla su selezioni dell'archivio (ad esempio selezionando i soli fondi su cui operare la ricerca) • una ricerca avanzata, che consente la composizione guidata di una query complessa su vari elementi descrittivi, anche utilizzando gli specifici dizionari e indici disponibili. • una ricerca di tipo multiarchivio che consente di operare interrogazioni su dati archivistici di differente provenienza e formato. Attraverso questa modalità, è possibile effettuare una ricerca libera su una serie di banchedati selezionabili dall'utente. Le modalità di impostazione dei criteri di ricerca sono le stesse indicate per la ricerca semplice. Anche in questo caso è possibile impostare dei filtri per l'ordinamento dei risultati

La ricerca avanzata E' possibile infine raffinare la ricerca, effettuando una ulteriore interrogazione ossia di filtrarlo mediante ulteriori parametri, di un termine all'interno degli elementi presenti nell'elenco dei risultati. La frase di ricerca può essere impostata riempiendo gli appositi campi come per la ricerca semplice, in aggiunta cliccando su una specifica icona è possibile accedere alle pagine del dizionario di campo. In ogni campo si possono inserire più termini: per default si assume tra di essi l'operatore booleano 'o'. Si possono riempire più campi: per default interagirà tra di essi l'operatore booleano 'e'. Come nel caso della ricerca semplice, si possono impostare dei filtri per l'ordinamento oppure per circoscrivere la ricerca su parti dell'archivio (ad esempio selezionando i soli fondi su cui operare la ricerca). E' possibile altresì utilizzare dizionari di "authority" che consentano di ricercare un termine (ad esempio un autore) attraverso la digitazione di una forma diversa da quella accettata che verrà individuata attraverso il file di autorità. Attraverso l'utilizzo dei dizionari di campo, è possibile effettuare ricerche mirate, circoscrivendo così l'esito della ricerca. Il dizionario presenta la lista alfabetica di tutte le frasi complete (es. un titolo) indicizzate per un determinato campo, oppure la lista di tutti i singoli termini, ad eccezione delle parole contenute nella stop list (è una lista di parole es. articoli, congiunzioni, preposizioni semplici o articolate che si ritiene non debbano entrare a far parte della frase di ricerca in quanto non rappresentano il contenuto dei dati ed inoltre appesantirebbero il motore di ricerca a causa della loro presenza), indicizzati nel medesimo campo (es. tutte le parole di quel titolo). Ad esempio è indifferente scrivere "Diritto del lavoro" o "Diritto lavoro". Occorre tenere presente che non tutti i campi posseggono la doppia indicizzazione, ossia non per tutti i campi viene indicizzata sia la stringa completa sia i singoli termini che lo compongono. Per ogni chiave presentata, viene inoltre visualizzata la frequenza del termine, cioè il numero di volte in cui tale termine compare in bancadati La consultazione di un dizionario di campo può servire a: • verificare la presenza di un termine o di una frase • controllare la forma con cui un termine o una frase sono stati inseriti • cercare fra i termini o le frasi presenti quelli che possono, con migliore approssimazione, contribuire ad effettuare una ricerca efficace

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

12


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

E' possibile inoltre gestire vocabolari in analisi spettrale, che filtrano il loro contenuto ai termini dei soli documenti appartenenti alla selezione impostata. Ad esempio è possibile presentare il dizionario di campo su un particolare fondo di un archivio

L’integrazione con OAI-PMH Nel quadro delle iniziative nazionali ed internazionali adottate per tutelare e valorizzare il patrimonio culturale italiano, il MIBAC (Ministero per i Beni e le Attività Culturali) ha promosso ed avviato il progetto, finanziato anche dal CIPE, di un 'Portale della Cultura Italiana', finalizzato alla realizzazione di un punto di accesso centralizzato ai contenuti culturali. Il ministero vuole raccogliere nel Portale contenuti di qualità per valorizzare i beni culturali diffusi in tutto il territorio. Il Portale si avvale dei risultati conseguiti dai progetti europei che promuovono l'accesso digitale al patrimonio culturale: primo fra tutti, il progetto MINERVA, che ha creato una rete europea di ministeri della cultura e ha costituito una piattaforma comune per la digitalizzazione dei contenuti culturali, producendo manuali e linee guida per la qualità e l'interoperabilità dei servizi di accesso. Il progetto del 'Portale della Cultura Italiana', affianca ed integra, negli obiettivi finali, il progetto MICHAEL, finanziato dalla Commissione europea nell'ambito del programma e-Ten e promosso da Regno Unito, Francia, Italia (partner coordinatore), che mira a fornire un accesso semplice e veloce alle collezioni digitali europee di musei, biblioteche ed archivi con la creazione di inventari multilingue.

Le caratteristiche del servizio Questa componente implementa il sistema di interoperabilità delle banche dati di un determinato patrimonio storico, fotografico o audiovisivo con il portale della Cultura italiana promosso dal Mbac. Il metodo di alimentazione messo a punto dal portale è rappresentato dall'attività di harvesting dei metadati messi a disposizione da questa piattaforma, attraverso un repository XML accessibile attraverso il protocollo OAIPMH. Lo schema è definito nel 'Documento di sintesi del Portale' e nelle 'Linee guida per lo sviluppo di sistemi informatici interoperabili con CulturaItalia'. In estrema sintesi il modulo di interoperabilità consente di: • esporre su un server di acceso banchedati, l'elenco dei set informativi disponibili; Un set rappresenta un modo in cui raggruppare più metadati, come ad esempio un fondo di un archivio, o un intero archivio • consentire al PmhHarvester di prelevare i metadati descrittivi relativi ad ogni singolo set; • presentare la scheda descrittiva di ogni oggetto presente nei set disponibili, con l'indicazione completa e univoca della fonte di riferimento; • consentire la proiezione dal portale al relativo indirizzo (URI) per accedere alla risorsa digitale in oggetto Il modulo di interoperabilità attraverso il protocollo OAI-PMH si compone delle seguenti componenti: • mapping delle strutture dati utilizzate all'interno del sistema informativo ed il PICO application profile (PICOAP) predisposto dal PmhHarverster, definizione dei set da esporre a livello di OAI-PMH; • definizione e realizzazione delle procedure di trasformazione dei data source di partenza in campi del PICOAP;

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

13


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

NoteinArchivio

mail@regesta.com | www.regesta.com

realizzazione di un componente Adapter, per la trasformazione dei dati dal formato nativo al formato di destinazione in maniera asincrona rispetto all'invocazione dei comandi previsti dal protocollo OAI-PMH; scelta e configurazione del componente OAI-PMH DataProvider tra i software open source già disponibili; integrazione di Adapter e DataProvider; OAI-PMH DataProvider, per il quale è stato scelto tra i software open source già disponibili il prodotto OAICAT

La piattaforma xDams

Descrizione della piattaforma tecnologica

14


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

EXTRAWAY® XML ENGINE La tecnologia XML, formalizzata come standard dal Consorzio W3C, è stata recepita dagli operatori dell'Information Technology al punto tale che non esiste quasi nuovo investimento o sviluppo che non la contempli. La valenza di tale tecnologia permette da un lato di definire nuovi formati di scambio informazioni e comunicazione (ad esempio il WML per i cellulari), dall'altro di rappresentare oggetti in un formato aperto, non proprietario, e quindi fondamentalmente indipendente da un apposito strumento di software di interpretazione proprietario, soggetto alle evoluzioni dell'azienda produttrice e del mercato.

Le caratteristiche del motore Extraway® XML Engine è una tecnologia innovativa che muove dai seguenti obiettivi principali: • tutti gli oggetti gestiti dal motore documentale, indipendentemente dall'interfaccia con cui sono stati prodotti sono fisicamente file o parti di file XML; • il sistema è in grado di catalogare e trattare nel tempo file XML prodotti e aggiornati da altri applicativi; • il sistema è dotato di una libreria di filtri, atti a trasformare file da vari formati nativi al formato XML; Extraway® XML Engine è una piattaforma XML nativa, in grado di memorizzare, indicizzare e rendere disponibili i documenti per la ricerca. I dati non sono conservati in un formato proprietario, ma sono mantenuti nella forma nativa (XML) sul file system. Extraway® consente di gestire direttamente e produrre prioritariamente una 'Information Unit' XML garantendo i seguenti ed importanti benefici: • Intelligibilità nel tempo - comunque possa evolversi il formato XML gli oggetti descritti dalla prima versione in poi saranno sempre decifrabili nella loro struttura, contesto, gerarchia e presentazione. • Efficienza - non è necessario effettuare conversioni in ingresso ed uscita per scambiare informazioni strutturate in XML con altre applicazioni; inoltre la tecnologia ad oggetti supporta l'utilizzo di puntatori e collezioni che consentono di ottenere prestazioni elevate sia in ricerca sia nel controllo dell'accesso concorrente. • Flessibilità - mediante la catalogazione dei modelli di definizione (DTD e Schema) e delle relative versioni, il modello della base dati può evolvere nel tempo senza dover ristrutturare il formato fisico dei dati già inseriti, è possibile cioè generare nuove DTD e Schema senza ritoccare le informazioni già archiviate. • Integrazione con la logica applicativa - La tecnologia a oggetti permette di dichiarare nell'oggetto stesso i metodi con cui essi vengono utilizzati, quindi la logica applicativa risulta definita e associata in modo diretto ai dati che gestisce. Il motore realizza la sua missione esponendo un comando di Salvataggio Record atomico, cioè non frazionabile, automaticamente corredato da metadati sia in codice che in chiaro, relativi all'utente, la data e l'orario, l'organizzazione corrente del produttore, del piano di classificazione, del sistema software e sigillati con un codice di integrità. Il Record è quindi l'unione indivisibile e dimostrabile di dati, file di contenuto e metadati. Ogni cambio di stato viene salvato da un sistema di tracking persistente, che permette la ricostruzione dello stato del record a seguito di ogni azione, dalla creazione fino alla versione corrente. Le operazioni di lettura sono invece memorizzate in file di log la cui persistenza e riversamento su supporti rimovibili può seguire una politica proporzionata al traffico di consultazione, diversa da quella di aggiornamento, mentre gli eventi amministrativi e straordinari (spegnimento,

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

15


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

riavvio, aggiornamento software, comandi di console, aggiornamento della struttura organizzativa e del piano di classificazione) sono memorizzati in un altro file specifico.

Metadati Ogni record è internamente corredato dai seguenti metadati: • Data e ora di creazione • Utente di creazione • Data e ora di ultima modifica • Utente di ultima modifica • Identificativo e versione del motore Extraway® • Identificativo e versione della struttura organizzativa • Identificativo e versione del regolamento di accesso o manuale di gestione • Identificativo e versione del piano di classificazione • Codice di integrità Inoltre con il modulo File Conversion Service, il motore aggiunge i seguenti ulteriori metadati per ogni file di contenuto: • impronta del file • numero di pagine • dimensione • dettagli tecnologici (formato, compressione, risoluzione, durata, testo, sottotitoli, ecc.)

Supporto nativo del linguaggio XML Extraway® memorizza tutti i dati e metadati di ogni record in un'unica porzione indivisibile di un opportuno file XML. L'allocazione del file e la sua posizione in sottodirettori è lasciata ad una politica di gestione scelta dall'amministratore dell'archivio, non dal programmatore. Ogni porzione XML, a parte i casi in cui viene cifrata perché contenenti dati sensibili, è intellegibile a chi possa accedere fisicamente al file, tipicamente l'amministratore del server o i conservatori delle copie di backup. Il motore di Extraway® riconosce la struttura XML del record creando uno specifico indice per ogni diverso percorso dalla radice del record ai suoi elementi ed attributi. Durante il salvataggio del record, Extraway® verifica che sia ben formato e la sua validità rispetto ad un modello dichiarato (DTD o schema).

Funzionalità di ricerca Extraway® è predisposto per supportare le funzionalità necessarie alla ricerca di informazioni, quindi la sua architettura privilegia la ricerca ed il recupero di record sulla base di criteri approssimati e progressivi in presenza di molti accessi concorrenti su grandi archivi. Oltre alle classiche funzioni di Information Retrieval (vector space, ricerche per somiglianza, wild-card, operatori booleani e di prossimità) Extraway® supporta estensione dei termini mediante thesauri, compresenza di termini in un un dato bacino o ancestor XML, nonché la produzione dei termini più significativi di un sottinsieme di record.

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

16


regesta.exe srl via Monte Zebio 19 - 00195 Roma - vox 0637501056 fax 0637410460

mail@regesta.com | www.regesta.com

Vengono inoltre gestiti a livello di motore i comandi più utili dell'interfaccia uomo-macchina: • Creazione di sottoinsiemi temporanei di record • Inclusione ed esclusione manuale di record • Combinazione booleana tra sottoinsiemi (intersezione, unione, differenza) • Definizione di ricerche ricorrenti • Copia e aggiornamento di collezioni di record per consultazione pubblica Con Extraway® vengono garantiti quei requisiti funzionali e tecnologici necessari alla realizzazione dei sistemi documentali, attraverso il rispetto dei principi di conformità alle norme, che a livello nazionale, stabiliscono i requisiti di validità giuridica dei documenti in forma elettronica e le loro modalità di autenticazione. L'accesso alle informazioni memorizzate nelle Information Unit XML di Extraway® può avvenire sia attraverso nuovi linguaggi quali XPath e XQuery (concepiti appositamente per leggere informazioni stratificate), che mediante una interfaccia relazionale ad oggetti familiare alla maggior parte dei programmatori, che avranno a disposizione infatti sia un driver ODBC ed un driver JDBC sia una libreria Java per l'accesso e la manipolazione dei dati e delle informazioni. L'insieme degli strumenti è utilizzabile sulle più diffuse piattaforme server (Solaris, AIX, Linux, Windows NT/2000 ), con thin-client web.

NoteinArchivio

La piattaforma xDams

Descrizione della piattaforma tecnologica

17

note  

descrizione

Read more
Read more
Similar to
Popular now
Just for you