12
L'Istituto regionale per i beni artistici culturali e naturali (IBC) è nato nel 1974 quale organo tecnico-scientifico e strumento della programmazione di settore della Regione Emilia-Romagna. Da anni IBC rende fruibili attraverso il web le informazioni raccolte nell’ambito della propria attività di censimento e valorizzazione degli istituti e dei beni culturali presenti sul territorio emiliano-romagnolo, facendo del web uno degli strumenti per rappresentare, veicolare, contestualizzare e integrare le descrizioni di beni culturali. Alla diffusione e diversificazione delle modalità di utilizzo del web, si è accompagnato l’utilizzo di standard di varia natura: specifiche norme catalografiche e descrittive, formati di codifica nazionali e internazionali, e standard per l'interoperabilità e la condivisione dei dati, finalizzati alla partecipazione a reti tra sistemi informativi diversi o a cataloghi nazionali e internazionali. A partire dal 2011 con la collaborazione di regesta.exe, IBC ha inteso verificare una nuova modalità di pubblicazione dei dati prodotti nello svolgimento dei propri compiti istituzionali e ha avviato un percorso di sperimentazione sul web of data volto a garantire un’ulteriore forma di trasparenza e visibilità ai dati raccolti e pubblicati in alcuni dei sistemi informativi già esistenti e disponibili nel web tradizionale. Tale evoluzione si basa sulla considerazione sempre più evidente che, seppur elaborati e pubblicati da fonti autorevoli, i dati isolati offrono modalità e contesti di fruizione limitati e producono potenzialmente meno "valore" di quanto potrebbero sviluppare se, pur essendo prodotti e pubblicati in modo autonomo da soggetti diversi, venissero riusati e combinati realizzando informazioni, servizi o modalità di fruizione nuovi o semplicemente diversi (con il termine “valore” si intende far riferimento infatti non soltanto ad un valore economico, ma soprattutto alla produzione di una “utilità diffusa” che si manifesti in termini di accrescimento di informazione, servizi, fruizione e, in senso più generale, di conoscenza). Linked open data, RDF, ontologie e interlinking sono alcune delle componenti tecnologiche su cui si fonda la transizione al web of data, ma non sono sufficienti a realizzarlo. È necessario che chi produce e pubblica dati sul web persegua strategie nuove, utilizzando queste tecnologie non solo come strumento per la produzione di contenuti o come mezzo di rappresentazione delle informazioni all’interno dei singoli sistemi informativi, ma soprattutto come metodo adeguato a qualificare semanticamente i dati e le loro relazioni, e ad aprire i contenuti informativi per il riuso da parte di una comunità vasta e diversificata, al fine di realizzare una vera e propria rete semantica aperta. In questo scenario, biblioteche, archivi e musei possono operare come generatori non solo di linked open data, ma di veri e propri trusted data per il web: hanno a disposizione una grandissima quantità di dati, una tradizionale familiarità con i metadati e con gli standard descrittivi e costituiscono fonte privilegiata di informazione di qualità. Tratto distintivo del percorso compiuto è stata -fin dal principio- una forte compenetrazione tra le più tradizionali competenze di ambito catalografico e descrittivo e le esperienze che si andavano formando col costruirsi del web of data stesso. La forte connotazione semantica di questi nuovi formati, la conseguente necessità dei cosiddetti “esperti di dominio” e le straordinarie potenzialità di rappresentazione e valorizzazione dei dati che il nuovo web offriva, hanno infatti confermato l’esigenza di maturare all’interno del gruppo di lavoro le nuove competenze necessarie,

sperimentazione sul web of data - E-R Istituto per i beni artistici ...online.ibc.regione.emilia-romagna.it/I/libri/pdf/biblioteche... · La forte connotazione semantica di questi

  • Upload
    lamthu

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

L'Istituto regionale per i beni artistici culturali e naturali (IBC) è nato nel 1974 quale

organo tecnico-scientifico e strumento della programmazione di settore della Regione

Emilia-Romagna. Da anni IBC rende fruibili attraverso il web le informazioni raccolte

nell’ambito della propria attività di censimento e valorizzazione degli istituti e dei beni

culturali presenti sul territorio emiliano-romagnolo, facendo del web uno degli

strumenti per rappresentare, veicolare, contestualizzare e integrare le descrizioni

di beni culturali.

Alla diffusione e diversificazione delle modalità di utilizzo del web, si è accompagnato

l’utilizzo di standard di varia natura: specifiche norme catalografiche e descrittive,

formati di codifica nazionali e internazionali, e standard per l'interoperabilità e la

condivisione dei dati, finalizzati alla partecipazione a reti tra sistemi informativi diversi

o a cataloghi nazionali e internazionali.

A partire dal 2011 con la collaborazione di regesta.exe, IBC ha inteso verificare una

nuova modalità di pubblicazione dei dati prodotti nello svolgimento dei propri compiti

istituzionali e ha avviato un percorso di sperimentazione sul web of data volto a

garantire un’ulteriore forma di trasparenza e visibilità ai dati raccolti e pubblicati in alcuni

dei sistemi informativi già esistenti e disponibili nel web tradizionale.

Tale evoluzione si basa sulla considerazione sempre più evidente che, seppur

elaborati e pubblicati da fonti autorevoli, i dati isolati offrono modalità e contesti di

fruizione limitati e producono potenzialmente meno "valore" di quanto potrebbero

sviluppare se, pur essendo prodotti e pubblicati in modo autonomo da soggetti diversi,

venissero riusati e combinati realizzando informazioni, servizi o modalità di fruizione

nuovi o semplicemente diversi (con il termine “valore” si intende far riferimento infatti

non soltanto ad un valore economico, ma soprattutto alla produzione di una “utilità

diffusa” che si manifesti in termini di accrescimento di informazione, servizi, fruizione

e, in senso più generale, di conoscenza).

Linked open data, RDF, ontologie e interlinking sono alcune delle componenti

tecnologiche su cui si fonda la transizione al web of data, ma non sono sufficienti a

realizzarlo. È necessario che chi produce e pubblica dati sul web persegua strategie

nuove, utilizzando queste tecnologie non solo come strumento per la produzione di

contenuti o come mezzo di rappresentazione delle informazioni all’interno dei singoli

sistemi informativi, ma soprattutto come metodo adeguato a qualificare

semanticamente i dati e le loro relazioni, e ad aprire i contenuti informativi per il riuso

da parte di una comunità vasta e diversificata, al fine di realizzare una vera e propria

rete semantica aperta.

In questo scenario, biblioteche, archivi e musei possono operare come generatori

non solo di linked open data, ma di veri e propri trusted data per il web: hanno a

disposizione una grandissima quantità di dati, una tradizionale familiarità con i metadati

e con gli standard descrittivi e costituiscono fonte privilegiata di informazione di qualità.

Tratto distintivo del percorso compiuto è stata -fin dal principio- una forte

compenetrazione tra le più tradizionali competenze di ambito catalografico e descrittivo

e le esperienze che si andavano formando col costruirsi del web of data stesso. La

forte connotazione semantica di questi nuovi formati, la conseguente necessità dei

cosiddetti “esperti di dominio” e le straordinarie potenzialità di rappresentazione e

valorizzazione dei dati che il nuovo web offriva, hanno infatti confermato l’esigenza di

maturare all’interno del gruppo di lavoro le nuove competenze necessarie,

confrontandosi con le tecnologie del web of data per gradi progressivi di

approfondimento e testando metodologie di lavoro diverse e talvolta inedite.

È in questo contesto descrittivo e tecnologico che nel 2011 IBC ha scelto di avviare

la sperimentazione sulla pubblicazione di “LOD archivistici”, estratti cioè dalle basi dati

prodotte attraverso gli interventi di riordino e inventariazione di archivi storici, realizzati

da IBC sul territorio emiliano-romagnolo e pubblicati sul web nel sistema informativo

IBC Archivi (http://archivi.ibc.regione.emilia-romagna.it), ed in particolare

sull’elaborazione di una prima ontologia per i soggetti produttori di archivio (EAC-CPF

Ontology). I soggetti produttori d'archivio si prestavano ad essere scelti come caso di

studio perché presentavano una descrizione abbastanza strutturata e analitica, e

numerose relazioni tra loro e con soggetti e risorse presenti non solo in IBC Archivi, ma

anche in altri sistemi informativi locali, nazionali e di ambiti contermini (bibliografici,

museali, storiografici e culturali in genere).

Da quell’esperienza ha preso avvio il progetto di sperimentazione ReLOAD -

Repository for Linked Open Archival Data (http://labs.regesta.com/progettoReload/)

svolto in collaborazione con l’Archivio Centrale dello Stato e regesta.exe, con l'obiettivo

di applicare le medesime metodologie su altre entità tipiche della descrizione

archivistica: complessi archivistici e soggetti conservatori. Nell’ambito del progetto

ReLOAD è stata pertanto riusata l’ontologia EAC-CPF e sono state elaborate OAD

Ontology per la descrizione archivistica e OCSA - Ontology of Cultural Organizations’

Services and Access realizzata per la descrizione dei servizi offerti ai loro utenti (spazi

e attività per il pubblico, sedi orari e modalità per l’accesso, regolamenti e carte dei

servizi, eventi in corso, recapiti, ecc.). Quest’ultima ontologia è stata formulata con una

particolare attenzione ad un’eventuale riusabilità per la descrizione di altri istituti

culturali (quali musei e biblioteche).

Alla progressiva formulazione di ontologie specifiche è stata affiancata l’estrazione

di file RDF dalle risorse archivistiche (banche dati, inventari, descrizioni di soggetti

produttori e conservatori) prodotte e pubblicate dagli istituti partecipanti al progetto.

ACS e IBC hanno messo a disposizione un subset di dati descrittivi archivistici tratto

da quanto consultabile online dai rispettivi sistemi informativi, al fine di testare la validità

dei modelli ontologici proposti, la capacità rappresentativa di tali strumenti e l’utilizzo di

metodologie comuni di esposizione dei LOD. Elemento chiave nell'impostazione del

lavoro è stata infatti la scelta di un approccio bottom-up, volto a valorizzare una logica

di integrazione dei dati descrittivi già prodotti “in prossimità” dei complessi archivistici

stessi, rispetto ad un'ipotesi di importazione delle medesime informazioni in sistemi e

tracciati onnicomprensivi.

Uno degli scenari più interessanti che il progetto ReLOAD ha consentito di testare è

il delinearsi di una sorta di born interoperability tra le risorse: l’uso di questi standard

nella progettazione e realizzazione di sistemi nazionali di descrizioni di risorse culturali

lascia intravedere la possibilità concreta di cambiare le consuete metodologie di lavoro.

La possibilità di descrivere semanticamente le risorse sulla base di condivise ontologie

di dominio, l’uso di triplestore decentrati con SPARQL endpoint (piuttosto che di sistemi

centrali di raccolta e pubblicazione dei dati), modalità standard di pubblicazione e

visualizzazione dei dati stessi, potrebbero infatti favorire il superamento di alcune delle

criticità che comunemente affrontano i portali di aggregazione di risorse culturali

provenienti da sistemi eterogenei.

Esito naturale è stata l’idea di estendere la sperimentazione ad altre porzioni del

patrimonio informativo raccolto da IBC nello svolgimento delle proprie funzioni, a

cominciare dalle descrizioni di altri istituti culturali, dei loro patrimoni e dei servizi che

offrono ai cittadini, da anni pubblicate nei tradizionali sistemi informativi online di

settore.

Nel corso del 2013 è stata a tal fine avviata una prima sperimentazione sulla

descrizione dei Musei emiliano-romagnoli censiti nel Sistema Museale regionale

(http://bbcc.ibc.regione.emilia-romagna.it), e nel 2014 sulla descrizione del

Biblioteche di ente locale, censite in SIBIB - Sistema informativo Biblioteche di Enti

Locali dell’EmiliaRomagna (http://ibc.regione.emilia-romagna.it/servizi-

online/biblioteche/le-biblioteche-inemilia-romagna). Come IBC Archivi, entrambi questi

sistemi (strutturati e manutenuti in funzione delle attività proprie di IBC e partecipati

dalle istituzioni locali del territorio regionale) erano già dotati di specifiche interfacce per

la pubblicazione sul web e di procedure per l’esposizione dei dati in formati standard

destinati all’interoperabilità applicativa con sistemi locali, nazionali e sovranazionali.

L’attività del 2015 si è concentrata quindi sull’estrazione e la pubblicazione in

“formato” LOD delle descrizioni degli Istituti culturali emiliano-romagnoli attraverso

l’elaborazione dell’ontologia Culturalis (Cultural Institution and Site ontology)

finalizzata a coordinare e connettere le precedenti ontologie e le possibili future, e la

revisione di OCSA, anche in relazione ad un’analoga sperimentazione in corso presso

il Ministero dei beni e delle attività culturali e del turismo sugli istituti e luoghi della

cultura statali.

Nel corso del 2016 sono stati oggetto di rilascio altri dataset culturali estratti dalla

Banca dati degli Alberi monumentali dell’Emilia Romagna, dalla Banca dati dei

Castelli dell’Emilia Romagna e da alcune pubblicazioni edite da IBC: Farfalle d’Italia

e Gli stemmi dei Comuni e delle Province dell'Emilia-Romagna. Per ciascun

sistema informativo di origine è stata realizzata l’analisi dei dati presenti nella banca

dati e delle specifiche ontologie di settore eventualmente riusabili, la produzione di LOD

tramite estrazione di file RDF, la pubblicazione in formato linked open data dei dati

estratti, l’allineamento con altri repository (ad es. dbpedia e geonames) e la

pubblicazione dei dataset nel triplestore accessibile dalla piattaforma regionale

http://dati.emilia-romagna.it/ e interrogabile tramite SPARQL endpoint. Il 7 aprile 2016

in occasione del “Salone dell’economia, della conservazione, delle tecnologie e della

valorizzazione dei beni culturali” di Ferrara, sono stati pubblicati ufficialmente tutti i

dataset prodotti da IBC:

• Biblioteche di ente locale dell’Emilia Romagna (n. 453 risorse)

• Conservatori degli archivi storici di ente locale e di interesse locale emiliano-

romagnoli (n. 410 risorse)

• Musei emiliano-romagnoli (n. 524 risorse)

• Alberi monumentali dell’Emilia Romagna (n. 686 risorse)

• Banca dati delle Farfalle d’Italia

• Catalogo degli stemmi dei Comuni e delle Province dell'Emilia Romagna

• Castelli dell’Emilia Romagna (pubblicazione parziale)

Tutte le URI pubblicate sono stabili e persistenti ed è garantito l’aggiornamento dei

dati e il loro allineamento con i dati pubblicati nei portali tradizionali dei sistemi

informativi di appartenenza (per quanto possibile con una procedura non ancora

interamente automatizzata). In conformità con le indicazioni delle Linee guida nazionali

per la valorizzazione del patrimonio informativo pubblico emanate dall'Agenzia per

l'Italia Digitale (AgID), inoltre, ogni dataset è stato corredato di specifici metadati

descrittivi.

Le ontologie elaborate da IBC nelle diverse fasi di sperimentazione e la

documentazione tecnica di riferimento sono pubblicate in http://www.culturalis.org/. In

conformità con quanto previsto dalle Linee-guida per il riutilizzo e la messa a

disposizione in open data dei dati pubblici dell’Amministrazione regionale, tutti i dataset,

le ontologie e i materiali di lavoro sono pubblicati e disponibili con licenza CC-BY

(Creative Commons Attribuzione 3.0 Italia) e sono accessibili all’indirizzo

http://ibc.regione.emilia-romagna.it/servizi-online/lod.

È stato inoltre elaborato un prototipo per la fruizione dei dati estratti dalle banche

dati informative precedentemente elencate, che consente la fruizione dei LOD tramite

Lodview, un RDF browser opensource che consente di navigare le risorse collegate a

dataset differenti.

La scelta di pubblicare LOD del “dominio cultura” si è dimostrata particolarmente

efficace in relazione alla ricchezza e specificità delle banche dati descrittive e alla

conformità delle descrizioni a standard nazionali e internazionali, e lascia intravedere

esiti interessanti in merito alla scalarità del modello (facilmente incrementabile e

riusabile) e alla naturale interoperabilità dei dati raccolti a livello locale e regionale, con

i livelli nazionali e internazionali.

Attività inizialmente connotate da un forte carattere sperimentale, si stanno pertanto

progressivamente trasformando in una scelta sistematica di pubblicazione in formato

aperto dei dati prodotti o raccolti da IBC, che nei prossimi mesi interverrà

sull’automazione delle procedure di aggiornamento dei dataset già rilasciati e

sull’estrazione e pubblicazione di nuovi dataset dedicati alle opere/oggetti d’arte

conservati in alcuni musei emilianoromagnoli, ai teatri storici e alla flora del territorio

regionale.

La realizzazione delle passate e prossime iniziative sul fronte del web of data mira

garantire non solo una fruizione maggiormente integrata e comparata dei dati raccolti,

ma anche l’accesso e il riuso dei medesimi dati da parte degli enti e delle istituzioni

culturali del territorio emiliano-romagnolo, che hanno contributo a raccoglierli

partecipando ai sistemi regionali, e da parte di cittadini e aziende, in una forma di

sussidiarietà orizzontale estesa, che consegna alla collettività il dato prodotto dalle

amministrazioni pubbliche e con esso la possibilità di realizzare nuovo “valore” sotto

forma di servizi, accessi e forme di valorizzazione inedite.

Per ogni ulteriore informazione e approfondimento

http://ibc.regione.emilia-romagna.it/servizi-online/lod

[email protected]