33
Metadati per la ricerca e la gestione degli oggetti digitali e tipologie di documenti presenti nelle collezioni italiane di architettura e urbanistica : a che punto siamo? Laura ANSELMI VIII giornate CNBA

VIII giornate CNBA

  • Upload
    bambi

  • View
    61

  • Download
    0

Embed Size (px)

DESCRIPTION

Metadati per la ricerca e la gestione degli oggetti digitali e tipologie di documenti presenti nelle collezioni italiane di architettura e urbanistica : a che punto siamo? Laura ANSELMI. VIII giornate CNBA. gestione di archivi digitali :. sostenibilità del progetto - PowerPoint PPT Presentation

Citation preview

Page 1: VIII giornate CNBA

Metadati per la ricerca e la gestione degli oggetti digitali e

tipologie di documenti presenti nelle collezioni italiane di architettura e urbanistica :

a che punto siamo?

Laura ANSELMI

VIII giornate CNBA

Page 2: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

2

gestione di archivi digitali :

sostenibilità del progetto

finanziamento nel tempo

gestione del flusso operativo

formati e tecnologie di archiviazione

metadati

Page 3: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

3

metadati (Metadata)

sono “dati sui dati”

nel contesto documentario

i dati primari sono i documenti

i metadati sono le informazioni relative a tali documenti

Page 4: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

4

…archivi in evoluzione…..

pubblicazione autogestita su siti individuali

archiviazione digitale off-line

sistema di deposito, archiviazione e pubblicazione

centralizzato

‘all archives at your desk’

Page 5: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

5

iniziative di coordinamento degli archivi digitali (digital repositories)

INTERNAZIONALIDOI, DUBLIN CORE, OAI, …

NAZIONALIUSA-METS, IT-MAG, …

PER L’ADOZIONE DI REGOLE COMUNI

METADATIMETADATI

Page 6: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

6

archivi digitali fattori chiave :

interoperatività

ARCHIVI ‘APERTI’ OAI affidabilità

GESTIONE PIANIFICATA OAIS

Page 7: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

7

interoperatività l’adozione di un linguaggio standard di

markup dei metadati consente l’harvesting di oggetti digitali

repository

repositoryrepository

repository

repository

useruser

harvesterharvester

Page 8: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

8

la logica del World-Wide Web

ogni sito è un nodo di una rete mondiale che “espone” le proprie informazioni sotto

forma di pagine web

le pagine web obbediscono a una logica di strutturazione comune

motori di ricerca internet lanciano ricerche contemporanee un grande numero di siti

Page 9: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

9

l’esperanto di Internet

world wide web 1) un protocollo standard di scambio dati :

HTTP HyperText Transfer Protocol

2) un linguaggio standard di redazione : HTML HyperText Markup Language

che contrassegna funzionalmente i dati (tags)

e la loro struttura organizzativa (links)

in modo che le pagine web siano

ricercabili da un motore di ricerca internetpercorribili in modo universalmente condiviso

Page 10: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

10

SGML Standard General Markup Language

include schemi DTD (Document Type Definition)• HTML• …..

XML eXtended Markup Language

più flessibile e personalizzabile (+ XSL + XLL)

include gli RDF (Resource Description Framework),

schemi ‘oggetto’ per la strutturazione di

sequenze complesse di metadati

mark-up = marcatura del dato con <metatag> (etichetta standard testuale che definisce il senso o funzione del dato)

linguaggi di mark-up

Page 11: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

11

… ad esempio…

home page del sito CNBAhttp://www.cnba.it

Page 12: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

12

metadati : una possibile definizione nell’ambito degli archivi digitali

– una sequenza strutturata di metadati identificativi, descrittivi, gestionali

– riguardanti documenti in formato digitale

– espressi in un linguaggio che ne consente lo scambio con tecnologie xml (spesso in ambiente www), neutrale rispetto ai vari sistemi operativi e ai programmi locali di gestione e accesso ai dati (ad es. OPAC)

Page 13: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

13

… ad esempio…

sequenza di metadati descrittivi Dublin Core Metadata Initiative

home page CNBA interpretata da un motore di ricerca DCMI

b

a

Page 14: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

14

DCDC Dublin Core Metadata Initiative

Inizialmente sviluppato

per catalogare risorse www esterne

unqualifiedunqualified

qualifiedqualified

identifier …segue…

title subject

creator description

contributor coverage

publisher language

date relation

type source

format rights

Page 15: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

15

metadati

identificativi DOI

del documento e sua localizzazione

descrittivi DC

sul suo contenuto e responsabilità

gestionali MAG

tecnici (tipo, formato, struttura)

amministrativi (diritti, procedure)

Page 16: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

16

per localizzare qualche sigla….

identifica DOIDOI Digital Object Identifier

HANDLE, PURL, ….

OAIOAI(US DLF)

descrive Dublin Core Dublin Core (DCMI)…….

Open Archive Initiative

METSMETS

Metadata Encoding &

gestione

tecn/ammMAG MAG (ICCU)

PMF (RLG)…….

…….

OAISOAISOpen Archive Information System

Transmission Standard

Page 17: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

17

interoperatività

il motore harvester funziona davvero solo se i vari archivi produttori costituiscono nello stessostesso modo gli stessistessi metadati

O A IO A I Open Archive Initiative

Page 18: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

18

gradi di interoperabilità l’interoperabilità fra le collezioni dipende da

quanto risultano standardizzati questi tre livelli ’linguistici’:

il linguaggioil linguaggio (xml/rdf) il protocolloil protocollo (sequenza standard di <metatag>

identificativi, descrittivi, gestionali)

il contenutoil contenuto ( (le le regole di redazioneregole di redazione del contenuto associato a ciascun metatag)

Page 19: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

19

OAI – Open Archive Initiative Harvesting Protocol

header

oai

identificativo univoco del documento

date e status, collezione, sito produttore

metadata

oai

DUBLIN CORE 6 unqualified:

metadata …..

altre sequenze di metadati supplementari decise dal sito produttore

indirizzo permanente della descrizione

title

description

creator

subjecttype

identifier

Page 20: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

20

limiti dell’interoperabilità

limiti della standardizzazioneflessibilità del linguaggio XMLflessibilità del protocollo OAIvariabilità del contenuto (lingua, regole)

contesto funzionale di ciascun archiviocaratteristiche dei documentifinalità dell’archiviocaratteristiche dell’utenza di riferimento

Page 21: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

21

soluzione raccomandata : ridurre al minimo le personalizzazioni

stabilire regole condivise nel settore disciplinare cui ciascun repository partner contribuisce

mantenere in ogni caso una precisa documentazione accessibile via web cui indirizzare i motori di ricerca per chiarire il significato dei metadati utilizzati.

Page 22: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

22

documenti digitali: architettura-urbanistica-design libri e riviste tesi multiformato progetti (prodotto e processo) piani (norma e processo) fondi documentari (corrispondenza,

relazioni, foto, tavole, modelli 3D, posters, files CAD, videi, …)

lezioni, conferenze: registrazioni AV cartografia ……

Page 23: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

23

OAI - Harvesting Protocolheader

oai

identificativo univoco del documento,

date, status, collezione, sito produttore

metadata

oai

DUBLIN CORE 6 unqualified:

metadata

…..

??

EAD (SAA)– Encoded Archival Description

TEI - Text Encoding Initiative

CMI (RLG) Cultural Materials Initiative

CDWA Categories of Description for Works of Arts

VRA Core (Visual Resources Association

FMM (CEN) Framework for Metadata for Multimedia………….

title creator identifiertype subject description

Page 24: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

24

criteri di selezione… compatibile con il linguaggio XML compatibile con il protocollo OAI ente sviluppatore molto autorevole già ampiamente adottato

(a livello nazionale / internazionale?) ben documentato e sempre aggiornato applicabile senza modifiche locali conforme alle necessità della disciplina

Page 25: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

25

affidabilitàdell’archivio

gestione documentata

conforme agli standard tecnici

Page 26: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

26

affidabilità tracciabilità e certificazione

dei processi:

deposito controllato

digitalizzazione ottimale

preservazione dalle alterazioni

conservazione pianificata

gestione dei diritti

Page 27: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

27

OAIS Open Archive Information System

IMMISSIONEIMMISSIONEInformation package

identificazione descrizione, diritti

ARCHIVIAZIONEARCHIVIAZIONEInformation package

struttura, legami dati tecnici sul file

gestione dati amministrazione

Information package

gestione dei dati gest. dei processi

CONSERVAZIONECONSERVAZIONEInformation package piano di migrazione

ACCESSOACCESSOInformation package

descrizione, diritti modalità di fruizione

Page 28: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

28

metadati gestionali e amministrativi

gen dati generali sulla collezione di cui il documento fa parte e sull’ istituzione responsabile

bib

se il documento è parte componente

stru se il documento ha una sottostruttura

dati tecnici sulla singola immagine

o pagina testo ottenuto da OCRimg ocr

fis

title creatoridentifier publisherDC

MAGMAG

Page 29: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

29

documenti in formato digitaleoggetti digitali

ottenuti da originali non digitali? (pagine testo, tavole, foto, registrazioni audiovideo)

generati da un programma computer?

(‘born digital’)

archiviati off-line o accessibili on-line?

accessibili via Internet?

archiviati in più formati?

diritti di accesso diversi per i diversi formati?

solo leggibili o anche editabili? interattivi?

in un formato a rapida obsolescenza o no?

Page 30: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

30

MAGMAG

lo sviluppo di uno standard nazionale di gestione e conservazione è essenziale;

per la documentazione di architettura risulta necessario contribuire al suo arricchimento:

nuove sezioni per altri tipi di oggetti digitali‘Born digital’ anche complessi (es. CAD)

riversamenti da registrazioni AV

definibilità articolata dei diritti

Page 31: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

31

…a che punto siamo? i documenti digitali vanno documentati in

modo standard e gestiti sistematicamente la costituzione di protocolli standard di

metadati è il primo passo verso il sistema abbiamo un protocollo internazionale per

l’harvesting (OAI) identificaz+descrizione e un protocollo nazionale di gestione

(MAG) dati tecnici e amministrativi

Page 32: VIII giornate CNBA

Laura ANSELMI - VIII Giornate CNBA

32

…. mancano ancora…

metadati descrittivi standard per creare chiavi di ricerca specifiche per l’architettura nel protocollo OAI

un arricchimento del protocollo MAG per le tipologie non ancora trattate e per una più precisa definizione dei diritti (accesso e riproduzione)

Page 33: VIII giornate CNBA

33Laura ANSELMI - VIII Giornate CNBA

… e naturalmente manca ancora…

un quadro di coordinamento

disciplinare e operativo

fra i vari progetti italiani