Dati e metadati Presentazione 1.3 Architettura dell'informazione | Prof. Luca A. Ludovico

Preview:

Citation preview

Dati e metadati

Presentazione 1.3

Architettura dell'informazione | Prof. Luca A. Ludovico

Architettura dell'informazione Prof. Luca A. Ludovico

Dati, informazioni e conoscenza

• Quale relazione esiste tra dati, informazione e conoscenza? Diverse teorie. – Relazione gerarchica: dai dati si ricavano le informazioni e da

queste le conoscenzaAlavi Maryam, Leidner Dorothy E.: “Knowledge management and knowledge amanagement systems: conceptual foundations and reserche issues”, Mis Quarterly, 2001, volume 25

– Dalla conoscenza derivano le informazioni che sono state formalizzate e strutturate in questo passaggio, e da queste i datiTuomi Ilkka: “Data is more than knowledge: implications of the reversed knowledge hierarchy for knowledge management and organizational memory”, Journal of management studies, 1999, volume 41, numero 4

– Non c’è un rapporto gerarchico ma una relazione biunivoca: i tre elementi si sovrappongono e non sono di maggiore valore uno rispetto all’altroStenmark Dick: “Information vs knowledge. The role of intranets in knowledge management”, 35th Hawaii international conference on system science, 2002, Hawaii

Architettura dell'informazione Prof. Luca A. Ludovico

Alcune brevi definizioni

• I dati sono fatti oggettivi, immediati. Essi non hanno bisogno di relazioni con altri elementi per esistere, ma presi a se stanti non comunicano nulla.

• I dati, ricavati dall’osservazione o dall’esperienza diretta, diventano informazioni nel momento in cui sono collocati in un contesto, attraverso:– la contestualizzazione;– la categorizzazione;– l'elaborazione;– la correzione; – la sintesi.

• L’informazione implica relazioni e canali, grazie ai quali acquista valore aggiunto rispetto ai dati.

Architettura dell'informazione Prof. Luca A. Ludovico

Esempi di dati / informazioni

• I dati anagrafici: sono dati per definizione.Quando vengono richiesti da un interlocutore, diventano per l’interlocutore stesso informazioni.

Architettura dell'informazione Prof. Luca A. Ludovico

Esempi di dati / informazioni

• Le informazioni stradali: sono informazioni per definizione. I nomi delle vie, la disposizione di incroci e semafori, ecc. di per sé sono dati, si trasformano in informazioni quando se ne fa uso per trovare un percorso

Architettura dell'informazione Prof. Luca A. Ludovico

Conoscenza

• La conoscenza è la consapevolezza e la comprensione di fatti, verità o informazioni ottenuti attraverso l'esperienza o l'apprendimento (a posteriori), ovvero tramite l'introspezione (a priori)– Consapevolezza e comprensione distinguono la conoscenza dal

«nozionismo»

• La conoscenza è l'autocoscienza del possesso di informazioni connesse tra di loro, le quali, prese singolarmente, hanno un valore e un'utilità inferiori

• Esiste una disciplina chiamata Knowledge Management

Architettura dell'informazione Prof. Luca A. Ludovico

I 3 tipi di conoscenza

Conoscenza esplicita, tacita e incorporata

1.Un documentario, un manuale, un corso, sono tutti contenitori di conoscenza esplicita

2. Il «saper fare» qualcosa e l’«intuizione» sono forme di conoscenza tacita

3.Un oggetto di design ha conoscenza incorporata nell'ergonomia piuttosto che nella realizzazione delle funzionalità

Architettura dell'informazione Prof. Luca A. Ludovico

Esercizio

Si analizzi il seguente oggetto e si estrapolino dati, informazioni e conoscenza

Architettura dell'informazione Prof. Luca A. Ludovico

I metadati

• Il prefisso meta- viene usato spesso in campo informatico

• Deriva dal greco antico, ove significa «oltre, dopo»

• Viene usato spesso in ambito informatico– Ad esempio, l’XML è un «meta-linguaggio»

• Un metadato è letteralmente «un dato su un (altro) dato», quindi un'informazione che descrive un insieme di dati

Architettura dell'informazione Prof. Luca A. Ludovico

Esempio

• Scheda del catalogo di una biblioteca

Contiene informazioni circa:– il contenuto del libro (genere, tipologia, …)– le figure con responsabilità sul testo (autore, traduttore,

curatore, …)– l’oggetto fisico (numero di pagine,

formato, …)– il processo editoriale e di stampa

(casa editrice, ristampa, prezzo, …) – l’acquisizione e la posizione

nella biblioteca– …

Architettura dell'informazione Prof. Luca A. Ludovico

Un concetto, molte sfaccettature

• “Structured information that describes and/or allows us to find, manage, control, understand or preserve other information over time”Cunningham, A. (2000). Dynamic descriptions: recent developments in standards for archival description and metadata. Canadian Journal of Information and Library Science, 25(4), 3-17

• “Metadata not only identifies and describes an information object; it also documents how that object behaves, its function and use, its relationship to other information objects, and how it should be managed”Gilliland-Swetland, A.J. (1998). Introduction to Metadata: Setting the Stage

Il contesto e le sfumature di significato

• Per i bibliotecari, l’insieme dei metadati è visto essenzialmente come informazione bibliografica

• Per gli archivisti, i metadati includono informazioni di contesto, restrizioni e termini d’accesso, ecc.

• Per gli informatici, il metadato è qualcosa di estraneo a un bit stream che però aiuta a descriverlo. I metadati spesso sottendono un database (o un’altra forma di struttura dati) associabile a un oggetto digitale

Architettura dell'informazione Prof. Luca A. Ludovico

A caccia di dati e metadati…

Architettura dell'informazione Prof. Luca A. Ludovico

Principali funzioni

Architettura dell'informazione Prof. Luca A. Ludovico

Principali funzioni

• Ricerca, che consiste nell’individuare l’esistenza di un documento;

• Localizzazione, ovvero rintracciare una particolare occorrenza del documento;

• Selezione, realizzabile analizzando, valutando e filtrando una serie di documenti;

• Interoperabilità semantica, che consiste nel permettere la ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra descrittori;

• Gestione risorse, ossia gestire le raccolte di documenti grazie all’intermediazione di banche dati e cataloghi;

• Disponibilità, ovvero ottenere informazioni sull’effettiva disponibilità del documento.

Architettura dell'informazione Prof. Luca A. Ludovico

I METADATI IN AMBITO DIGITALE

Architettura dell'informazione Prof. Luca A. Ludovico

L’informazione digitale

• Esempio del vinile: mondo analogico (oggetto fisico)

• Nel contesto dell’informazione digitale, i metadati sono comunemente intesi come un’amplificazione delle tradizionali pratiche di catalogazione bibliografica in un ambiente elettronico.

• Si limita il concetto di “dato” al dominio semantico dei soli dati digitali e discreti che vengono gestiti da un computer

• Nei progetti di digitalizzazione e nelle attività di gestione degli archivi di oggetti digitali, i metadati rivestono un’importanza crescente, tanto da venire considerati parte costituente della definizione di “oggetto digitale”

Architettura dell'informazione Prof. Luca A. Ludovico

Tipologie di metadati

• Esistono varie classificazioni dei metadati, a seconda delle loro caratteristiche e finalità

• Una delle categorizzazioni più utilizzate distingue tra:– Metadati descrittivi– Metadati amministrativi e gestionali– Metadati strutturali

Architettura dell'informazione Prof. Luca A. Ludovico

Metadati descrittivi

• Servono per l’identificazione ed il recupero degli oggetti digitali

• Sono costituiti da descrizioni dei documenti fonte (ossia i documenti fisici poi digitalizzati) o dei documenti nati in formato digitale

• Risiedono generalmente nelle basi dati dei sistemi di Information Retrieval all’esterno dell’archivio digitale, e sono collegati a quest’ultimo tramite appositi collegamenti

• Esempi notevoli: Handle, Dublin Core, MARC

Architettura dell'informazione Prof. Luca A. Ludovico

Il sistema Handle

• In informatica, per handle si intende un riferimento astratto a una risorsa

• Il sistema Handle (http://www.handle.net) è un insieme di protocolli per assegnare, gestire e risolvere identificatori persistenti per oggetti digitali su Internet

• Il sistema permette a un sistema di elaborazione distribuito di memorizzare gli identificatori (handle) delle risorse digitali, e di risolverli nell’informazione necessaria per localizzare, accedere ed utilizzare tali risorse

• Idea: la disponibilità e la locazione fisica dell’oggetto può cambiare, ma il suo handle rimane fisso (livello di astrazione)

Architettura dell'informazione Prof. Luca A. Ludovico

Dublin Core

• Il Dublin Core Metadata Initiative (DCMI, http://dublincore.org) è un sistema di metadati costituito da un nucleo di elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica

• Il progetto nasce nel 1995 a Dublin (Ohio) per le biblioteche statunitensi, su iniziativa di bibliotecari, archivisti, editori, ricercatori e informatici (tra cui membri dei gruppi di lavoro dell'Internet Engineering Task Force)

• Esigenze: – creare un insieme di strumenti condivisi per l’accesso alle risorse digitali– stabilire un insieme minimo di elementi descrittivi che possano essere forniti

dall’autore o dall’editore dell’oggetto digitale, ed inclusi in esso, o da esso referenziati

Architettura dell'informazione Prof. Luca A. Ludovico

Esempi: il sistema AIR

• Archivio Istituzionale della RicercaUniversità degli Studi di Milanohttp://air.unimi.it/

• Ogni registrazione inserita (pubblicazione scientifica o altro lavoro) può essere ricercata attraverso metadati

• Per citare o collegarsi alla registrazione viene fornito un identificativo «handle»

• E’ possibile visualizzare la registrazione in formato Dublin Core

Architettura dell'informazione Prof. Luca A. Ludovico

Metadati amministrativi e gestionali

• Evidenziano le modalità di archiviazione e manutenzione degli oggetti digitali nel sistema di gestione dell’archivio digitale

• Questi tipi di metadati assumono un’importanza preponderante ai fini della conservazione permanente degli oggetti digitali: essi possono documentare i processi tecnici associati alla conservazione permanente, fornire informazioni sulle condizioni e i diritti di accesso agli oggetti digitali, certificare l’autenticità e l’integrità del contenuto, documentare la catena di custodia degli oggetti, ...

• Esempio: MAG

Architettura dell'informazione Prof. Luca A. Ludovico

Il MAG dell’ICCU

• Metadati Amministrativi Gestionali (MAG) è uno standard per raccogliere metadati relativi a oggetti digitali creati nei progetti di digitalizzazione, ed è conforme agli standard internazionali

• La versione 0 è stata creata nel 2001 dall'ICCU (Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, http://www.iccu.sbn.it). L'ultima versione è la 2.0.1 del 2006

• Manuale ed esempi:http://www.iccu.sbn.it/opencms/opencms/documenti/manuale.html

Architettura dell'informazione Prof. Luca A. Ludovico

Il MAG dell’ICCU

• Lo schema risulta composto di diverse sezioni, utilizzabili a seconda del contenuto digitale e dell'impiego dello stesso:

– GEN: informazioni generali sul progetto e sul tipo di digitalizzazione– BIB: metadati descrittivi dell'oggetto analogico– STRU: metadati strutturali dell'oggetto digitale– IMG: metadati specifici per le immagini fisse– OCR: metadati specifici relativi al riconoscimento ottico del testo– DOC: metadati specifici per oggetti digitali in formato testo che

possono essere derivati o born digital– AUDIO: metadati specifici per file audio– VIDEO: metadati specifici per file video– DIS: metadati specifici per la distribuzione di oggetti digitali

Architettura dell'informazione Prof. Luca A. Ludovico

La collaborazione LIM - ICCU

Architettura dell'informazione Prof. Luca A. Ludovico

Metadati strutturali

• Collegano le varie componenti delle risorse per un’adeguata e completa fruizione, che spesso avviene attraverso la mappatura di schemi di metadati diversi

• Sul web confluiscono risorse eterogenee, in parte destrutturate e prive di metadati, in parte descritte da schemi di metadati differenti tra loro. A seconda del tipo di risorsa che deve essere descritta c’è la possibilità di specificare campi di metadati con caratteristiche complementari che svolgono funzioni diverse a seconda degli oggetti ai quali devono essere applicati.

• Obiettivo: consentire l’interoperabilità anche tra tipi di risorse diverse (testi, audio, video, ecc.) e l’integrazione di vari sistemi informativi

Architettura dell'informazione Prof. Luca A. Ludovico