Sidnummer
<metadata>
Bibliografiskt stormöte Tema digitalisering
KB, Hörsalen 17 dec 2013
Sidnummer
Ska prata om…
• Vad är metadata, vilka metadatatyper pratar vi om, samt är det viktigt att dela in metadata i olika kategorier?
• Metadatastandarder – snabb genomgång av de för oss mest relevanta
• Något kort om digitalt bevarande
2013-12-17
Sidnummer
Metadata är…
• ”Data om data”
• Förenklar och effektiviserar uppföljning, tolkning, sökning och sortering av information
• Används av maskiner, måste därför kunna läsas av maskiner
2013-12-17
Sidnummer
Strukturerad och väl definierad
• Strukturerad form (t.ex. xml) enligt ett väl definierat schema,
• med semantiska enheter (”data elements”) med definierade betydelser.
• Får extra stöd av ordlistor, auktoriserad data, etc.
• Internationella standarder att föredra
• (Regler – t.ex. RDA)
<titleInfo> <title>DAGENS NYHETER 1869-04-29</title> </titleInfo> <genre authority="marcgt">issue</genre> <language> <languageTerm authority="iso639-2b" type="code">swe</languageTerm> </language>
2013-12-17
Sidnummer
”Metadata universe”
Creative Commons Attribution-Noncommercial-Share Alike 3.0 United States License http://www.dlib.indiana.edu/~jenlrile/metadatamap/
Domain (Domän) - scholarly texts, moving images, geospatial data… Community – archives, libraries, museums… Function (Funktion) – record format, markup language, controlled vocabulary… Purpose (Ändamål) – descriptive, metadata wrappers, preservation, provenance…
2013-12-17
Sidnummer
Indela metadata i kategorier
• Deskriptiva/Beskrivande (descriptive) metadata - används för att hitta, identifiera och förstå en resurs
• Administrativa (administrative) metadata - används för att hantera skapandet, användningen och bevarandet av resursen (omfattar tekniska metadata och bevarandemetadata)
• Strukturella (structural) metadata - används för att registrera och underlätta relationerna mellan eller inom digitala resurser
• Användargenererade (use) metadata - metadata som samlas in från (eller handlar om) användarna själva (t.ex. användarnas anteckningar, antalet sökningar på en viss resurs)
Översättning från JISC Digital Media Guide http://www.jiscdigitalmedia.ac.uk/guide/an-introduction-to-metadata
2013-12-17
Sidnummer
Bibliografiska metadata
• Synonymt med deskriptiva metadata men med en mer specifik betydelse
• Kontext: bibliotek, förlag, vetenskaplig utgivning, etc.
• Bibliografisk information som förekommer i kataloger, bibliografier, bibliografiska referenser, etc.
2013-12-17
Sidnummer
”Metadata som metadata… eller?”
• Fyller dessa indelningar i olika kategorier av metadata egentligen någon funktion?
• Praktiskt vid planering av nya verksamheter (vilka särskilda metadatakategorier måste man inkludera som stöd för dessa verksamheter?)
• Vanlig distinktion är den mellan deskriptiva och administrativa metadata – metadata som riktar sig till slutanvändarna (offentligt) – metadata som i första hand är för internt bruk och för förvaltning av
samlingarna (dolt).
• Gränserna inte knivskarpa.
• Viktigare se metadata som ”informationsbitar” som kan användas av olika system och för olika syften
2013-12-17
Sidnummer
Exempel: Filformat
– <dc:format>text/html</dc:format>
– <premis:formatName>Hypertext Markup
Language</premis:formatName>
– <premis:formatVersion>4.01</premis:formatVersion>
– <premis:formatKey>fmt/100</premis:formatKey>
– <premis:formatRegister>pronom</premis:formatRegister>
• Metadata om filformat anses nog i första hand som teknisk
• Är också en viktig del av bevarandemetadata.
• Kan ofta vara viktig för beskrivning (förståelse) av resursen
• I grunden samma information men kan med automatik visas på olika sätt i olika sammanhang och i olika system
2013-12-17
Sidnummer
Metadatastandarder
Deskriptiva (Bibliografiska)
• Exempel DC
DC/dcterms – Dublin Core Beskrivning av digitala objekt (i så bred mening som möjligt). http://dublincore.org
MODS – Metadata Object Description. Rikt språk – mappning till MARC http://www.loc.gov/standards/mods/
MARCXML – MARC 21 in XML http://www.loc.gov/standards/marcxml
2013-12-17
Sidnummer
Metadatastandarder
Arkiv
• Ur ett exempel i EAD (Ediffah)
EAD - Encoded Archival Description. Arkivbeskrivningar. http://www.loc.gov/ead/
EAC-CPF - Encoded Archival Context – Corporate bodies, Persons, and Families. Om arkivbildaren. http://eac.staatsbibliothek-berlin.de/
2013-12-17
Sidnummer
Metadatastandarder
Bild och konstföremål
CDWA – Categories for the Description of Works of Art. http://www.getty.edu/research/publications/electronic_public
ations/cdwa
VRA CORE – a data standard for the description of images and works of art and culture http://www.loc.gov/standards/vracore/
Baselitz Skulptur „Armalamor” in der Deutschen Bibliothek in Frankfurt (Foto: stideg)
2013-12-17
Sidnummer
Metadatastandarder
”Tekniska”
• om de digitala objekten, exempel MIX
TextMD – Technical Metadata for Text http://www.loc.gov/standards/textMD/
MIX – Metadata for Images in XML http://www.loc.gov/standards/mix/
AES-X098B och AES-X098C. För audio/video (kommer) Audio Engineering Society http://www.aes.org/
audioMD och videoMD http://www.loc.gov/standards/amdvmd/
Grundläggande teknisk info även i:
METS och PREMIS
2013-12-17
Sidnummer
Metadatastandarder
Digitalt bevarande
• Exempel premis:event
PREMIS – Preservation Metadata: Implementation Strategies. Information för att underlätta digitalt bevarande. http://www.loc.gov/standards/premis/
2013-12-17
Sidnummer
Metadatastandarder
Analys, uppmärkning
• Beskriver layout och innehåll, skapar nytt innehåll. Exempel ALTO (3 rader ur digitaliserad tidningssida)
ALTO – Analyzed Layout and Text Object Exempel dagstidningar http://www.loc.gov/standards/alto/
TEI – Text Encoding Initiative Exempel handskrifter http://www.tei-c.org/
Daisy - Digitalt Anpassat InformationsSYstem (Digital Accessible Information SYstem) Uppmärkt text synkroniserad med ljudfiler www.daisy.org/
2013-12-17
Sidnummer
Metadatastandarder
Paketera information
METS - Metadata Encoding and Transmission Standard. Används för paketering av alla typer metadata och digitala objekt. http://www.loc.gov/standards/mets/
Didl - Digital Item Declaration Language. Används framför allt till paketering av filer av typen MPEG-2. http://xml.coverpages.org/mpeg21-didl.html
XFDU - XML Formatted Data Unit. Liknar METS. Från NASA. http://sindbad.gsfc.nasa.gov/xfdu/index.html
2013-12-17
Sidnummer
Metadatastandarder
”Att synas på webben”
• Webbsida från BNF. HTML-koden innehåller metadata från schema.org
RSS – Really Simple Syndication Abonnemang på nyhetsflöden. Innehåller ofta DC http://www.rssboard.org/rss-specification
schema.org - samarbete mellan Bing, Google, Yahoo! och Yandex ”to create and support a common set of schemas for structured data markup on web pages”, “to improve the display of search results” http://schema.org
http://data.bnf.fr/11907966/victor_hugo/
2013-12-17
Sidnummer
Digitalt bevarande
• Metadata är en viktig del av det digitala bevarandet.
• Planering av metadata behöver komma in tidigt i digitaliserings-processen.
Säkra åtkomsten till KBs digitala samlingar nu, och i framtiden. Bevara för att tillgängliggöra!
Syftar till: Att säkra det digitala materialets fortlevnad, samt att kunna verifiera materialets autenticitet.
Omvärldsbevakning
Åtkomst
Säkerhet
Filformat
Migrering - Emulering
Metadata
Lagringsprognoser
2013-12-17
Recommended