11
15. Digitális dokumentumok feltárásakor használt szabványok, megoldások MARC FORMÁTUM A MARC (MAchine Readable Cataloguing/Communicatio) a géppel olvasható katalogizálás/kommunikáció kifejezésből származik. A bibliográfiai adatok géppel olvasható formájú ábrázolására, a gépi adathordozón való csereformátumának meghatározására szolgál. Kialakulását a számítógépek könyvtárakban való elterjedése hozta magával. Annak érdekében, hogy a számítógép az adatokat kezelni tudja, szükségessé vált a bibliográfiai adatok egységes leírása, azonosítása és szerkesztése, azaz az adatokhoz szabványos kódok rendelése. A bibliográfiai adatközlésnek különböző formátumai vannak. 1.1. A formátum A bibliográfiai adatközlés formátuma megnevezéseket, definíciókat, paramétereket (megengedett illetve előírt értékeket) tartalmazó szabályrendszer, amely lehetővé teszi, hogy a számítógép szoftverje felismerje a bevitt, a feldolgozandó, a tárolandó és a megjelenítendő adatokat. Ebből következően a formátum lehet: adatbeviteli , feldolgozási , megjelenítési, csereformátum . Adatbeviteli (input) formátum: az adatokat már bevitelükkor is a szoftver által felismerhető formában kell rögzíteni. A formátum olyan szabályokat is tartalmaz, amelyek valójában a közlendő adatok körére és közlésük módjára vonatkoznak, tehát katalogizálási előírások. Az adatbeviteli formátum igazodik a rendszer céljához, a feldolgozási formátumhoz. Az alkalmazói szoftver általában többféle adatbeviteli formátum alkalmazását is lehetővé teszi. Feldolgozási (belső) formátum: a gép által tárolt és kezelt adatok körének meghatározására, egyértelmű megjelölésére, kezelésük módjának rögzítésére szolgál. A felhasználónak különböző mértékű lehetőségei és egyben kötelezettségei vannak a feldolgozási formátum kialakításában. Megjelenítési formátum: a tárolt adatok közül a megjelenítendő adatok körét, sorrendjét, elhelyezését, központozását, jeleit, vagyis a képernyőn láthatóvá tett, illetve kinyomtatható rekordok képét határozza meg. Egy-egy adatbázishoz többféle megjelenítési formátum tartozhat. 1

15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

Embed Size (px)

Citation preview

Page 1: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

15. Digitális dokumentumok feltárásakor használt szabványok, megoldások

MARC FORMÁTUMA MARC (MAchine Readable Cataloguing/Communicatio) a géppel olvasható katalogizálás/kommunikáció kifejezésből származik. A bibliográfiai adatok géppel olvasható formájú ábrázolására, a gépi adathordozón való csereformátumának meghatározására szolgál. Kialakulását a számítógépek könyvtárakban való elterjedése hozta magával. Annak érdekében, hogy a számítógép az adatokat kezelni tudja, szükségessé vált a bibliográfiai adatok egységes leírása, azonosítása és szerkesztése, azaz az adatokhoz szabványos kódok rendelése. A bibliográfiai adatközlésnek különböző formátumai vannak. 1.1. A formátumA bibliográfiai adatközlés formátuma megnevezéseket, definíciókat, paramétereket (megengedett illetve előírt értékeket) tartalmazó szabályrendszer, amely lehetővé teszi, hogy a számítógép szoftverje felismerje a bevitt, a feldolgozandó, a tárolandó és a megjelenítendő adatokat. Ebből következően a formátum lehet: adatbeviteli, feldolgozási, megjelenítési, csereformátum. Adatbeviteli (input) formátum: az adatokat már bevitelükkor is a szoftver által felismerhető formában kell rögzíteni. A formátum olyan szabályokat is tartalmaz, amelyek valójában a közlendő adatok körére és közlésük módjára vonatkoznak, tehát katalogizálási előírások. Az adatbeviteli formátum igazodik a rendszer céljához, a feldolgozási formátumhoz. Az alkalmazói szoftver általában többféle adatbeviteli formátum alkalmazását is lehetővé teszi.Feldolgozási (belső) formátum: a gép által tárolt és kezelt adatok körének meghatározására, egyértelmű megjelölésére, kezelésük módjának rögzítésére szolgál. A felhasználónak különböző mértékű lehetőségei és egyben kötelezettségei vannak a feldolgozási formátum kialakításában.Megjelenítési formátum: a tárolt adatok közül a megjelenítendő adatok körét, sorrendjét, elhelyezését, központozását, jeleit, vagyis a képernyőn láthatóvá tett, illetve kinyomtatható rekordok képét határozza meg. Egy-egy adatbázishoz többféle megjelenítési formátum tartozhat.Csereformátum: a megjelenítési formátumhoz hasonlóan kommunikációs formátum, ahol a kommunikáció géppel olvasható formában történik, és ezek címzettjei más, számítógépes könyvtári rendszerek.

A HUNMARC FORMÁTUMA HUNMARC mint a bibliográfiai rekordok adatcsere formátuma a nemzeti MARC formátumok rendszeréhez csatlakozik.A rekordok szerkezete a szabvány (MSZ ISO 2709:1997) által megadott keretekben, a hazai bibliográfiai adatcsere szabályozása érdekében határozza meg a bibliográfiai adatok tartalomjelölőit (a bibliográfiai tételekben szereplő kötelező központozást is helyettesítő minősítők: hívójelek, indikátorok, almezőazonosítók) és egyéb jellemzőit. A mágneses adathordozón megvalósuló adatcserében résztvevő adatok közlésmódjára a vonatkozó MSZ könyvtári szabványok előírásai az irányadók. A HUNMARC formátum három elemből áll, ezek mindegyike szabványosított vagy szabványosítást igényel: rekordszerkezet, tartalomjelölők, adattartalom. A rekordszerkezet: a géppel olvasható rekordok fizikai megjelenítése. A bibliográfiai adatokat tartalmazó rekordok szerkezetét a már hivatkozott MSZ ISO 2709:1997-es szabvány határozza meg. Eszerint minden cserére szánt rekordnak tartalmaznia kell a rekordfejet

1

Page 2: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

(record label), amely a rekord szerkezetével kapcsolatos; a mutatót, amelynek egy-egy tétele három részből áll (a mező hívójele, a mezőben található karakterek száma, a mező első karakterének a rekordon belüli pozíciója); a változó hosszúságú adatmezőket. Az adatmezők indikátorokat, almezőazonosítókat és adatelemeket tartalmaznak.A tartalomjelölők meghatározzák a hívójeleket, az indikátorokat, az almezőazonosítókat, illetve ezek értékeit, amelyek az adatelemeket azonosítják. A jegyzet alapvetően e tartalomjelölőket veszi sorra a HUNMARC kézikönyv 2002-es kiadása alapján, csak a könyvdokumentumokra vonatkozóan. Az adattartalom tekintetében az MSZ szabványok, szabályzatok, útmutatók a meghatározók (a bibliográfiai leírás szabványa, a besorolási adatok egységesítésére vonatkozó szabványok, az országnevek, nyelvek kódjai, ETO stb.)

A DUBLIN COREA Dublin Core Metadata Initiative (DCMI = Dublin Core Metaadat Kezdeményezés) Igazgatósága az OCLC Kutatási és Speciális Projekt Irodája keretében működik, amely a szabályzat gondozásáért felelős. (URL: http://dublincore.org/). A szabvány előszava leírja annak eredetét, amely 1995-re nyúlik vissza, amikor is könyvtárosok, elektronikus források szakértői, tartalom-szolgáltatók gyűltek össze, hogy megállapodjanak egy könnyen érthető és alkalmazható forrás-leíró szabályzatban bármely tudományág területén. A Dublin Core-nak (a továbbiakban: DC) egyszerre vannak erősségei és gyenge pontjai. A metaadatok létrehozásának egyszerűsége csökkenti a költségeket és elősegíti az együttműködést, de nem jelent megoldást minden jelentésbeli és funkcionális követelmény kielégítésére. Ugyanakkor mindezekkel kiegészíthető és összeegyeztethető, azaz kiinduló alapként szolgál a teljesebb körű leírások elkészítéséhez. A metaadat elemek beilleszthetők a MARC formátumú rekordokba. A DC HTML-ben és XML-ben egyaránt címkézhető 15 adatelemet tartalmaz. Az elemek mindegyike szabadon válaszható és ismételhető, sorrendjük nem meghatározott, de az általános érthetőség céljából kötött szókészlet alkalmazása szükséges. Az elemek jelentését minősítőkkel lehet finomítani.A Dublin Core legfontosabb jellemzői:

egyszerű – a leíró rekordokat könnyű létrehozni és karbantartani érthető – az egyes elemek jelentése nem szorul magyarázatra bővíthető – együtt használható más készletek metaadat-elemeivel nemzetközi

A 15 adatelem a következő:1. Cím (Title) A dokumentumban szereplő szó, kifejezés vagy egyéb jelcsoport, amely a dokumentum megnevezésére szolgál. Kitüntetett szerepe van a főcímnek, illetve az egységesített címnek, amelyek nem ismételhetők. Valamennyi további cím ismételhető (pl. alcím, párhuzamos cím, címváltozat). Kötelező, ismételhető adatelem.2. Téma (Subject) A dokumentum tartalmát leíró tárgyszavak, illetve kifejezések vagy osztá-lyozási jelzetek. A dokumentum tartalmát leíró kulcsszavak, kifejezések vagy osztályozási jelzetek. Ajánlatos előírt tárgyszójegyzék (tezaurusz) vagy hivatalos (szabványos) osztályozási rendszer (pl. az ETO) használata. Kötelező, ismételhető adatelem.3. Kiadó (Publisher) Az a természetes vagy jogi személy, vagy jogi személyiséggel nem rendelkező gazdasági társaság, aki/amely anyagi és/vagy irányítási, igazgatási felelősséget vállal a dokumentum nyilvánossághoz közvetítéséért. A dokumentum kiadójának a neve. Kötelező, ismételhető adatelem.4. Dátum (Date) A dokumentumhoz kapcsolódó események dátuma. A dokumentum létre-hozásával, nyilvánossághoz közvetítésével kapcsolatos időpont. Megadása az ISO 8601 előírásai szerint ajánlatos. Kötelező, ismételhető adatelem.

2

Page 3: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

5. Típus (Type) A dokumentum típusát, műfaját, általánosabb sajátosságait jelölő kifejezés. Általános kifejezés, amely a funkciót, dokumentumtípust, a gyűjteményes forráson belüli szintet nevezi meg. A dokumentum fizikai (digitális) megjelenítésének megnevezését a „For-mátum” adatelemben kell megadni. Ajánlatos egységes kifejezések (kódszótár) használata. Kötelező, ismételhető adatelem.6. Formátum (Format) A dokumentum megjelenésének formája és megjelenítésének módja, eszköze. A dokumentum megjelenésének (manifesztációjának) megnevezése. Ide tartozik: a médium, adathordozó fajtája és terjedelme (mérete), a hozzáférés módja, a működési követel-mények (szoftver, hardver vagy egyéb, a dokumentum használatához szükséges eszközök, az elérés lejárati ideje). Ajánlatos egységes kifejezések (kódszótár) használata. Kötelező, ismételhető adatelem.7. Azonosító (Identifier) A dokumentumot egyértelműen azonosító kód. Ajánlatos a doku-mentum azonosítása hivatalosan elismert kóddal, amilyen többek között az Egységes Forrás Azonosító (URI=Uniform Resource Identifier), a Digitális Objektum Azonosító (DOI=Digital Object Identifier), a Könyvek Nemzetközi Szabványos Azonosító Száma (ISBN=International Standard Book Number). Ezek hiányában egyéb azonosító(ka)t (pl. leltári szám, raktári jelzet és egyéb nyilvántartási szám/jelzet) kell megadni. Kötelező, ismételhető adatelem.8. Létrehozó (Creator) Az a természetes vagy jogi személy vagy jogi személyiséggel nem ren-delkező gazdasági társaság, aki/amely a dokumentum vagy annak fő része szellemi tartalmának alkotója, aki/amely e tartalomért elsősorban felelős. A szellemi (szakmai, tudományos, irodalmi, művészi stb.) tartalom létrehozójának a neve. Feltételesen kötelező, ismételhető adatelem.9. Forrás (Source) Hivatkozás a leírt dokumentum forrásául szolgáló dokumentumra. A leírt dokumentum részben vagy egészben származhat egy másik dokumentumból. A hivatkozásban ajánlatos megadni a forrás hivatalos azonosítóját. Feltételesen kötelező, ismételhető adatelem.10. Nyelv (Language) A dokumentumban előforduló szövegek nyelve. A nyelvkód az ISO 639 háromjegyű azonosító kódja. Megfelelője magyarországi használatra az MSZ 3400-2001. Feltételesen kötelező, ismételhető adatelem.11. Jogok (Rights) Adatok a dokumentum felhasználásával kapcsolatos jogokról és a hungarikum fajtájáról (területi, személyi, nyelvi, tartalmi). Jogkezelésre vonatkozó adatok, amelyek kiterjedhetnek a szellemi, szerzői és különböző tulajdonosi jogokra. Ha a jogtulaj-donos(ok)ra való adatelem hiányzik, feltehetően a forrásra nem vonatkozik ilyen adat. A hungarikum minősítést kóddal kell jelölni. Feltételesen kötelező, ismételhető adatelem.12. Tartalmi leírás (Description) A dokumentum tartalmának összegző leírása. Szabad szöveges összefoglalás, kivonat, tartalomjegyzék. Megengedett, ismételhető adatelem.13. Közreműködő (Contributor) Az a természetes vagy jogi személy, vagy jogi személyi-séggel nem rendelkező gazdasági társaság, aki/amely a dokumentum szellemi tartalmának alkotásában részt vesz, és a létrehozóhoz képest alárendelt, illetve járulékos szerepet tölt be, illetve aki/amely a dokumentum valamely járulékos részének létrehozója. A szellemi (szak-mai, tudományos, irodalmi, művészi stb.) tartalom létrejöttéhez hozzájáruló(k) neve. Meg-engedett, ismételhető adatelem.14. Kapcsolat (Relation) Hivatkozás a dokumentummal kapcsolatos másik dokumentumra. A hivatkozásban ajánlatos megadni a kapcsolódó dokumentum hivatalos azonosítóját. Megengedett, ismételhető adatelem.15. Tér-idő vonatkozás (Coverage) A dokumentum tartalmának térbeli vagy időbeli vonat-kozásai. Földrajzi (térbeli) nevek vagy időbeli adatok (időhatárok), amelyekre a dokumentum vonatkozik (amelyeket magába foglal). Ajánlatos földrajzi nevek tezauruszának használata, illetve az időhatárok megadása számokkal kifejezve. Megengedett, ismételhető adatelem.1

1 Dávid Adrienne: A digitális dokumentum szerepe az információs társadalomban . (Szakdolgozat) < http://mek.oszk.hu/05600/05675/> [Letöltve: 2009. június 4.]

3

Page 4: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

A MEK DUBLIN CORE GENERÁTORA 2

Az alábbi űrlap kitöltésével Dublin Core metaadatokat készíthetünk a digitális dokumentumainkhoz, majd bemásolhatjuk őket a HTML fájlok fejlécébe, vagy elmenthetjük XML formátumban a dokumentum mellé. A DC metaadatokat egyre több keresőrendszerben használják, Magyarországon például a Nemzeti Digitális Adattárban és a szintén OAI-alapon működő NDA@SZTAKI keresőben. Ezt a generátort a Magyar Elektronikus Könyvtárért Egyesület készíttette és egyelőre csak a Dublin Core alapját jelentő 15-féle adatelem leírását teszi lehetővé.

Innentől szerintem annyira nem fontos, max megemlíteni, h ezek is vannakAz 1997 nyarán megalakuló Metadata Working Group javaslatot tett a DC definíciók módosítására, és irányelveket készített, hogy használatukat hogyan lehet kiterjeszteni a különféle információtípusokra. E műhelymunkák eredménye a Warwick Framework. Ez nem más, mint egy eszköz a különböző típusú metaadatok együttes alkalmazásához, összeépítéséhez. Mindezt azonban úgy teszi, hogy nem hoz létre egységes nyelvet a metaadat-készletek között, hanem egynél több metaadat típust alkalmaz, így ugyanabban az „információcsomagban” (container) egyszerre használhatók a MARC, a DC, stb. és egyéb rekordok. Hiányosságának tartják azonban, hogy nem oldja meg az egyik metaadat halmazból a másikba történő átszerkesztés problémáját. Ezen kíván segíteni az Egyesült Királyság Könyvtári és Információs Hálózati Hivatalának DESIRE projektje, mely a metaadat-formátumokat három, különböző szinten lévő kategóriába sorolja, ahol a magasabb szintek magukba zárják a hierarchiában alacsonyabban állókat. A három szint:

1. Egyszerű, automatikusan előállított formátumok, amelyek nem struktúrált adatokat tartalmaznak. pl. a kereső szerverek saját formátumai, mint amilyen a Yahoo, ALTA Vista.

2. Szabványokra alapozott, struktúrált formátumok, amelyek már előre definiált adatcsoportokat tartalmaznak, mint pl. a DC, amelyek viszonylag átfogóan lehetővé teszik a felhasználók számára a forrás értékének meghatározását anélkül, hogy ténylegesen kapcsolatba lépnének vele.

3. Nemzetközi megegyezésen és szabványokon alapuló, igen komoly felkészültséget és szakértelmet kívánó ún. bő/gazdag/ komplex, vagyis részletező formátumok, mint a MARC, CIMI (Computer Interchange of Museum Information), amelyek nemcsak egy-egy dokumentum, hanem gyűjtemények dokumentálására is alkalmazhatók, miután szöveges és nem szöveges információk általános rögzítése és kódolása egyaránt feladatuk.

Az Apple Computer cég által kidolgozott Meta Content Framework (MCF) nemcsak a www tartalmi feltárását, hanem az ftp file-ok, a gopher, az adatbázisok, a destkop file-ok stb. tartalmi feltárását is célul tűzte ki. Egy olyan szitaxisból áll, amely XML (Extensible Markup Language) nyelven rendeli hozzá a dokumentumhoz a hozzá tartozó tulajdonságokat. Az összefüggés világosan érzékelhető: az említett cég szoros kapcsolatban áll a metaadatokkal is foglalkozó W3Consortiummal, akik viszont a HTML nyelv korlátainak megszüntetésére kidolgoztak egy szabványosított, újfajta jelölő nyelvet, az SGML (Standard Generalized Markup Language) egyszerűsített változatát, az XML-t. Ezt alkalmazta az Apple

2 http://mek.oszk.hu/dc/

4

Page 5: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

frameworkje. Nyilvánvalóan azért, hogy a Web fejlesztők szükség szerint maguk is definiálhassanak új címkéket (tag-eket).

Ugyancsak a W3C Konzorcium a kidolgozója és fejlesztője a Resource Description Framework (RDF) technológiának is, amely a Források Leírására Szolgáló Szerkezet, és amely a web alapú információforrások és dokumentumok különböző metadata szabványainak egységes kezelését tűzte ki céljául. Az RDF is egy adatmodellből és a web források metaadaataihoz szolgáló szintakszisból áll. Természetesen ez is XML nyelven.

A PICS (Platform for Internet Content Selection – Program az Internet Tartalmi Válogatásához) programjában ugyancsak a W3C ad segítséget a címkézéseknek az Internet tartalmához való hozzárendelésében.

A PICS-SE szabványtervezet a Warwick-féle tervezethez hasonlóan a különféle típusú metaadatok egységes, koherens rendszerben való kezelésében kíván segítséget nyújtani.

A DC-t alkalmazó NORDIC metaadat project már befejeződött. Sikeres alkalmazásának szemtanúi lehetünk az északi országok webes gyakorlatának tanulmányozásakor. A finn és dán weboldalakon már nemcsak az általuk kifejlesztett DC űrlapot alkalmazzák, hanem kialakítottak egy DC-MARC konvertáló programot is.

DC alapú az ausztrál METAWeb Project is, melynek fő célkitűzése az indexszolgáltatások, a felhasználói- és a metaadatok használatát segítő eszközök fejlesztése. E téren elöl járnak a Dublin Core metaadatokat tartalmazó, URL (Uniform Resource Locator) címeket kereső keresőgép használatával és egy olyan szoftwer kidolgozásával, amely 15 DC elem/címke közül hatot automatikusan generál és keret rekordot hoz létre. Bizonyos DC elemek részletesebb kiterjesztésével (amelyek a kutatási, felhasználási és fejlesztési jogokra stb. vonatkoznak) a múzeumi információk kölcsönös számítógépes cseréjére szakosodott a Computer Interchange of Museum Information (CIMI) project. Valamennyi projekt, szabvány azonban egyöntetűen megegyezik abban, hogy a metaadatnak

biztosítania kell az adott témához tartozó, rá vonatkozó, bármely típusú dokumentum, (a szakirodalom sokszor objektumot is említ) egyszerre, egy helyen történő megtalálhatóságát,

el kell különítenie a keresés folyamán fontos fogalmakat a mellékes fogalmaktól,

meg kell oldania a többjelentésű szavak, szinonimák és a nem egyértelmű kifejezések okozta nehézségeket is.

A már említett W3C-n és a Dublin Core-on kívül nem hagyhatjuk figyelmen kívül a nemzetközi szabványügyi szervezet, az ISO (International Standards Organization) tevékenységét. Jelenlegi szabványa az ISO 11179-es szabvány, amely az adatelemek specifikációját és szabványosítási kérdéseit taglalja.

5

Page 6: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

Ez 1jó kis összefoglalás, ezt érdemes kinyomtatni innentőlA metaadat szabványok leírására szolgáló legismertebb szabvány a „szabványok szabványa” az SGML (Standard Generalized Markup Language), amely elsősorban szövegszerű formában kódolható digitális objektumok rögzítésére használható. Ez utóbbi objektumok katalogizálásához kétféle típusú szabványokból válogathatunk: az SGML és a nem SGML alapúakból.

Az SGML alapúak: DOI (Digital Object Identifier): a web egyik legkellemetlenebb,

legnehezebben megszokható jelensége a dokumentumok gyakori helyváltoztatásából adódó nehézkes követési lehetőség. Ennek kiküszöbölése a dokumentum olyan azonosítása, amely a lelőhelytől függetlenül is képes azonosítani a forrást. A DOI ezt teszi: a weben publikált művek, elektronikus dokumentumok, számítógépes képek és hangfelvételek, valamint egyéb digitális állományok tulajdonságait azonosítja és azokat nyomon követi. Jelenleg még mindig fejlesztés alatt álló kódrendszer ez. (E törekvések képviselői a Handle rendszer és az URN (Uniform Resource Names) is.)

EAD (Encoded Archival Description): levéltári, múzeumi, kézirattári segédletek, mutatók leírására, illetve ezen közintézmények közötti adatcserére alkalmas rendszer

Dublini alap metaadatok: 15 elemből álló jelkészlet, amely a HTML formátumú web anyagok leírására szolgál és a file fejlécében elhelyezhető „meta” kódok használatát szabályozza. Az elemek három fő csoportba oszthatók: 1. tartalomra vonatkozó adatok (cím, szerző vagy létrehozó, tárgy és kulcsszavak, leírás, egyéb közreműködő, dátum, forrás, forrástípus, forrásazonosító, nyelv, az adott forrás kapcsolata más forrásokkal) 2. Intellektuális kapcsolatok (tulajdonos, alkotó, kiadó, jogok), 3. Megjelenéssel kapcsolatos adatok (dátum, típus, forma)

TEI (Text Encoding Initiative): nemzetközi project és szabványjavaslat az elektronikus dokumentumok szerkezetének leírására és gépek közötti átvitelére vonatkozóan

Nem SGML alapúak: MARC formátumok (Machine Readable Cataloging): az első olyan metaadat

szabvány, amely a számítógépes integrált könyvtári katalógusokba kerülő dokumentumok leírására készült. Ma már SGML alapú változata is van.

Z 39.50: az online adatbázisok és online katalógusok bibliográfiai információnak egységes lekérdezésére szolgáló, MARC alapokon kidolgozott, kliens-szerver módon működő rendszer

ANSI/NISO Z.39.56-199x: tetszőleges dokumentumhoz/médiumhoz kapcsolódó, sorozatban megjelent művek szabványos azonosítója

URC (Uniform Resource Characteristics): Az Interneten elérhető digitális objektumok azonosító rendszere 3

3 Pajor Enikő: A láthatatlan/mély web felhasználása a könyvtári tájékoztatásban (Doktori disszertáció). <http://szilleri.tvn.hu/disszertacio.pdf> [Letöltve: 2009. június 4.]

6

Page 7: 15. Digitális dokumentumok feltárásakor használt szabványok,megoldások

Képek digitalizálása (metaadat szabványok)Exif (Exchangable Image File )A kép készítésekor automatikusan rendelkezésre álló adatok rögzítésére szolgál. Így tartalmazza a gép gyártóját, típusát, a pontos dátumot és időpontot, a fényképezőgép szinte összes beállítását és még néhány a képre jellemző adatot (a záridőt, a fókusztávolságot, a fehér egyenes mértékét). Mindezen adatokon túl az Exif fejlécben megtalálható a kép kisméretű változata is, ami lehetővé teszi a kép megjelenítését a fényképezőgép monitorán anélkül, hogy a kártyáról a gép beolvasná a teljes állományt.Ezek az elsőre talán haszontalannak tűnő adatok a képek rendszerezésénél, feldolgozásánál lehetnek nagyon hasznosak. Míg a fájl dátuma már a kép elforgatásakor megváltozik, az Exif fejlécben tárolt készítési dátum a kép módosítása után is az eredeti időpontra mutat. Így mindig megkereshetők egy adott időszak képei, de ez lehetőséget biztosít a képek sorrendbe tételéhez, dátum szerinti átnevezéséhez is.A fényképezőgép beállításainak elmentése soha nem látott lehetőséget biztosít a tanulásra. Minden elkészült fotó tartalmazza ugyanis, hogy milyen gyújtótávolsággal, milyen blendével és milyen záridővel készült, így a képek utólagos elemzésénél megtanulható, hogy milyen szituációban mi vezet a megfelelő eredményhez és mi nem. Persze a fájlokba ennél sokkal több adat kerül.IPTC (International Pres Telecomunications Council)Az elnevezés nem helyes ugyan, de a köztudatban ezen a néven terjedt el a másik adattárolási szabvány. A név a rendszer egyik kidolgozójára utal, miközben maga a szabvány az IMM (Information Interchange Model) nevet viseli.Mint ahogy a létrehozó szervezet nevéből is következtetni lehet, ezeket az adatokat elsősorban a sajtófotósok és képügynökségek használják a képek rendszerezésére, katalogizálására. Az adatok között nem találhatók meg a fényképezőgép beállításai (hiszen azok az Exif fejlécben már szerepelnek), helyettük a következők adhatók meg a kép elkészítése után (a teljesség igénye nélkül):

A kép készítésének helye: város, állam, ország Adatbázis: objektum neve, kategória, kulcsszavak, stb. Készítő fotós neve Készítés dátuma Leírás és a leírás készítőjének neve Cím Speciális megjegyzések az ügynökségnek stb. 4

Képkatalogizáló programok: Google PicasaPicaJetACDSee Photo ManagerPhotoshop Elements

4 http://digiretus.hu/nyomtatas.php?link=dosszie07.html&tipus=dosszie&SORSZAM=59

7