20
BIK2001 / 5.4.2001 Frank Lützenkirchen / Dieter Nastoll Universität Essen Das MILESS Datenmodell einer Digitalen Bibliothek http://miless.uni-essen.de/

Frank Lützenkirchen / Dieter Nastoll Universität Essen

  • Upload
    tanner

  • View
    49

  • Download
    1

Embed Size (px)

DESCRIPTION

Das MILESS Datenmodell einer Digitalen Bibliothek. http://miless.uni-essen.de/. Frank Lützenkirchen / Dieter Nastoll Universität Essen. Hochschul- rechenzentrum. Universitäts- bibliothek. Fachbereiche (Physik, Linguistik, ... ). Medien- zentrum. MILESS: Projektbeteiligte. - PowerPoint PPT Presentation

Citation preview

Page 1: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Frank Lützenkirchen / Dieter Nastoll Universität Essen

Das MILESS Datenmodell einer Digitalen Bibliothek

http://miless.uni-essen.de/

Page 2: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Medien-zentrum

Universitäts-bibliothek

Fachbereiche(Physik,

Linguistik, ... )

Hochschul-rechenzentrum

MILESS: Projektbeteiligte

Page 3: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• oft mühsam auffindbar, verstreut in der Hochschule

Lehr- und Lernmaterial istvorhanden, aber Ziele des MILESS Projektes:

• Zentraler, einheitlicher Zugang für alle Fachbereiche, Suche und Navigation in einem homogenen System

MILESS: Intentionen und Ziele

• keine systematische Ordnung • Sachliche, systematische

Erschließung in bibliothekarischer Qualität, Integration der Bibliothek in den Dokumentenworkflow

Page 4: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• oft flüchtig, Verfügbarkeit nicht garantiert

Lehr- und Lernmaterial ist Ziele des MILESS Projektes:

• Archivierung und Sicherung, dauerhafte, zuverlässige Verfügbarkeit

MILESS: Intentionen und Ziele

• Pflege des Distributionssystems (Web-Server) aufwendig

• Zentrale Plattform zur Verteilung von Materialien

• Manipulationsgefahr, Urheberschutzprobleme • Manipulationssicherheit,

Digitale Signatur, Zugriffsschutz• Elektronische Dissertationen

Page 5: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Katalogsysteme:• Integration auf Metadatenebene, nur Nachweis (Link)• Keine Archivierung, keine Verfügbarkeitsgarantie

MILESS:• Dokumente werden im System selbst gehalten: Einheit von Metadaten und Inhalten• Verfügbarkeit der Inhalte kann garantiert werden

• Keine ungültigen Verweise • Grundlage für zuverlässigen Einsatz in Vorlesung, Vor- und Nachbereitung, zur Schaffung von Zitierfähigkeit

• Archivierung und Sicherung, Zugriffs- und Manipulationsschutz • Zusatzdienste werden ermöglicht, z. B. Suche im Volltext, nach Bildern (QBIC), ZIP-Generierung, ...

MILESS als „Digitale Bibliothek“

Page 6: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

MILESS Persistency Layer (Java-Klassenbibliothek):MILESS Daten-Objekte erzeugen, lesen, ändern, löschen, suchen

IBM Content Manager/EIP API (C, C++, ActiveX, Java)

MILESSData Model Package

(Java-Klassenbibliothek):Dokumente, Personen,

Derivate, ... Java Servlets: Inhaltesuchen, anzeigen, verwalten

Java Applets: Inhalte einbringen und bearbeiten

ServletCommunicator

HTML-Seiten:Suchmasken, Navigation,

Inhalte anzeigen

MILESS: Software-Komponenten

CM

WEB-SRV

BROWSER

Page 7: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

MILESS und Content Manager:Systemkomponenten

IBM Content Manager

Library Server: Metadaten

(Titel, Autor, ...)

VideoChargerServer:

Streaming von Audio/Video Daten

(MPEG, ...)

Text Search Server: Volltext-Suche(Textindizes)

TSM-Server: Langzeit-Archivierung

Object Server:Dateien

(PS, PDF, ...),zentral / dezentral

Web-Server

Java ServletEngine:MILESS

Server-Komponenten

Web-Browser

Java VM: AppletsMILESS

Autoren-GUI

IBM3494Tape

LibrarySystem

OPAC-System

HTTP

IBM DB2 / Oracle

HTML

XML

Page 8: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

MILESS: Hardware-Basis

Stand 17.8.1998 NA

RS/6000 SP

Ethernet

RS/6000 25T

Kontrollworkstations als HACWS-Cluster

RS

232

HACWS-Cluster

Eth

ernet

Uni FDDIBackbone

RS/6000 25T

Scalable POWERParallel Switch30 GB

RAID

30 GB

RAID

58,5 GB

SSA

36 GB

SSA

Festplattensysteme

SCSI

SSA

IBM 3494 Tape Library3494-C2A 3494-L10 3494-D12

Frame 3 Frame 2 Frame 1

34903490

3590 3590

3590 3590

Ca. 800Band-lager-fächer

MILESS

IBM CONTENTMANAGER

58,5 GB

SSA

Ethernet

BWIN34 Mbit/s

Page 9: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• MILESS Software ist in Java implementiert• MILESS Software selbst ist als Open Source verfügbar über

www.campussource.de (OpenSource-Börse am 1.4.2001 gestartet und vom Land NRW gefördert, Lehr- und Lernplattformen)

• Erste Nachnutzung an anderen Universitäten in DFG-Projekten• MILESS ist Prototyp für das Projekt Bach Digital mit digi-

talisierten Autographen und Tonbeispielen an der Uni Leipzig • DFG Projekt „Digitale Online Video-Bibliothek“ Essen - Jena

•Verteilte Digitale Bibliothek (Oberfläche, Objektverteilung)•Verbesserungen bei der Inhaltserschliessung und Segmentierung von digitalisiertem Video-Lehr-Material (insbes. Beispiele aus der Medizin)

MILESS

Page 10: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• Dokumentenmodell ist Umsetzung des Dublin Core Element Set:Creator, Publisher, Contributor, Title, Subject, Description, Source, Coverage, Rights, Type, Format, Date, Language

• Ergänzt um Modell für Personen / Körperschaftsdaten:Personen, Namensformen, Kontaktinformationen, ...

• Ergänzt um Modell für Dokumenten-Derivate und DateienEin Dokument in verschiedenen Formaten (HTML, PS, PDF, ...)

• Metadatensatz ist abgestimmt auf / mit

• Flexibles Modell auch für multimediale Dokumente

MILESS Datenmodell

Deutsche Bibliothek:Dissertationen Online

Page 11: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Architektur MILESS Datenmodell

Classification

Category Document Role Legal Entity

Derivate

DerivatePart

Contact

Person Coorperation

Page 12: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Titel, Dokumententyp, Sprache, Medientyp, Datumswerte, ...

• Bis zu neun alternative Titel je Dokument, Sprache, Typ des Titels (main / alternative, translated), Länge beliebig, Volltextsuche im Titel• Angabe der Sprache(n) des Dokumentes anhand ISO 639-2 Liste• Mehrere Datumsangaben je Dokument: Datum der Erzeugung, der letzten Änderung, Gültigkeitszeitraum von / bis, Datum der Antragstellung zur Promotion, Datum der Prüfung (Dissertationen)

Page 13: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Autoren und Personendaten

• Personen- / Körperschaftsdaten• Unterstützung mehrerer Namensformen je Person, z. B. für verschiedene Schreibweisen, Nachname nach und vor der Heirat etc.• L/M/R-trunkierte Suche• Mehrere Kontakte (dienstl., privat)• Mehrere E-Mail- und Web- Adressen, Telefon, Telefax, Anschriften je Kontakt

Bis zu je 10 Autoren, Herausgeber, Beitragende

(Übersetzer, ...) je Dokument

Page 14: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• Freie Stichwörter / Schlagwörter• Unterstützung beliebiger hierarchischer Fachklassifikationen• Mehrfachzuordnung, parallele Verwendung mehrer Klassifikationen

Stichwörter, Klassifikationen

• Exakte Suche nach bestimmten Kategorien• Volltextsuche (Wörter, Phrasen) nach Kategorien und Stichwörtern

Page 15: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Stichwörter, Klassifikationen

• Klassifikations- bäume können in MILESS integriert werden• Navigation durch die Hierarchie, Suche in der Hierarchie

• Volltextsuche im Klassifikationssystem zum Auffinden von Kategorien ( z. B. PACS: ca. 2900 Kategorien )

Page 16: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Description, Source,Coverage, Rights

• Description: Beschreibung oder Zusammenfassung (Abstract)• Source: Hinweis auf Herkunft (Freitext, ISBN-Angabe etc.)• Coverage: Räumlicher / zeitlicher Bezug des Dokumentes• Rights: Rechtliche Vermerke, Lizenzbedingungen etc.

• Je bis zu 10 Angaben je Dokument, Länge beliebig• Freitext, URL (z. B. Verweis auf externe Zusammenfassung) oder andere Schemata, Sprache zu diesen Elementen erfaßbar• Volltextsuche in diesen Elementen

Page 17: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

• Verschiedenste Formate

Multimediales Material: Ziele in MILESS:

• Unterstützung beliebiger Dateiformate

MILESS: Intentionen und Ziele

• Audio / Videomaterialien: Große Datenmengen

• Skalierbarkeit des Systems: Spezielle Audio-/Videosoftware

• Audio / Videomaterialien: Intensive Nutzung bisher nicht verbreitet

• Einsatz direkt in der Vorlesung: geringe technische Hemmschwelle

Page 18: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Dokumente und Derivate

• Ein Dokument kann in mehreren Formaten (Derivate) vorliegen• Medientyp: Grobeinordnung, Formate: Genauere Angabe• Derivat kann in MILESS archiviert oder auch nur URL sein• Unterstützung beliebiger Dateiformate (erweiterbare Liste) • Beibehaltung der Verzeichnishierarchie des Derivates• Integrierter Verweis auf Plug-In-Sammlung, Anzeige Umfang• Generierung von zip-Archiven on the fly

Page 19: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Dokumente, Derivate, Dateien, Beschreibung der Formate

Dokument 4711„Nachweiss von atomarem Wasserstoff

Medientyp: Text

Derivat 12345 (derivat)Inhaltstyp: HTML-Dokument

Derivat 12346 (derivat)Inhaltstyp: PDF-Dokument

Derivat 12347 (derivat)Inhaltstyp: LaTeX-Dokument

DerivateParts:

- index.html HTML- images/abb1.gif GIF - images/abb2.jpg JPEG - kap1.html HTML

DerivateParts:

- wasserstoff.pdf PDF

DerivateParts:

- wasserstoff.tex LaTeX- images/abb1.eps EPS-Grafik - images/abb2.eps EPS-Grafik - layout.sty LaTeX Style

Page 20: Frank Lützenkirchen / Dieter Nastoll  Universität Essen

BIK2001 / 5.4.2001

Weitere Modellbereiche -zukünftige Entwicklungsschritte

• Modell zur Nutzer-, Rechte- Zugriffsverwaltung

• Workflows zur Bearbeitung von Dokumenten

• Digitale Signatur um Unverfälschtheit zu sichern

• integrierte Versionsverwaltung

• Strukturierte Dokumente: Buchmodell, Zeitschriftenmodell,..... interne Dokumentstrukturen : Kapitel, Absatz

• Beziehungen zwischen den Dokumenten : externe Aspekte