View
31
Download
1
Category
Preview:
Citation preview
VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter
Information Retrieval
Georg VogelerZentrum für Informationsmodellierung
Universität Graz@GVogeler
http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at
Was Sie erwartet
1. Wie sehen die Digitalen Geisteswissenschaften das Problem der Archiverschließung?
2. Überblick über Stand der Diskussion „Suche“ und Konsequenzen für die Erschließung
3. Konkretisierung
Digital Geisteswissenschaften
Digitales und digitalisiertes Kulturerbe in seiner• menschlichen Aneignung,• geisteswissenschaftlichen Reflexion,• hermeneutischen Kontextualisierung,• informatischen Formalisierung,• technischen Realisierung und• statistischen Berechnung.
Konsequenzen der IT
Archiv-erschlies-
sung
technische Möglichkeiten
theoretische
Ansprüche
Benutzerkultur
Z.B. Informationsvisualisierung
• Word Clouds• Statistiken• geographische Karte• hierarchische Bäume• Netzwerke
• Oder kreativere Zugänge:
• Moretti: „Distant reading“
• Stan Ruecker: „Rich-prospect browsing“
Creative Archive
• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als
Einstiegspunkte
http://www.ligatus.org.uk/aae/
Creative Archive
• John Latham Archive (Velios 2011)– Brüder Karamazov (Mitya, Ivan and Alyosha) als
Einstiegspunkte• Bloodaxe (Schofield et al. 2015)– Erschließung als künstlerisch reflektiertes Ereignis:
Nachträge und Randbemerkungen werden von Automaten „nachgeschrieben“ (Ausstellung, Twitter)
http:
//bl
ooda
xe.n
cl.a
c.uk
/exp
lore
/#/s
hape
s
Benutzerkultur
• „Google-Suchschlitz“
Information Retrieval
• „Bag of Words“– incl. morphologische Normalisierung
• Gewichtung– von der Ähnlichkeit zwischen Such- und
Informationsraum bis zu externen Relevanzkriterien• „Semantische Suche“– Abbildung auf Konzepte
• „Topic Modeling“ (LDA) u.ä.– Statistische Muster
Benutzererwartungen
• „Google-Suchschlitz“:– Expansion der Suchbegriffe (Lemmatisierung,
semantische Expansion)– Gewichtung (Ranking)
IR und Geschichswissenschaft
• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)
IR und Geschichswissenschaft
• „Jede Suche wird geprägt vom Vorwissen, das der Suchende mitbringt, von der Kenntnis der entsprechenden Zusammenhänge und Fachbegriffe, von der Erfahrung und der Routine im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)
• Aber: „Although the building of contextual knowledge is time-consuming, requiring broad searches through vast amounts of archival material, it appears to be an essential part of the historical method.” (Duff / Johnson 2002)
Benutzerkultur: HistorikerInnen
• Iterative (lernende) Suchen
• „Archival Intelligence“ (Yakel / Torres 2003)
=> Kontexte!
Rhee
201
2
Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
Theoretische Ansprüche: Klassifikation
(Shi
rky
2005
)
Benutzerkultur undtechnische Möglichkeiten
• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.
Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
Benutzerkultur undtechnische Möglichkeiten
• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.
• Einschränkung von Suchergebnissen über Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.
Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.4. Hierarchie erleichtert die Suche.5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
Benutzerkultur undtechnische Möglichkeiten
• Digitale Aktenführung und Forscherdatenbanken bauen auf Verschlagwortung von Einzeldokumenten auf.
• Einschränkung von Suchergebnissen nach Kategorien („Facettierte Suche“) statt hierarchischer Zugang von oben nach unten.
• Graphendatenbanken als Abbildung von Assoziationen
Benutzen wir die Archivtektonik für das, was sie wirklich kann!
1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle
Einzelstückez.B. zur• Suchexpansion • Gewichtung
Benutzen wir die Archivtektonik für das, was sie wirklich kann
1. Der Bestand ist eine (mögliche) Aggregation.=> Die Bestandsbeschreibung gilt für alle Einzelstücke
2. Die Archivtektonik ist Kontext für ihre Bestandteile.=> Deklarieren wir ihre Beziehung klarer:z.B.• als Akteur• Kommunikationspartner• Aufgabenbereich
RiC-CM
RiC-
CM, S
. 93
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren
GDA Bayern
Behördenerschließung
GDA Bayern
ArchiverschließungGD
A Ba
yern
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren: Strukturierte Daten erhalten
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren: Strukturierte Daten erhalten
• Enteignungen und Rückerstattung in Stichwörtern:– „Juden Enteignung“– „Enteignung jüdischer Besitz“– „Enteignung jüdisches Eigentum“
„Enteignung Jüdischer Besitz“: DDB
„Enteignung Jüdischer Besitz“: Archivportal-D
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren: Strukturierte Daten erhalten
• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren: Strukturierte Daten erhalten
• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen
• Unterstützung der Exploration („erlernte Suche“):– Objekten, die keinen Rückerstattungsanspruch
geschaffen haben => Gestapo-Akten zur Auflösung jüdischer Gemeinden.
Z.B. Provenienzforschung
• Wiedergutmachungsverfahren: Strukturierte Daten erhalten
• Enteignungen und Rückerstattung in Stichwörtern:Höhere Gewichtung von Aggregationen
• Unterstützung der Exploration („erlernte Suche“):– Erläuterungen– Vernetzungen
NYPL: term explorer
http://archives.nypl.org/terms/ Suche nach „Shirley, William“
http://bigdiva.org/
Archivische Netze?
• Visuelle Notation für archivische Kontexte– Farben und Symbole für die Kontexte (Aktenbildner,
Zuständigkeiten, ...)?– Archivtektonik als Teilkreise oder Verknüpfung?– Größe der Kreise steht für Umfang der Bestände?
• Archiverschließung als Verknüpfung– Mehr Archiverschließung in knappen Aussagen, die sich leicht
auf „Subjekt Prädikat Objekt“-Strukturen abbilden lassen?• Experimente – mit Archivsoftwareherstellern?– mit Digitalen Geisteswissenschaftlern?
Es dankt
für Ihre Aufmerksamkeit ...
Georg Vogelergeorg.vogeler@uni-graz.at
http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at
Julian Holzapfl, Joachim Wild, Walter Jaroschka, Michael Wischnath, Alfred Straub für Ihre archivische Expertise
... und ...
Literatur
• Jefferson Bailey: Disrespect des fonds. Rethinking arrangement and description in born-digital archives, in: Archive Journal 3 , 2013 <http://www.archivejournal.net/issue/3/archives-remixed/disrespect-des-fonds-rethinking-arrangement-and-description-in-born-digital-archives>.
• Wendy M. Duff and Catherine A. Johnson: Accidentally Found on Purpose: Information-Seeking Behavior of Historians in Archives, in: The Library Quarterly: Information, Community, Policy, Vol. 72, No. 4 (Oct., 2002), pp. 472-496
• Peter Haber: digital.past. Geschichtswissenschaft im digitalen Zeitalter, München 2011.• ICA: Records in Contexts. A Conceptual Model for Archival Description, Consultation Draft v0.1, September 2016 <
http://www.ica.org/sites/default/files/RiC-CM-0.1.pdf>• Hea Lim Rhee: Modelling historians' information-seeking behaviour with an interdisciplinary and comparative approach, in:
Information Research 17,4 (2012), paper 544• Stan Ruecker / Milena Radzikowska / Stéfan Sinclair: Visual Interface Design for Digital Cultural Heritage. A Guide to Rich-
Prospect Browsing, Aldershot 2011.• Clay Shirky: Ontology is Overrated. Categories, Links, and Tags, in: O'Reilly ETech conference , 2005
<http://shirky.com/writings/ontology_overrated.html>.• Urban Stäheli: Archivnetzplan. Ein neues Findmittel für die Online-Suche in Archivbeständen, in: Informationswissenschaft:
Theorie, Methode und Praxis, [S.l.], v. 4, n. 1, may. 2016. <https://bop.unibe.ch/iw/article/view/2698/4019>• Athanasios Velios: Creative Archiving. A Case Study from the John Latham Archive, in: Journal of the Society of Archivists 32,2
(2011), S. 255-271.• Stefano Vitali: La ricerca archivistica sul web, in: Il web e gli studi storici, hg. v. Rolando Minui, Rom 2015 (Studi superiori), S.
61-106.• Mitchell Whitelaw: The Visible Archive: Mapping the National Archives of Australia Collection, 2009
http://infosthetics.com/archives/2009/09/the_visible_archive.html• Deborah A. Yakel u. Elizabeth Torres: AI: Archival Intelligence and User Expertise, in: American Archivist 44,1 (2003), S. 51-78.• Geoffrey Yeo: Contexts, Original Orders, and Item-Level Orientation. Responding Creatively to Users' Needs and
Technological Change, in: Journal of Archival Organization 12 (2014), S. 170-185.
Recommended