<article id="web_test_007" url="http://www.zfdg.de/sb001_020" />
1.
Einleitung

Für
die
kultur-
und
geisteswissenschaftliche
Forschung
relevante
Ressourcen
finden
sich
zu
großen
Teilen
in
den
Sammlungen
von
Museen
,
Archiven
,
Bibliotheken
,
Universitäten
und
außeruniversitären
Forschungseinrichtungen
.
Mit
der
Erweiterung
des
Anwendungsbereiches
der
Digital
Humanities
von
den
Sprachwissenschaften
[
1
]
hin
zu
einer
ganzheitlichen
Sicht
auf
die
Kultur-
und
Geisteswissenschaften
seit
den
1990ern
wurden
vermehrt
Methoden
,
Anwendungen
und
Standards
für
die
Digitalisierung
,
Analyse
und
Beschreibung
von
Ressourcen
geschaffen
.
[
2
]
Die
Menge
der
heute
durch
öffentliche
Netzwerke
verfügbaren
und
für
die
kultur-
und
geisteswissenschaftliche
Forschung
relevanten
Kollektionen
steigt
nicht
zuletzt
aufgrund
der
Verwendung
von
Zugriffs-
und
Beschreibungsstandards
stetig
an
und
bietet
Forscherinnen
und
Forschern
einen
potenziellen
Zugang
zu
einer
Vielzahl
heterogener
Ressourcen
.

In
diesem
Beitrag
stellen
wir
eine
neuartige
Föderationsarchitektur
vor
,
die
auf
eine
Erfassung
und
fallbasierte
Zusammenführung
von
Forschungsdaten
nach
den
individuellen
Bedürfnissen
von
Forschungsprojekten
abzielt
.
Digitale
Sammlungen
werden
zentral
verzeichnet
,
zur
Vermeidung
von
Informationsverlusten
jedoch
nicht
harmonisiert
,
sondern
in
Form
von
Beziehungen
auf
Schemaebene
assoziiert
,
wodurch
die
Verwendung
einer
dynamisch
föderierten
Datenbasis
in
breiten
und
interdisziplinären
,
wie
auch
in
fachspezifischen
Anwendungskontexten
ermöglicht
werden
kann
.
[
3
]
Ein
übergeordnetes
Ziel
besteht
insbesondere
in
der
Nutzbarmachung
des
durch
Experten
hinterlegten
Wissens
zu
Kollektionen
und
Daten
sowie
deren
Beziehungen
für
einen
weiten
Anwenderkreis
.

2.
Anwendungskontext

Traditionelle
Integrationsansätze
folgen
häufig
dem
Muster
eines
physisch
harmonisierten
Datenbestands
auf
Basis
eines
zentralen
Schemas
.
[
4
]
Verteilte
und
heterogene
,
semi-strukturierte
Daten
werden
hierbei
in
ein
gemeinsames
Schema
übersetzt
und
stehen
für
eine
einfache
Weiterverarbeitung
in
integrierter
Form
zur
Verfügung
.
Eine
zentrale
Aufgabe
dieses
Ansatzes
besteht
in
der
Umsetzung
eines
hinsichtlich
der
notwendigen
Granularität
geeigneten
Integrationsschemas
.
In
Bezug
auf
die
Digital
Humanities
als
ganzheitliche
Anwendungsdomäne
,
die
sich
in
Form
spezifischer
,
interdisziplinärer
und
auch
übergreifender
Informationsbedürfnisse
äußert
,
führt
die
Integration
aller
Disziplinen
und
Perspektiven
jedoch
entweder
zu
Schemata
kaum
verwaltbarer
Komplexität
oder
–
bei
der
Verwendung
eines
einfachen
Modells
,
wie
z.
B.
Dublin
Core
(
DCES
)
–
zum
Verlust
großer
Anteile
disziplinspezifischer
Information
.

Für
die
Konzeption
der
in
DARIAH-DE
umgesetzten
Föderationsarchitektur
werden
im
Folgenden
zwei
Anwendungsfälle
vorgestellt
,
deren
unterschiedliche
Anforderungen
die
Einschränkungen
eines
solchen
zentralistischen
Integrationsansatzes
verdeutlichen
.

2.1
Generische
Suche

Mit
der
generischen
Suche
verfolgt
DARIAH-DE
das
Ziel
,
eine
übergreifende
Suchmöglichkeit
zu
schaffen
,
welche
die
Eigenschaften
der
Breiten-
und
Tiefensuche
so
vereint
,
dass
eine
dynamische
Anpassung
der
Suche
–
z.
B.
im
Hinblick
auf
eine
mögliche
Facettierung
–
erreicht
werden
kann
.
[
5
]
Die
übergreifende
Suche
in
eng
assoziierten
Datenquellen
erlaubt
–
unter
Anwendung
der
in
der
DARIAH-DE
Crosswalk
Registry
definierten
Assoziationen
und
Transformationsregeln
–
eine
detaillierte
Auseinandersetzung
mit
den
betrachteten
Daten
(
Tiefensuche
)
.
Mit
einer
wachsenden
Zahl
einbezogener
Kollektionen
wird
die
Granularität
der
Betrachtung
und
Facettierung
ggf.
mangels
vorhandener
Verbindungen
reduziert
und
nimmt
die
Form
einer
Breitensuche
ein
.
Für
die
dynamische
Funktionalität
der
generischen
Suche
ist
die
ad-hoc-Integration
ausgewählter
Kollektionen
basierend
auf
den
für
eine
konkrete
Anfrage
relevanten
Kollektionen
und
den
zwischen
diesen
vorliegenden
Assoziationen
erforderlich
,
um
die
jeweils
zur
Verfügung
stehende
Granularität
von
Daten
nutzen
zu
können
.

2.2
Datenintegration

Im
Gegensatz
zu
der
dynamischen
,
strukturellen
Adaption
der
generischen
Suche
an
die
Zusammensetzung
der
für
eine
Anfrage
ausgewählten
Kollektionen
zielen
Lösungen
der
Datenintegration
oftmals
auf
eine
Konsolidierung
einer
a-priori
definierten
Auswahl
von
Datenquellen
ab
.
[
6
]
Anforderungen
an
eine
kollektionsübergreifende
Integration
sind
wesentlich
von
der
verfolgten
Forschungsfrage
abhängig
und
können
z.
B.
im
Kontext
der
Ablösung
von
Systemen
durch
Neuentwicklungen
,
aber
auch
für
die
Ausweitung
der
Datenbasis
einer
bestehenden
Analyse-
und
Visualisierungslösung
,
wie
beispielsweise
dem
DARIAH-DE
Geobrowser
[
7
]
,
auftreten
.
Die
Anwendung
eines
zentralen
Integrationsschemas
bzw.
einer
zentralen
Ontologie
führt
im
Fall
der
Datenintegration
im
Gesamtkontext
der
Digital
Humanities
zu
Problemen
,
insbesondere
wenn
eine
spezifische
Auswahl
von
Kollektionen
für
konkrete
Forschungsfragen
zusammengefasst
werden
soll
.
Werden
so
beispielsweise
Kollektionen
aus
archäologischen
und
kunsthistorischen
Kontexten
integriert
,
so
führt
die
direkte
Integration
der
spezifischen
Datenstrukturen
zu
einem
erhöhten
Informationsgehalt
gegenüber
einer
globalen
Struktur
,
die
den
Fachspezifika
nicht
gerecht
werden
kann
.

3.
Föderationsarchitektur

Die
in
DARIAH-DE
gewählte
Architektur
(
Abbildung
1
)
besteht
aus
der
Collection
Registry
zur
Verzeichnung
von
Kollektionen
,
der
Schema
Registry
zur
Verwaltung
von
Schemata
,
und
der
Crosswalk
Registry
zur
Beschreibung
von
Assoziationen
zwischen
verschiedenen
Schemata
.
Integrative
Dienste
wie
die
generische
Suche
setzen
für
die
Interpretation
und
Verarbeitung
von
Daten
der
verzeichneten
Kollektionen
auf
den
durch
die
Registries
angebotenen
Webservices
auf
.

Abb.
1
:
Komponenten
und
Zusammenwirken
der
Föderationsarchitektur
[
eigene
Darstellung
]
.

Für
eine
Forscherin
oder
einen
Forscher
,
die
oder
der
eine
Sammlung
im
Rahmen
der
Förderationsarchitektur
registrieren
und
damit
für
die
Suche
,
Analyse
und
den
Vergleich
mit
anderen
Sammlungen
zur
Verfügung
stellen
möchte
,
ergibt
sich
im
Zusammenspiel
mit
der
generischen
Suche
ein
Ablauf
in
vier
Schritten
(
Abbildung
2
)
:
