Diplomarbeit im Fach Naturwissenschaftliche Informatik
Konzeption eines verteilten Datenarchivierungssystems
Jan E. Hennig
Arbeitsgruppe Rechnernetze und Verteilte Systeme
Technische Fakultät
Universität Bielefeld
5. September 2003
Zusammenfassung
Als Ergebnis eines Vergleichs aktueller Archivierungssysteme ergibt sich, dass
keines den Spagat zwischen Spezialisierung bei gleichzeitiger Beibehaltung der
allgemeinen Anwendbarkeit beherrscht. Die wünschenswerten Funktionalitäten aus den
aktuellen Systemen werden im Rahmen dieser Arbeit als Anforderungen formal
spezifiziert. Daraufhin wird ein diese Anforderungen erfüllendes Programm
konzipiert und die daraus in der Arbeit entwickelte prototypische Implementation
"VDAS - Verteiltes Datenarchivierungssystem"
vorgestellt. Das Programm ist als verteiltes System ausgelegt.
Im Zuge der Konzeption werden verschiedene Probleme und deren Lösungen beschrieben.
Unter anderem wird ein Konzept für mit persistentem Speicher abgesicherte
Warteschlangen zur garantierten Zustellung von Nachrichten in einem unsicheren
Netzwerk und eine darauf basierende Erweiterung des Zwei-Phasen-Commit-Protokolls
als Robustes Commit-Protokoll zur Kontrolle von verteilten ACID-Transaktionen,
die ohne Protokollmehraufwand auskommt, vorgestellt.
Das entstandene Programm ist in der Lage, die Archivierungsaufgabe auch bei
Ausfall eines oder mehrerer Systemteile an fernen Standorten durchzuführen.
Den Benutzern wird die Arbeit durch Hilfsmittel wie Merkmalsextraktion und
Formatübersetzung erleichtert. Diese Funktionen lassen sich nachträglich durch
das Zufügen neuer Plugins erweitern und so geänderten Betriebsanforderungen
anpassen. Außerdem existiert eine umfangreiche gruppenbasierte Rechteverwaltung,
die von der Administration bedient werden kann und dafür sorgt, dass
Benutzer des Systems nur die Daten eingeben, finden und ausliefern können,
bei denen es ihnen erlaubt ist. Die Daten selbst lassen sich gruppieren und
in Kategorien einordnen. Es lassen sich auch frei definierte Metadaten den
Daten zuordnen.
Der vollständige Text
Der vollständige Text der Arbeit ist in zwei Formaten verfügbar:
PostScript:
unkomprimiert (12,55 MB),
komprimiert mit gzip (784 KB),
komprimiert mit bzip2 (636 KB)
PDF:
unkomprimiert (6,43 MB),
komprimiert mit gzip (902 KB),
komprimiert mit bzip2 (890 KB)
Die weiteren Daten, wie der Quellcode der prototypischen Implementation VDAS
und ein Abbild der der Arbeit beiliegenden CD-ROM im ISO9660-Format können bei
Bedarf angefordert werden. Schreiben Sie mir dazu eine entsprechende E-Mail.
Hintergrund
Meine Diplomarbeit habe ich im Jahr 2003 an der Technischen Fakultät der Universität Bielefeld im
Studiengang Naturwissenschaftliche Informatik (NWI) in der
Arbeitsgruppe Rechnernetze und Verteilte Systeme (AG RVS)
unter der Betreuung von Prof. Peter B. Ladkin, Ph. D. FBCS und I Made Wiryana erstellt.
Copyright © 2003 Jan E. Hennig.