Navigation

Technische Grundlagen

Textinhalte

Die Inhalte der digitalen Edition liegen im XML-Format vor. Nach dem Single-Source-Prinzip werden aus diesen Daten die verschiedenen Präsentationsformen erzeugt. Die Struktur der XML-Dateien ist in DTD-Dateien bzw. in XML-Schemata festgelegt. Das Datenmodell dazu wurde eigens für die Bedürfnisse dieser Edition entworfen. Es ist an den Standard der Text Encoding Initiative (TEI) angelehnt. Für die Erstellung und Bearbeitung der XML-Dateien werden XML-Editoren eingesetzt (Oxygen XML Editor, EditiX, Altova XMLSpy).

Pro Brief liegt eine XML-Datei vor, die den Inhalt des Briefs mit den entsprechenden Auszeichnungen enthält. Zusätzlich gibt es für jeden Brief eine XML-Datei, die die Koordinaten der Zeilen auf den Digitalisaten speichert. Ebenfalls als XML-Datei liegen die Überblickskommentare, die Personendateien, die Ortsdatei, die Chronologie, die Abkürzungsliste und die Bibliographie vor. Die bei der Auszeichnung verwendeten Elemente und Attribute sind in der Spezifikation zusammengestellt.

Die XML-Dateien sind in einer nativen XML-Datenbank hierarchisch abgelegt (eXist). Die Struktur der Daten wird in einem individuell konfigurierten Index festgehalten. Die übrigen Textinhalte werden über ein Content Management System in einer relationalen Datenbank verwaltet. In dieser Datenbank werden auch die Benutzerdaten gespeichert.

Grafikinhalte

Die Alfred Escher-Stiftung verfügt über Digitalisate aller Briefe, deren Lesbarkeit jene der entsprechenden Originale übertrifft. Diese Digitalisate wurden mit einer Auflösung von 300 dpi fotografiert und im TIFF-Format gespeichert. Die erste Seite jedes Briefes ist jeweils mit einem Massraster und einer Farbskala versehen.

Für die Präsentation in der digitalen Edition werden die Dateien in JPEG-Dateien umgewandelt. Um die Anzeige der Digitalisate zu beschleunigen, werden die JPEG-Dateien mit Deepzoom in mehrere kleinere Dateien zerlegt. Für die Text-Bild-Ansichten werden die JPEG-Dateien automatisch auf den Textspiegel zugeschnitten und wiederum als JPEG-Datei abgespeichert.

Die Zeilenerkennung in den Bilddateien für die Text-Bild-Ansichten erfolgt automatisch mit einem eigenentwickelten Programm. In einem ersten Schritt wandelt dieses Programm die Briefe mittels Otsu-Algorithmus in Schwarz-Weiss-Bilder um und erkennt die Zusammenhangskomponenten der Schrift. Darauf aufbauend erkennt ein Algorithmus die einzelnen Textzeilen und weist ihnen Koordinaten zu, die im XML-Format abgespeichert werden. Eine auf PHP und Javascript basierende graphische Oberfläche erlaubt es, Position und Reihenfolge der automatisch erkannten Zeilen manuell zu korrigieren.

Die JPEG-Dateien der Digitalisate befinden sich zusammen mit weiteren Grafikinhalten wie den Personenportraits auf dem Webserver.

Datenverarbeitung

Die Aufbereitung der XML-Dateien wird mittels X-Technologien vorgenommen. Wird von der Oberfläche eine Anfrage abgesetzt, werden die in der Datenbank befindlichen Inhalte mittels XQuery und XSL Transformationen aufbereitet. Die für die getätigte Anfrage relevanten Informationen werden so in die für die Oberfläche erforderliche Struktur umgewandelt.

Der XML-Stream aus der Datenbank wird von der Benutzeroberfläche in HTML-Inhalte umgewandelt. Dabei kommt das auf Python basierende Webseiten-Framework Django zum Einsatz. Für die Darstellung und die verschiedenen Funktionen wird Javascript verwendet. Die Präsentation der Digitalisate erfolgt mit OpenSeadragon.

Alle Inhalte der digitalen Edition verfügen über persistente URLs. Sämtliche Parameter können über die Adressleiste verändert werden. Dies ermöglicht sowohl den direkten Ansteuerung spezifischer Inhalte als auch eine einfache Möglichkeit der Referenzierung.

Schnittstellen

BEACON Gemeinsame Normdatei

Bei sämtlichen Personen wurde, wenn vorhanden, die Identifikationsnummer aus der Gemeinsamen Normdatei verlinkt. Unter https://www.briefedition.alfred-escher.ch/gnd/beacon-GND-AES.txt ist eine Datei downloadbar, in der alle verlinkten Nummern verzeichnet sind. Die Edition ist darauf ausgelegt, dass mit diesen Identifkationsnummern Personen über einen Permalink direkt aufgerufen werden können. Für Alfred Escher lautet der Link beispielsweise https://www.briefedition.alfred-escher.ch/gnd/118830295.

Correspondence Metadata Interchange

Das Briefverzeichnis ist unter https://www.briefedition.alfred-escher.ch/cmi/CMI-AES.xml im Correspondence Metadata Interchange-Format abrufbar. Dies ermöglicht das Einbinden des Briefverzeichnisses in das Suchportal correspSearch, das von der berlin-brandenburgischen Akademie der Wissenschaften betrieben wird.

Metagrid

Das Projekt Metagrid hat zum Ziel, Ressourcen zu Persönlichkeiten aus der Schweiz miteinander zu vernetzen. Sämtliche Personen, die in den Briefen von und an Alfred Escher erwähnt werden oder als Korrespondenzpartner auftreten, sind bei Metagrid erfasst. Die von Metagrid zur Verfügung gestellten Daten werden bei den jeweiligen Personen in der linken Spalte angezeigt.