Vom Dokument zur Edition: Texte automatisiert erschließen und publizieren mit Transkribus und TEI-Publisher

Mit dem Medienwandel zeichnet sich auch im Bereich kritischer Editionen ein Paradigmenwechsel ab: Die Tendenz geht zur „digitalen Edition“, die entweder begleitend zur klassischen Print-Publikation eingesetzt wird oder diese als genuin digitales Produkt immer häufiger vollständig substituiert. Das Internet, sog. neue Medien sowie der verstärkte Einsatz von Informationstechnologie in den Geisteswissenschaften eröffnen dabei neue Möglichkeitsräume für Erfassung, Analyse und Visualisierung von Inhalten. Um diese Potenziale ausschöpfen und in nachhaltige Editionsprodukte umsetzen zu können, muss das „digitale Paradigma“ bei Konzeption und Realisierung konsequent mitgedacht werden. Dies erfordert u. a. ein grundlegendes Verständnis der involvierten Technologien und technischen Prozesse von der Erschließung des zu edierenden Gegenstands bis hin zu dessen Präsentation in ggf. multiplen Wiedergabeszenarien.

Dieser Workshop vermittelt einen Gesamtüberblick über eine mögliche technische Infrastruktur für die digitale Edition handschriftlicher Dokumente. Zunächst wird die Dokumenterschließung betrachtet, wobei ausgehend von Digitalisaten mit HTR-Verfahren unter Verwendung der Software „Transkribus“ automatisiert Transkriptionen erzeugt, annotiert und in XML/TEI-Daten exportiert werden. Im Anschluss werden Wiedergabeszenarien für die erschlossenen Daten konzipiert und mithilfe des Publikationsframeworks „TEI Publisher“ umgesetzt. Die Prozessschritte können dabei in praktischen Übungen an Beispieldaten nachvollzogen werden.

Dozent/inFabian Etling, Julian Helmchen
Anmeldung→ Online anmelden
RaumGarystraße 39 184
Beginn14.12.2022 | 09:00
Ende14.12.2022 | 13:00

Zielgruppe

  • Forschende und Lehrende der Freien Universität Berlin
  • Fokus auf Forschung an/mit Textdaten, insb. Textedition

Voraussetzungen

Inhaltliche Voraussetzungen:

  • Grundkenntnisse in XML bzw. TEI sind von Vorteil, aber nicht erforderlich

Technische Voraussetzungen:

Inhalt

  • Handschriftenerkennung: Layout-Analyse, Transkription, Machine Learning/Model Training
  • Handschrifterschließung: Strukturerkennung, Tagging, Datei- und Datenexport 
  • Konzeption, Bearbeitung und Kontrolle von XML-Daten gemäß der Richtlinien der Text Encoding Initiative
  • Konfiguration des „TEI Publisher“ für die Wiedergabe von TEI-Daten entsprechend bestimmter Anforderungen


Lernziele

  • Sie lernen die Möglichkeiten der automatischen Handschriftenerkennung mit „Transkribus“ kennen
  • Sie sensibilisieren sich für die zentrale Rolle der Daten in Editionsvorhaben
  • Sie lernen mit dem „TEI Publisher“ ein Framework für die Wiedergabe XML-basierter Textdaten kennen
  • Sie bekommen ein Verständnis für die technische Architektur und die Prozessschritte XML-basierter Publikationsworkflows


Consulting & Support

Consulting
Vom CeDiS Consulting erhalten Sie individuelle Beratung und Unterstützung bei der Konzeption Ihrer digitalen Lehr- und Forschungsvorhaben. 
Kontakt: consulting@cedis.fu-berlin.de

Support
Der CeDiS Support beantwortet Ihre Nutzeranfragen zur Bedienung der folgenden zentralen Systeme der Freien Universität: Blackboard, CMS, FU-Wikis, FU-Blogs.
Kontakt: support@cedis.fu-berlin.de