Textdaten modellieren und kodieren – Einführung in XML und die Arbeit mit dem Oxygen XML Editor
Einführung in die Konzepte von und die Arbeit mit XML sowie in die Grundlagen der Dokument- und Textmodellierung mit Markup-Sprachen unter Zuhilfenahme des Oxygen XML Editors. |
Typ | Präsenzseminar |
---|---|
Dozent/in | Fabian Etling, Sandra Balck, Julian Helmchen |
Anmeldung | → Online anmelden |
Raum | CeDiS-Konferenz- und Schulungsraum K063, Garystr. 39 |
Beginn | 07.01.2025 | 10:00 |
Ende | 07.01.2025 | 14:00 |
Zielgruppe
Lehrende, Forschende, Mitarbeitende und Studierende der Freien Universität
Voraussetzungen
Technische Voraussetzungen:
- Eigener Laptop
- Einrichtung eines kostenlosen Transkribus-Accounts (https://www.transkribus.org/de)
- Optional: Installation vom Transkribus-Expert-Client (Download & Installationsanleitung: https://help.transkribus.org/de/herunterladen-und-installieren-von-transkribus-expert; für den Download ist es nötig, einen kostenlosen Account einzurichten.)
Vom Dokument zur Edition (Teil 2): Textdaten modellieren und kodieren – Einführung in XML und die Arbeit mit dem Oxygen XML Editor
Mit dem Medienwandel zeichnet sich auch im Bereich kritischer Editionen ein Paradigmenwechsel ab: Die Tendenz geht zur „digitalen Edition“, die entweder begleitend zur klassischen Print-Publikation eingesetzt wird oder diese als genuin digitales Produkt immer häufiger vollständig substituiert. Das Internet, sog. neue Medien sowie der verstärkte Einsatz von Informationstechnologie in den Geisteswissenschaften eröffnen dabei neue Möglichkeitsräume für Erfassung, Analyse und Visualisierung von Inhalten. Um diese Potenziale ausschöpfen und in nachhaltige Editionsprodukte umsetzen zu können, gilt es bei Konzeption und Realisierung konsequent einem „digitale Paradigma“ zu folgen. Dies erfordert u. a. ein grundlegendes Verständnis der involvierten Technologien und technischen Prozesse von der Erschließung des zu edierenden Gegenstands bis hin zu dessen Präsentation in ggf. multiplen Wiedergabeszenarien.
In den Digital Humanities ist XML ein bedeutender Standard für die Strukturierung und Annotation textueller Daten und als Datenformat essenziell, um Interoperabilität und Wiederverwendbarkeit zu gewährleisten. In dieser Veranstaltung werden Sie zunächst mit den grundlegenden Konzepten von Markup-Sprachen und anschließend mit XML als (Meta-)Markup-Sprache vertraut gemacht. Sie erhalten einen Überblick über die Struktur und die Bestandteile von XML-Dokumenten und lernen die Kriterien der Wohlgeformtheit und Validität kennen. Davon ausgehend werden Dokumenttyp-Definitionen und XML-Schemata behandelt, mit welchen sich spezifische Perspektiven auf Dokumente und Texte modellieren lassen. In den praktischen Anteilen der Veranstaltung können Sie die Arbeit mit XML-Dokumente und den Umgang mit dem Oxygen XML Editor üben.
Die Veranstaltung ist Teil der Reihe „Vom Dokument zur Edition“, die einen Gesamtüberblick über eine mögliche technische Infrastruktur für die digitale Edition handschriftlicher Dokumente vermittelt. Die Veranstaltungen bauen aufeinander auf, können aber auch als Einzelveranstaltung besucht werden.
Teil 1: Dokumente automatisiert transkribieren – Handschriftenerkennung mit Transkribus
Teil 4: Digitale Editionen publizieren – TEI-basierte Textpräsentation mit der TYPED-Infrastruktur
Inhalte
- Konzepte von "Markup-Sprachen"
- XML als (Meta-)Markup-Sprache
- XML-Komponenten
- Kriterium der "Wohlgeformtheit"
- Dokumenttyp-Definition, XML-Schemata und Kriterium der "Validität"
- Bearbeitung und Kontrolle von XML-Dokumenten mit dem Oxygen XML Editor
Lernziele
- Sie lernen grundlegende Konzepte von Markup-Sprachen kennen.
- Sie bekommen einen Überblick über den Aufbau und die Bestandteile von XML-Dokumenten.
- Sie üben die Erstellung, Be- und Verarbeitung von XML-Dokumenten mit dem Oxygen XML Editor.
- Sie lernen, bestimmte Perspektiven auf Dokumente und Texte in Modellen auszudrücken und diese für die Arbeit mit XML-Dokumenten zu nutzen.