Semi-automatische Kollationierung verschiedensprachiger Fassungen eines Textes (COMUTE)
Projektlaufzeit: 2024 – 2027
Projektpartner:innen:
- Prof. Dr. Paul Molitor / Dr. Jörg Ritter, Institut für Informatik, Martin-Luther-Universität Halle-Wittenberg
- Dr. Brigitte Grote, CeDiS, Freie Universität Berlin
- Prof. Dr. Manfred Stede, Department für Linguistik, Universität Potsdam
- Prof. Dr. Frank Fischer, nstitut für Griechische und Lateinische Philologie, Freie Universität Berlin
Förderung: Deutsche Forschungsgemeinschaft (DFG), LIS, e-Research-Technologien (GEPRIS-Eintrag)
Projektwebseite: https://www.comute-project.de/
Projektbeschreibung
Ziel dieses interdisziplinären Projektvorhabens ist die Entwicklung algorithmischer Verfahren zur semiautomatischen Kollationierung verschiedensprachiger Fassungen eines Textes, die oftmals keine Übersetzungen im Sinne der wort- und sinngemäßen Übertragung aus einer Ausgangs- in eine Zielsprache sind. Als anwendungsbezogenes Forschungsvorhaben, welches unterschiedliche Lösungsansätze ergebnisoffen untersucht, ist es in der ersten Phase der Entwicklung von e-Research-Technologien verortet. Als Ergebnis sollen die Unterschiede / Abweichungen zwischen den nur bedingt parallelen Texten auf Abschnitts-, Satz-, Phrasen- und Wortebene durch die Verfahren identifiziert werden. Die errechneten Alignierungsdaten werden in standardisierten Formaten (JSON, XML) über eine Schnittstelle ausgeliefert. Der Fokus liegt in einem ersten Schritt auf dem Sprachpaar Deutsch-Englisch. Die entwickelte e-Research-Technologie soll in exemplarischen Anwendungskontexten aus dem Bereich der Digitalen Edition und der Literaturwissenschaft erprobt werden. Sie wird unter einer freien Lizenz zur Nachnutzung durch Dritte bereitgestellt.
CeDiS ist für die Erprobung und Anwendung entlang ausgewählter Einsatzszenarien im Kontext Digitaler Editionen verantwortlich, und setzt dieses u.a. in Kooperation mit dem an der FU angesiedelten Editionsvorhaben "Hannah Arendt. Kritische Gesamtausgabe" (https://www.arendteditionprojekt.de) um. Aufgaben sind u.a. die Untersuchung der Möglichkeiten der selektiven Auswertung und Visualisierung der (semi-)automatisch erzeugten Alignierungsdaten in der Einzeltext-Darstellung, und Ausarbeitung und Implementierung von Konzepten zur Nutzung der Alignierungsdaten in der Editionsarbeit.
Projektleitung (CeDiS):
Projektmitarbeitende (CeDiS):
- Sandra Balck (Projektstelle)
- Fabian Etling