Semi-automatische Kollationierung verschiedensprachiger Fassungen eines Textes (COMUTE)

Projektlaufzeit: 2024 – 2027

Projektpartner:innen:

  • Prof. Dr. Paul Molitor / Dr. Jörg Ritter, Institut für Informatik, Martin-Luther-Universität Halle-Wittenberg
  • Dr. Brigitte Grote, CeDiS, Freie Universität Berlin
  • Prof. Dr. Manfred Stede, Department für Linguistik, Universität Potsdam
  • Prof. Dr. Frank Fischer, nstitut für Griechische und Lateinische Philologie, Freie Universität Berlin

Förderung: Deutsche Forschungsgemeinschaft (DFG), LIS, e-Research-Technologien

Projektwebseite: tbd

Projektbeschreibung

Ziel dieses interdisziplinären Projektvorhabens ist die Entwicklung algorithmischer Verfahren zur semiautomatischen Kollationierung verschiedensprachiger Fassungen eines Textes, die oftmals keine Übersetzungen im Sinne der wort- und sinngemäßen Übertragung aus einer Ausgangs- in eine Zielsprache sind. Als anwendungsbezogenes Forschungsvorhaben, welches unterschiedliche Lösungsansätze ergebnisoffen untersucht, ist es in der ersten Phase der Entwicklung von e-Research-Technologien verortet. Als Ergebnis sollen die Unterschiede / Abweichungen zwischen den nur bedingt parallelen Texten auf Abschnitts-, Satz-, Phrasen- und Wortebene durch die Verfahren identifiziert werden. Die errechneten Alignierungsdaten werden in standardisierten Formaten (JSON, XML) über eine Schnittstelle ausgeliefert. Der Fokus liegt in einem ersten Schritt auf dem Sprachpaar Deutsch-Englisch. Die entwickelte e-Research-Technologie soll in exemplarischen Anwendungskontexten aus dem Bereich der Digitalen Edition und der Literaturwissenschaft erprobt werden. Sie wird unter einer freien Lizenz zur Nachnutzung durch Dritte bereitgestellt.

CeDiS ist für die Erprobung und Anwendung entlang ausgewählter Einsatzszenarien im Kontext Digitaler Editionen verantwortlich, und setzt dieses u.a. in Kooperation mit dem an der FU angesiedelten Editionsvorhaben "Hannah Arendt. Kritische Gesamtausgabe" (https://www.arendteditionprojekt.de) um. Aufgaben sind u.a. die Untersuchung der Möglichkeiten der selektiven Auswertung und Visualisierung der (semi-)automatisch erzeugten Alignierungsdaten in der Einzeltext-Darstellung, und Ausarbeitung und Implementierung von Konzepten zur Nutzung der Alignierungsdaten in der Editionsarbeit.

Projektleitung (CeDiS):

Projektmitarbeitende (CeDiS): 

Consulting & Support

Consulting
Vom CeDiS Consulting erhalten Sie individuelle Beratung und Unterstützung bei der Konzeption Ihrer digitalen Lehr- und Forschungsvorhaben. 
Kontakt: consulting@cedis.fu-berlin.de

Support
Der CeDiS Support beantwortet Ihre Nutzeranfragen zur Bedienung der folgenden zentralen Systeme der Freien Universität: Blackboard, CMS, FU-Wikis, FU-Blogs.
Kontakt: support@cedis.fu-berlin.de