Werkzeuge Digital Humanities & Forschungsdaten

Transkribus

Transkribus ist eine Cloud-Infrastruktur für die Transkription, Texterkennung und das Durchsuchen historischer Dokumente. Die Texterkennung mittels künstlicher Intelligenz erlaubt sowohl die Bearbeitung von Drucken als auch Handschriften. Durch wiederholtes Trainieren der Software mittels manueller Korrekturgänge können die Ergebnisse der Texterkennung stetig verbessert werden.

Die Software kann unentgeltlich für Transkriptionsarbeiten genutzt werden, die Texterkennung ist allerdings nur über den Kauf sogenannter Credits einsetzbar. Betrieben wird die Transkribus-Infrastruktur von der READ-COOP, einer europäischen Genossenschaft, die eigens zu diesem Zweck gegründet wurde und der zahlreiche internationale Foschungseinrichtungen und Kulturinstitutionen angehören. Seit 2020 ist die CAU auf Betrieben der Universitätsbibliothek Mitglied der READ-COOP und ist somit direkt an der Fortentwicklung dieser Zukunftstechnik beteiligt, außerdem können für den Einsatz in Forschung und Lehre Mitgliedsvorteile genutzt werden. Sprechen Sie uns gerne an, falls Sie den Einsatz von Transkribus planen.

Oxygen XML Editor

Der Oxygen XML Editor ermöglicht das Eingeben, Editieren und Transformieren von strukturierten Daten in der eXtensible Markup Language (XML).

Im Kontext geisteswissenschaftlicher Projekte hat dieser Editor weite Verbreitung gefunden, da mit ihm relativ einfach Eingabemasken, Schemata und Transformationspipelines entwickelt werden können. Über eine Schnittstelle lässt er sich leicht an die XML-Datenbank eXist anbinden. Für größere Anwendungsfälle lassen sich so Frameworks erstellen, die als Forschungsumgebung fungieren können. Beispiele sind ediarum für den Bereich Digitaler Editionen bzw. ediarum.mediaevum für die Edition mittelalterlicher Handschriften.

Da es sich um ein kommerzielles Produkt handelt, muss für die Nutzung eine Lizenz erworben werden (vergünstigte academic-licences werden angeboten). Im Kontext des Digital Learning Lab der UB Kiel steht ein "Klassensatz" an Lizenzen für den Einsatz in Lehrveranstaltungen zu Verfügung.

Datenbanksysteme

Die strukturierte digitale Erfassung von Forschungsdaten und damit verbundene Analyseemöglichkeiten sind essentieller Teil digitaler geisteswissenschaftlicher Forschung. Je nach Anwendungsfall und Projektkontext bieten sich unterschiedliche Datenbanklösungen an. Häufig genutzte Datenbanken in den Digital Humanities sind dokumentenorientierte Datenbanken (bspw. eXist-db, CouchDB oder MongoDB) sowie Graphdatenbanken wie Neo4j. Gerne suchen wir mit Ihnen gemeinsam die passende Lösung.