Volltexterschließung
Im Rahmen der Volltexterschließung wird der im Digitalisat enthaltene Text automatisiert erkannt und in eine maschinenlesbare Form überführt. Zusätzlich können enthaltene Strukturelemente wie Absätze, Überschriften oder Hervorhebungen identifiziert und abgebildet werden. Neben dem reinen Text werden auch Informationen zur inneren Struktur des Dokuments erfasst – Gliederung, Überschriften, Absätze – und die Kennzeichnung typografischer Hervorhebungen – Kursivierung oder Unterstreichungen.
Vorteile
- Schnelle inhaltliche Erschließung
Volltexte können, z. B. nach Stichwörtern, Personen oder Orten durchsucht werden – ohne manuelles Durchblättern von Digitalisaten oder gedruckten Quellen. - Datengewinnung für Forschungsprojekte
Textdaten können extrahiert, gefiltert und für weitere Analysen aufbereitet werden, z. B. für Visualisierungen, Netzwerkanalysen oder Annotationen. - Archivierung und Langzeitnutzung
Die digitale Form erlaubt eine nachhaltige Sicherung und Wiederverwendbarkeit von Textquellen unabhängig von Originalformaten. - Grundlage für digitale Editionen
Strukturiert erfasste Texte können als Basis für Editions- oder Erschließungsvorhaben verwendet werden. - Integration in Repositorien oder Plattformen
Erschlossene Texte können in bestehende digitale Infrastrukturen eingebunden werden, z. B. für Open-Access-Zugänge oder fachspezifische Datenbanken. - Barrierefreiheit
Digital aufbereitete Inhalte ermöglichen, z. B. Text-to-Speech, wodurch Menschen mit Sehbehinderung einfacher auf Inhalte zugreifen können.