Startseite // Universität // Aktuelles // Topthema // 1,7 Millionen Schweizer Franken Projektförderung für das C²DH

1,7 Millionen Schweizer Franken Projektförderung für das C²DH

twitter linkedin facebook google+ email this page
Veröffentlicht am Donnerstag, den 08. Juni 2017

C²DH erhält Projektförderung für methodenreflektiertes Textmining von historischen Zeitungen.

Das Projekt mit dem Titel „Media Monitoring of the Past. Mining 200 years of historical newspapers“ hat das Ziel, digitalisierte Zeitungskorpora in der Schweiz, Luxemburg, Frankreich und Deutschland miteinander zu verknüpfen und neue Methoden für deren Auswertung zu entwickeln.

In dem durch den Schweizer Nationalfonds (SNF) über die nächsten drei Jahre mit 1,7 Millionen Schweizer Franken geförderten Projekt wird das Luxembourg Centre for Contemporary and Digital History (C²DH) mit dem DHLAB der École polytechnique fédérale de Lausanne (EPFL) und dem Institut für Computerlinguistik der Universität Zürich zusammenarbeiten. Zu den assoziierten Projektpartnern gehören neben der Luxemburger Nationalbibliothek auch die Schweizer Nationalbibliothek, Le Temps, Neue Zürcher Zeitung, schweizerische Archive sowie Forscher der Universität Lausanne. Auf Luxemburger Seite wird das Projekt von Dr. Marten Düring, Dr. Lars Wieneke und Prof. Dr. Andreas Fickers koordiniert in Zusammenarbeit mit Daniele Guido und Estelle Bunout.

Historische Zeitungen zählen zu den reichhaltigsten historischen Quellen und liegen bereits in großen Mengen digitalisiert vor. Trotzdem treten in der wissenschaftlichen Arbeit mit diesen Quellen eine Reihe von Problemen auf. Dazu gehören mangelnde Durchsuchbarkeit verursacht durch fehlerhafte Texterkennung und fehlende Metadaten, die relative Isolation der digitalisierten Zeitungen in den jeweiligen Archiven, schwer nachvollziehbare Suchfunktionen und unzureichende Benutzeroberflächen. Daneben bieten Fortschritte in der Textanalyse neue Möglichkeiten für die Erforschung von großen Textsammlungen.

Das Projekt wird für die Korrektur von Fehlern in der Texterkennung neue deep learning-Methoden entwickeln, an der verbesserten Identifizierung von Personennamen, Institutionen und Orten sowie an der Anreicherung von diesen Eigennamen mit Hilfe von externen Datenrepositorien arbeiten. Das C²DH wird für die Entwicklung einer Benutzeroberfläche verantwortlich sein, die neue Suchfunktionen integrieren und die kritische Auseinandersetzung mit dem Zeitungskorpus erleichtern wird. Dazu gehören etwa Informationen zur Provenienz der Daten, zur Qualität der automatisch generierten Annotationen aber auch Hinweise auf Lücken innerhalb des Bestandes.

Um eine hohe Relevanz des Projekts für die Geschichts- und die Geistes- und Sozialwissenschaften im Allgemeinen zu gewährleisten, wird das C²DH eine Reihe von Workshops koordinieren, die den direkten Austausch zwischen Nutzern und Entwicklern ermöglichen werden. Ein ebenfalls am C²DH angesiedeltes Forschungsprojekt wird sich mit Widerständen gegen die Idee einer europäischen Einigung im späten 19. und frühen 20. Jahrhundert befassen und damit für eine zusätzliche Verzahnung von Geschichtswissenschaft, Informatik und Design sorgen. Schließlich wird das Projekt auch in die universitäre Lehre eingebunden sein und Nachwuchs-Historikern die Gelegenheit bieten, sich mit automatisierten Verfahren für die Extraktion und Repräsentation von Informationen aus historischen Quellen auseinanderzusetzen.

Am Ende des Projekts werden neben wissenschaftlichen Publikationen auch die einzelnen Systeme für die Aufbereitung, Analyse und Speicherung als open source Code für die freie Nachnutzung und Weiterentwicklung zur Verfügung stehen.
Das Sinergia-Programm des Schweizer Nationalfonds (SNF) fördert ausschließlich interdisziplinäre Forschergruppen, die kollaborativ und mit Aussicht auf wegweisende Erkenntnisse forschen. Sinergia-Anträge sind förderungswürdig, wenn die gestellten Probleme nur durch die Kombination von Theorien und Methoden aus mehreren gleichgewichteten Disziplinen gelöst werden können und die jeweiligen Partner komplementäre Kompetenzen und Kenntnisse zur Verfügung stellen.