Archeion (Dec 2021)

Transkribus im Archiv – Ein polnisch-deutsches Projekt zur Handschriftentexterkennung an historischen Dokumenten

  • Dirk Alvermann,
  • Paweł Gut

DOI
https://doi.org/10.4467/26581264ARC.21.006.14486
Journal volume & issue
Vol. 122
pp. 129 – 153

Abstract

Read online

Transkribus in the archives – a Polish-German project of reading historical documents Even 10 years ago, the idea that historical manuscripts, regardless of time of creation and origin, could be „read“ and searched using automated processes seemed unrealistic. However, thanks to modern machine learning methods and the use of artificial intelligence, it is now possible. Following the development of Transkribus platform (http://transkribus.eu/), a tool has become available that allows free open access to this technology. Handwriting recognition permits automatic conversion of large numbers of historical manuscripts into fully legible texts. This development will influence and change the work of archives over the next several years, especially with regard to how their collections are made accessible digitally. Using the example of a Polish-German cooperation project, the article presents the use of handwriting recognition technology in the context of an archival digitisation project and discusses the technical requirements, technological work input and results of using Transkribus in an archive. Transkribus w archiwum – polsko-niemiecki projekt odczytania dokumentów historycznych Jeszcze 10 lat temu pomysł, że rękopisy historyczne, niezależnie od czasu i pochodzenia, można „czytać” i przeszukiwać za pomocą zautomatyzowanych procesów, wydawał się nierealny. Dzięki nowoczesnym metodom uczenia się maszynowego i wykorzystaniu sztucznej inteligencji jest to obecnie możliwe. Wraz z rozwojem platformy Transkribus (http://transkribus.eu/) dostępne jest narzędzie, które pozwala na otwarty dostęp do tej technologii. Rozpoznawanie pisma ręcznego umożliwia automatyczną konwersję dużej liczby rękopisów historycznych na w pełni czytelne teksty. Ten rozwój wpłynie i zmieni pracę archiwów w perspektywie kilkunastu lat, zwłaszcza sposób cyfrowego udostępniania ich zbiorów. Na przykładzie polsko-niemieckiego projektu współpracy, w artykule przedstawiono wykorzystanie technologii rozpoznawania pisma ręcznego w kontekście projektu digitalizacji archiwalnej oraz omówiono wymagania techniczne, wkład prac technologicznych i rezultaty wykorzystania Transkribusa w archiwum.

Keywords