Вісник Харківської державної академії культури (Jun 2024)
Можливості застосування технологій OCR від Google для розпізнавання та цифровізації архівних документів
Abstract
Стаття аналізує потенціал використання технологій оптичного розпізнавання символів (OCR) від Google для ефективної цифровізації архівних документів. Автор описує, як інтеграція Google Cloud Vision API може пришвидшити перетворення фізичних документів у цифровий формат, знижуючи вартість і підвищуючи доступність оцифрування для архівних установ різного масштабу. Також розглядаються переваги збільшення точності та якості оцифрованих даних, що сприяє їх подальшому науковому та освітньому використанню. Аналіз включає огляд потенційних технічних та організаційних проблем, які можуть виникати під час упровадження OCR-технологій, зокрема сумісність систем та вимоги до безпеки даних. Пропонується розробка вебзастосунку для кінцевих користувачів, який зробить передові можливості OCR доступнішими та зручнішими для використання. Метою дослідження є підвищення ефективності збереження інформації та забезпечення швидкого доступу до неї, зважаючи на актуальні потреби управління архівними ресурсами. Стаття також надає огляд останніх досліджень і публікацій, що демонструють ефективність Google OCR порівняно до інших продуктів і підкреслює можливості подальшого розвитку цих технологій для оптимізації процесів оцифрування в архівах.
Keywords