Düzce Üniversitesi Bilim ve Teknoloji Dergisi (Dec 2022)
Bölütleme Kullanarak Doğal Görüntülerde Metin Tanıma
Abstract
OCR olarak da bilinen optik karakter tanıma, taranan görüntülerdeki bir kelimeyi ya da bir cümleyi tanımak için kullanılan bir yöntemdir. Uzun yıllara dayanan araştırmalarla geliştirilmiştir. Taranan görüntüler üzerindeki metni tespit etmede büyük başarı sağlamıştır. Ancak doğal görüntüler üzerinde istenilen sonucu vermemektedir. Bu nedenle, doğal görüntülerdeki metinleri tespit edebilmek için özel yaklaşımların geliştirilmesi gerekliliği doğmuştur. Bu çalışmada, doğal görüntüler üzerinde metin olan bölgeleri algılamak için Otsu ve maksimum kararlı ekstrem bölgeler (MSER) görüntü bölütleme yöntemleri kullanılmıştır. Görüntü bölütleme, bir görüntüyü daha iyi analiz edebilmek için görüntüyü anlamlı bölgelere ayırma işlemidir. Otsu modelinde görüntü için en uygun eşik değeri belirlenerek, görüntü bu eşik değerine göre ön plan ve arka plan olmak üzere iki sınıfa ayrılmaktadır. MSER yöntemi ise metin olmayan bölgeleri engelleyerek, metin olduğu düşünülen bölgeleri sınırlayıcı kutu içerisine almaktadır. Gerçekleştirilen çalışmada, Otsu metodu ve MSER yöntemi ile ICDAR 2013 veri setinden seçilen 20 doğal görüntü üzerinde metin olan bölgelerinin tespit edilmesi amaçlanmıştır. Doğal görüntü üzerinde bölütleme işlemleri yapıldıktan sonra görüntülere OCR uygulanarak doğal görüntüler üzerindeki metnin tespit edilmesi sağlanmış ve doğruluk oranları karşılaştırılmıştır.
Keywords